NLP 2024 ๋ด ์ปค๋ฆฌํ๋ผ
๋ชจ์ง ์ธ์ 6๋ช
(2๊ฐ ํ)
ํ๋ ์๊ฐ ๋งค์ฃผ ํ ์์ผ ์คํ 2์ - 4์
ํ๋ ๋ฐฉ๋ฒ ์ฃผ 1ํ ๋๋ฉด ์ ๊ธฐ ์ธ์
+ ํ๋ณ ๋ฏธํ
(๋๋ฉด ๊ถ์ฅ)
โข
์ธ์
์ฅ์๋ ์ถํ ๊ฒฐ์ ๋๋ฉฐ, ์ด์ ๊ธฐ์๋ ์ ์ด์์ ์งํํ์ต๋๋ค.
NLP๊ฐ ๋ฌด์์ธ๊ฐ์?
NLP(Natural Language Processing)์ ์ฐ๋ฆฌ๋ง๋ก ์์ฐ์ด ์ฒ๋ฆฌ๋ผ๊ณ ํ๋ฉฐ, ์ธ๊ฐ์ ์ธ์ด๋ฅผ ์ปดํจํฐ๊ฐ ์ดํดํ๊ณ ํ์ฉํ ์ ์๋๋ก ๋ง๋๋ ๊ธฐ์ ์
๋๋ค. ChatGPT์ ๋ฑ์ฅ ์ดํ ์ธ๊ณต์ง๋ฅ์ ๋ํ ๋์ค์ ๊ด์ฌ์ด ํญ๋ฐ์ ์ผ๋ก ์ฆ๊ฐํ๊ณ , ํนํ NLP์ ์ค์์ฑ์ด ์ ์ธ๊ณ์ ์ผ๋ก ๋๋๋์์ฃ . ์ต๊ทผ 2๋
๊ฐ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ์
์ ์์ด ๋ฑ์ฅํ๊ณ , ๊ด๋ จ ์ฐ๊ตฌ๋ ์ฐ์ผ ์์์ง๊ณ ์์ต๋๋ค. ์ด์ ๋ ์ด๋ฏธ์ง, ๋น๋์ค, ์์์ ๋น๋กฏํ ๋ค์ํ ๋ชจ๋ฌ๋ฆฌํฐ๋ก์ ํ์ฅ์ ๋ํ ์ฐ๊ตฌ๊ฐ ํ๋ฐํ ์ด๋ฃจ์ด์ง๋ ์ถ์ธ์ด์ง๋ง, ์ธ์ด ๋ชจ๋ธ์ ๋ํ ์ฐ๊ตฌ๋ ์ฌ์ ํ ์ฌ์ง์๊ณ ์ด๋ฃจ์ด์ง๊ณ ์์ต๋๋ค. ์ธ๊ฐ์ ์ฌ๊ณ ์ ์ํต์ ๋ชจ๋ ์ธ์ด๋ฅผ ๋งค๊ฐ๋ก ์ด๋ฃจ์ด์ง๋๋ค. ๊ฒฐ๊ตญ ์ธ๊ณต์ง๋ฅ ์ฐ๊ตฌ์ ์ข
์ฐฉ์ง๋ผ๊ณ ๋ถ๋ฆฌ๋ ์ธ๊ณต์ผ๋ฐ์ง๋ฅ(AGI)์ ๋๋ฌํ๊ธฐ ์ํด์๋ ์ธ์ด๋ฅผ ํตํด ์ธ๊ฐ๊ณผ AI๊ฐ ์ํตํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ฐ๊ตฌ๊ฐ ํ์์ ์
๋๋ค.
NLP ํ์์๋ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํตํด ์์ฐ์ด ์ฒ๋ฆฌ์ ๋ฐ์ ๊ณผ์ ์ ์ ๋ฐ์ ์ผ๋ก ๊ณต๋ถํ๊ณ , ๊ด๋ จ ๊ฐ๋
์ ๋ฐํ์ผ๋ก ํ๋ก์ ํธ๋ฅผ ์งํํฉ๋๋ค. AI ๋ฐ NLP์ ๋ํ ์ฌ์ ์ง์์ด ํ์ํ์ง๋ ์์ง๋ง, ์งง์ ๊ธฐ๊ฐ ์์ ํ๋ก์ ํธ๋ฅผ ์ํํด์ผ ํ๋ ๋งํผ ์ต์ํ์ ๊ฐ๋ฐ ๊ฒฝํ์ด ์๊ตฌ๋ ์ ์์ต๋๋ค.
`24๋
๋ฅ ๋ค์ด๋ธ ๋ด ๊ธฐ์ NLP ํ์ ์๋ ๋ชฉํ๋ฅผ ๊ฐ๊ณ ์์ต๋๋ค.
1.
NLP ์ ๋ฐ์ ๋ํ ๋ฐฐ๊ฒฝ์ง์์ ์๊ณ , ๊ธฐ์กด์ ์ฐ๊ตฌ๋ฅผ ๋ถ์ํ๋ ๋ฐฉ๋ฒ์ ์ตํ๊ธฐ
2.
๊ณผ์ ์ค์ฌ์ ์์ฐ์ด ์ฒ๋ฆฌ๋ฅผ ํ์ฉํ ๋ฅ๋ฌ๋ ํ๋ก์ ํธ๋ฅผ end-to-end๋ก ๊ฒฝํํ๊ธฐ
ย ๋ชจ์ง์ธ์๊ณผ ๋์์ด ์ด๋ป๊ฒ ๋๋์?
๋ชจ์ง ์ธ์์ 6๋ช
์ผ๋ก ์ต๋ ๋ ํ์ ๊ตฌ์ฑํ์ฌ ํ๋ํฉ๋๋ค. ์ธ๊ณต์ง๋ฅ๊ณผ ์์ฐ์ด์ฒ๋ฆฌ์ ๊ด์ฌ์ด ์๋ ๋ถ์ด๋ผ๋ฉด ๋๊ตฌ๋ ์ง์ํ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ฒฝํ์ด ์๋ค๋ฉด ๋์์ด ๋์ง๋ง, ๊ธฐ๋ณธ์ ์ธ ํ์ด์ฌ ์ฝ๋ฉ ๋ฅ๋ ฅ๋ง ์์ด๋ ์ถฉ๋ถํฉ๋๋ค. ํ์ํ ์ง์๊ณผ ๊ธฐ์ ์ daiv.์์ ํจ๊ป ๊ณต๋ถํ๋ฉด ๋ฉ๋๋ค ์ฝ 3๊ฐ์์ ์๊ฐ๋์ ์ง์คํด์ ํ์ตํ๊ณ ์ฑ์ฅ์ ํฅํ ์ด์ ๊ณผ ์์ง๋ง ์๋ค๋ฉด, ์ฃผ์ ํ์ง ๋ง๊ณ ๋์ ํ์ธ์! ๋จ, ์์ฐ์ด ์ฒ๋ฆฌ ๋ฟ๋ง ์๋๋ผ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์์๋ ๋
ผ๋ฌธ ์ฝ๊ธฐ๊ฐ ๋น ์ง ์ ์์ต๋๋ค. ์์ด์ ๋ํ ๊ฑฐ๋ถ๊ฐ๊ณผ ๋
ผ๋ฌธ์ ์ฝ๋ ๋ฐ ๋ถ๋ด์ด ์์ด์ผ ํฉ๋๋ค.
(Optional) ๋ฉด์ ์๋ด
์ง์ ์ธ์์ ๋ฐ๋ผ ๋ฉด์ ์ ์ฐจ๊ฐ ์ถ๊ฐ๋ ์ ์์ต๋๋ค.
์ผ์ 4์ 28์ผ ์ผ์์ผ ์คํ 4์-10์
ํ์ ์ผ๋์ผ ๋ฉด์ , ์จ๋ผ์ธ ZOOM ๋๋ ์ ํ
์์ ์์ ์๊ฐ ์ธ๋น ์ฝ 20๋ถ ์ดํ
4์ 27์ผ ์คํ 10์ ์ด์ ์ ๋ฉด์ ๋์์์๊ฒ ์๋ด ๋ฉ์ผ์ด ๋ฐ์ก๋ ์์ ์
๋๋ค.
๋ฉด์ ์์๋ ์ง์์์ ์์ฑํ ๋ด์ฉ๊ณผ ๊ณผ์ ์ ๋ํ ๊ฐ๋จํ ์ง๋ฌธ์ด ์ฃผ์ด์ง๋๋ค.
๊ธฐ์ ์ ์ธ ๋ด์ฉ์ ๋ํด์๋ ๋ฌป์ง ์์ผ๋, ๋ถ๋ด์์ด ์ฐธ์ฌํ์๋ฉด ๋ฉ๋๋ค!
์ฃผ์ฐจ๋ณ ๊ณํ
ํ๋ ๋ด์ฉ๊ณผ ์๊ฐ์ ์งํ ์ํฉ์ ๊ณ ๋ คํ์ฌ ๋ณ๊ฒฝ๋ ์๋ ์์ต๋๋ค.
์ ๊ธฐ์ธ์
์์๋ ๋ฆฌ๋ทฐํ ๋
ผ๋ฌธ์ ๋ฐํํ๊ณ , ๊ด๋ จ ๋ด์ฉ์ ๋ํ ๋
ผ์๋ฅผ ์งํํฉ๋๋ค.
์ฃผ์ฐจ | ํ๋ ๋ด์ฉ |
1์ฃผ์ฐจ | OT: ๋ฅ๋ฌ๋๊ณผ ์์ฐ์ด์ฒ๋ฆฌ ๊ฐ์ |
2์ฃผ์ฐจ | ์ธ์ฝ๋-๋์ฝ๋ ์ํคํ
์ฒ์ ์ดํ
์
๋ฉ์ปค๋์ฆ |
3์ฃผ์ฐจ | Language Models: GPT, BERT |
4์ฃผ์ฐจ | Large Language Models: PEFT, Prompt Engineering |
5์ฃผ์ฐจ | ํ๋ก์ ํธ: ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ |
6์ฃผ์ฐจ | ํ๋ก์ ํธ: ๋ชจ๋ธ ๊ตฌํ |
7์ฃผ์ฐจ | ํ๋ก์ ํธ: ๋ฐ๋ชจ ์ค๋น |
8์ฃผ์ฐจ | ํ๋ก์ ํธ: ๋ฐ๋ชจ ์ค๋น |
9์ฃผ์ฐจ | ํ๋ก์ ํธ: ๋ฆฌํ์ค |
์ฌ์ ๊ณผ์
์ ์
ํ์ ๊ณผ์
1. NLP ์ง์์ ์์ฑ (ํ์)
โข
์ธ๊ณต์ง๋ฅ ๋ถ์ผ์ ๊ด์ฌ์ ๊ฐ๊ฒ ๋ ๊ณ๊ธฐ, ํน๋ณํ ์์ฐ์ด์ฒ๋ฆฌ๋ฅผ ๊ณต๋ถํ๊ณ ์ถ์ ์ด์ ์ ๋ํด์ ๊ฐ๋จํ ๋ง์ํด์ฃผ์ธ์.
โข
AI ๊ด๋ จ ๊ฒฝํ์ด ์๋๋๋ผ๋, ๊ฐ๋ฐ ๋ฐ ํ ํ๋ก์ ํธ ๊ฒฝํ์ด ์๋ค๋ฉด ๊ณผ์ ์ ์ค์ฌ์ผ๋ก ์๊ฐํด์ฃผ์ธ์.
โข
NLP ๊ธฐ์ ์ ํ์ฉํ์ฌ ์ํํ๊ณ ์ถ์ ํ๋ก์ ํธ์ ๋ํด ์ค๋ช
ํด์ฃผ์ธ์.
2. Deep Learning ์ํฐํด ์ ๋ฆฌ (์ ํ)
์ธ๊ณต์ง๋ฅ๊ณ์ ์ํ์ด์ Yann Lecun, Yoshua Bengio, Geoffrey Hinton์ด ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ์ ๋ฐ์ ์๊ฐํ ๋ด์ฉ์ ๋ด์ ๋ค์ด์ฒ์ง์ ๊ฒ์ฌํ ๊ธ์
๋๋ค. ์ธ๊ณต์ง๋ฅ ๋ถ์ผ๋ฅผ ๊ณต๋ถํ๋ค๋ณด๋ฉด, ๋
ผ๋ฌธ์ ์ฝ์ ์ผ์ด ์ ๋ง ๋ง์ต๋๋ค. ์ด ๊ธ์ ์
๋ฌธ์์๊ฒ ์ด ๋ถ์ผ์ ๋ํ ์ ๋ฐ์ ์ธ ์ง์์ ์ ๊ณตํ ๋ฟ๋ง ์๋๋ผ, ๋
ผ๋ฌธ ์ฝ๊ธฐ์ ๋ํ ๋ฌธํฑ์ ๋ฎ์ถ๋ ๋ฐ๋ ๋ง์ ๋์์ด ๋ฉ๋๋ค.
โข
๋
ผ๋ฌธ์์ โ๋์
๋ถ, Supervised Learning, Distributed representations and language processing, Recurrent neural networks, The future of deep learningโ (์ฝ 3์ฅ ๋ถ๋) ๋ถ๋ถ์ ์ฝ๊ณ , ์ดํดํ ๋ด์ฉ์ ์ ๋ฆฌํด์ฃผ์ธ์.
โข
๋ด์ฉ์ ๋ฒ์ญํ๊ธฐ๋ณด๋ค๋ ๋ฅ๋ฌ๋์ ๋ฐ์ ๊ณผ์ ์ ๋ํ ๋ณธ์ธ์ ํด์์ ๋ด์์ฃผ์ธ์. ํ์๊ณผ ๋ถ๋์ ์์ ์
๋๋ค. ํ
ํ๋ฆฟ ๋ณต์ ํ์ฉ ์ํ๋ก ๊ฐ์ธ ๋
ธ์
์ ์์ฑ ํ ๋งํฌ๋ฅผ ๊ณต์ ํฉ๋๋ค.
๊ณผ์ ๋ฅผ ์์ฑํ ํ ๋
ธ์
๋งํฌ๋ฅผ ๊ตฌ๊ธํผ์ ์ฒจ๋ถํด์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.