Search
Duplicate

Natural Language Processing

๋ฉ˜ํ† 
๊ณผ์ œ ๋ฐ ๋ฉด์ ‘
๊ณผ์ œ O | ๋ฉด์ ‘ O
์„ธ์…˜ ์‹œ๊ฐ„
์„ธ์…˜ ์‹œ๊ฐ„ ํ† ์š”์ผ ์˜คํ›„ 2์‹œ - 4์‹œ
๋ชจ์ง‘ ์ธ์›
๋ชจ์ง‘์ธ์› 6๋ช…

NLP 2024 ๋ด„ ์ปค๋ฆฌํ˜๋Ÿผ

๋ชจ์ง‘ ์ธ์› 6๋ช… (2๊ฐœ ํŒ€)
ํ™œ๋™ ์‹œ๊ฐ„ ๋งค์ฃผ ํ† ์š”์ผ ์˜คํ›„ 2์‹œ - 4์‹œ
ํ™œ๋™ ๋ฐฉ๋ฒ• ์ฃผ 1ํšŒ ๋Œ€๋ฉด ์ •๊ธฐ ์„ธ์…˜ + ํŒ€๋ณ„ ๋ฏธํŒ…(๋Œ€๋ฉด ๊ถŒ์žฅ)
โ€ข
์„ธ์…˜ ์žฅ์†Œ๋Š” ์ถ”ํ›„ ๊ฒฐ์ •๋˜๋ฉฐ, ์ด์ „ ๊ธฐ์ˆ˜๋Š” ์‹ ์ดŒ์—์„œ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

NLP๊ฐ€ ๋ฌด์—‡์ธ๊ฐ€์š”?

NLP(Natural Language Processing)์€ ์šฐ๋ฆฌ๋ง๋กœ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ผ๊ณ  ํ•˜๋ฉฐ, ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•˜๊ณ  ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“œ๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ChatGPT์˜ ๋“ฑ์žฅ ์ดํ›„ ์ธ๊ณต์ง€๋Šฅ์— ๋Œ€ํ•œ ๋Œ€์ค‘์˜ ๊ด€์‹ฌ์ด ํญ๋ฐœ์ ์œผ๋กœ ์ฆ๊ฐ€ํ–ˆ๊ณ , ํŠนํžˆ NLP์˜ ์ค‘์š”์„ฑ์ด ์ „ ์„ธ๊ณ„์ ์œผ๋กœ ๋Œ€๋‘๋˜์—ˆ์ฃ . ์ตœ๊ทผ 2๋…„๊ฐ„ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ์…€ ์ˆ˜ ์—†์ด ๋“ฑ์žฅํ–ˆ๊ณ , ๊ด€๋ จ ์—ฐ๊ตฌ๋Š” ์—ฐ์ผ ์Ÿ์•„์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด์ œ๋Š” ์ด๋ฏธ์ง€, ๋น„๋””์˜ค, ์˜์ƒ์„ ๋น„๋กฏํ•œ ๋‹ค์–‘ํ•œ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ๋กœ์˜ ํ™•์žฅ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๊ฐ€ ํ™œ๋ฐœํžˆ ์ด๋ฃจ์–ด์ง€๋Š” ์ถ”์„ธ์ด์ง€๋งŒ, ์–ธ์–ด ๋ชจ๋ธ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๋Š” ์—ฌ์ „ํžˆ ์‰ฌ์ง€์•Š๊ณ  ์ด๋ฃจ์–ด์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„์˜ ์‚ฌ๊ณ ์™€ ์†Œํ†ต์€ ๋ชจ๋‘ ์–ธ์–ด๋ฅผ ๋งค๊ฐœ๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์ธ๊ณต์ง€๋Šฅ ์—ฐ๊ตฌ์˜ ์ข…์ฐฉ์ง€๋ผ๊ณ  ๋ถˆ๋ฆฌ๋Š” ์ธ๊ณต์ผ๋ฐ˜์ง€๋Šฅ(AGI)์— ๋„๋‹ฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์–ธ์–ด๋ฅผ ํ†ตํ•ด ์ธ๊ฐ„๊ณผ AI๊ฐ€ ์†Œํ†ตํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๊ฐ€ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.
NLP ํŒ€์—์„œ๋Š” ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ†ตํ•ด ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ์ „๋ฐ˜์ ์œผ๋กœ ๊ณต๋ถ€ํ•˜๊ณ , ๊ด€๋ จ ๊ฐœ๋…์„ ๋ฐ”ํƒ•์œผ๋กœ ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. AI ๋ฐ NLP์— ๋Œ€ํ•œ ์‚ฌ์ „ ์ง€์‹์ด ํ•„์š”ํ•˜์ง€๋Š” ์•Š์ง€๋งŒ, ์งง์€ ๊ธฐ๊ฐ„ ์•ˆ์— ํ”„๋กœ์ ํŠธ๋ฅผ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋Š” ๋งŒํผ ์ตœ์†Œํ•œ์˜ ๊ฐœ๋ฐœ ๊ฒฝํ—˜์ด ์š”๊ตฌ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
`24๋…„ ๋”ฅ ๋‹ค์ด๋ธŒ ๋ด„ ๊ธฐ์ˆ˜ NLP ํŒ€์€ ์•„๋ž˜ ๋ชฉํ‘œ๋ฅผ ๊ฐ–๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
1.
NLP ์ „๋ฐ˜์— ๋Œ€ํ•œ ๋ฐฐ๊ฒฝ์ง€์‹์„ ์Œ“๊ณ , ๊ธฐ์กด์˜ ์—ฐ๊ตฌ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ตํžˆ๊ธฐ
2.
๊ณผ์ • ์ค‘์‹ฌ์˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ํ™œ์šฉํ•œ ๋”ฅ๋Ÿฌ๋‹ ํ”„๋กœ์ ํŠธ๋ฅผ end-to-end๋กœ ๊ฒฝํ—˜ํ•˜๊ธฐ

ย ๋ชจ์ง‘์ธ์›๊ณผ ๋Œ€์ƒ์ด ์–ด๋–ป๊ฒŒ ๋˜๋‚˜์š”?

๋ชจ์ง‘ ์ธ์›์€ 6๋ช…์œผ๋กœ ์ตœ๋Œ€ ๋‘ ํŒ€์„ ๊ตฌ์„ฑํ•˜์—ฌ ํ™œ๋™ํ•ฉ๋‹ˆ๋‹ค. ์ธ๊ณต์ง€๋Šฅ๊ณผ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ์— ๊ด€์‹ฌ์ด ์žˆ๋Š” ๋ถ„์ด๋ผ๋ฉด ๋ˆ„๊ตฌ๋‚˜ ์ง€์›ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ๊ฒฝํ—˜์ด ์žˆ๋‹ค๋ฉด ๋„์›€์ด ๋˜์ง€๋งŒ, ๊ธฐ๋ณธ์ ์ธ ํŒŒ์ด์ฌ ์ฝ”๋”ฉ ๋Šฅ๋ ฅ๋งŒ ์žˆ์–ด๋„ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ์ง€์‹๊ณผ ๊ธฐ์ˆ ์€ daiv.์—์„œ ํ•จ๊ป˜ ๊ณต๋ถ€ํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค ์•ฝ 3๊ฐœ์›”์˜ ์‹œ๊ฐ„๋™์•ˆ ์ง‘์ค‘ํ•ด์„œ ํ•™์Šตํ•˜๊ณ  ์„ฑ์žฅ์„ ํ–ฅํ•œ ์—ด์ •๊ณผ ์˜์ง€๋งŒ ์žˆ๋‹ค๋ฉด, ์ฃผ์ €ํ•˜์ง€ ๋ง๊ณ  ๋„์ „ํ•˜์„ธ์š”! ๋‹จ, ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์—์„œ๋Š” ๋…ผ๋ฌธ ์ฝ๊ธฐ๊ฐ€ ๋น ์งˆ ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์˜์–ด์— ๋Œ€ํ•œ ๊ฑฐ๋ถ€๊ฐ๊ณผ ๋…ผ๋ฌธ์„ ์ฝ๋Š” ๋ฐ ๋ถ€๋‹ด์ด ์—†์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
(Optional) ๋ฉด์ ‘ ์•ˆ๋‚ด
์ง€์› ์ธ์›์— ๋”ฐ๋ผ ๋ฉด์ ‘ ์ ˆ์ฐจ๊ฐ€ ์ถ”๊ฐ€๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์ผ์‹œ 4์›” 28์ผ ์ผ์š”์ผ ์˜คํ›„ 4์‹œ-10์‹œ
ํ˜•์‹ ์ผ๋Œ€์ผ ๋ฉด์ ‘, ์˜จ๋ผ์ธ ZOOM ๋˜๋Š” ์ „ํ™”
์˜ˆ์ƒ ์†Œ์š” ์‹œ๊ฐ„ ์ธ๋‹น ์•ฝ 20๋ถ„ ์ดํ•˜
4์›” 27์ผ ์˜คํ›„ 10์‹œ ์ด์ „์— ๋ฉด์ ‘ ๋Œ€์ƒ์ž์—๊ฒŒ ์•ˆ๋‚ด ๋ฉ”์ผ์ด ๋ฐœ์†ก๋  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.
๋ฉด์ ‘์—์„œ๋Š” ์ง€์›์„œ์— ์ž‘์„ฑํ•œ ๋‚ด์šฉ๊ณผ ๊ณผ์ œ์— ๋Œ€ํ•œ ๊ฐ„๋‹จํ•œ ์งˆ๋ฌธ์ด ์ฃผ์–ด์ง‘๋‹ˆ๋‹ค.
๊ธฐ์ˆ ์ ์ธ ๋‚ด์šฉ์— ๋Œ€ํ•ด์„œ๋Š” ๋ฌป์ง€ ์•Š์œผ๋‹ˆ, ๋ถ€๋‹ด์—†์ด ์ฐธ์—ฌํ•˜์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค!

์ฃผ์ฐจ๋ณ„ ๊ณ„ํš

ํ™œ๋™ ๋‚ด์šฉ๊ณผ ์‹œ๊ฐ„์€ ์ง„ํ–‰ ์ƒํ™ฉ์„ ๊ณ ๋ คํ•˜์—ฌ ๋ณ€๊ฒฝ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.
์ •๊ธฐ์„ธ์…˜์—์„œ๋Š” ๋ฆฌ๋ทฐํ•œ ๋…ผ๋ฌธ์„ ๋ฐœํ‘œํ•˜๊ณ , ๊ด€๋ จ ๋‚ด์šฉ์— ๋Œ€ํ•œ ๋…ผ์˜๋ฅผ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค.
์ฃผ์ฐจ
ํ™œ๋™ ๋‚ด์šฉ
1์ฃผ์ฐจ
OT: ๋”ฅ๋Ÿฌ๋‹๊ณผ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ ๊ฐœ์š”
2์ฃผ์ฐจ
์ธ์ฝ”๋”-๋””์ฝ”๋” ์•„ํ‚คํ…์ฒ˜์™€ ์–ดํ…์…˜ ๋ฉ”์ปค๋‹ˆ์ฆ˜
3์ฃผ์ฐจ
Language Models: GPT, BERT
4์ฃผ์ฐจ
Large Language Models: PEFT, Prompt Engineering
5์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ
6์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ชจ๋ธ ๊ตฌํ˜„
7์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ฐ๋ชจ ์ค€๋น„
8์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ฐ๋ชจ ์ค€๋น„
9์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ฆฌํ—ˆ์„ค

์‚ฌ์ „ ๊ณผ์ œ

์‹ ์ž… ํŒ€์› ๊ณผ์ œ
1. NLP ์ง€์›์„œ ์ž‘์„ฑ (ํ•„์ˆ˜)
โ€ข
์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์— ๊ด€์‹ฌ์„ ๊ฐ–๊ฒŒ ๋œ ๊ณ„๊ธฐ, ํŠน๋ณ„ํžˆ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ๋ฅผ ๊ณต๋ถ€ํ•˜๊ณ  ์‹ถ์€ ์ด์œ ์— ๋Œ€ํ•ด์„œ ๊ฐ„๋‹จํžˆ ๋ง์”€ํ•ด์ฃผ์„ธ์š”.
โ€ข
AI ๊ด€๋ จ ๊ฒฝํ—˜์ด ์•„๋‹ˆ๋”๋ผ๋„, ๊ฐœ๋ฐœ ๋ฐ ํŒ€ ํ”„๋กœ์ ํŠธ ๊ฒฝํ—˜์ด ์žˆ๋‹ค๋ฉด ๊ณผ์ •์„ ์ค‘์‹ฌ์œผ๋กœ ์†Œ๊ฐœํ•ด์ฃผ์„ธ์š”.
โ€ข
NLP ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์—ฌ ์ˆ˜ํ–‰ํ•˜๊ณ  ์‹ถ์€ ํ”„๋กœ์ ํŠธ์— ๋Œ€ํ•ด ์„ค๋ช…ํ•ด์ฃผ์„ธ์š”.
2. Deep Learning ์•„ํ‹ฐํด ์ •๋ฆฌ (์„ ํƒ)
์ธ๊ณต์ง€๋Šฅ๊ณ„์˜ ์„ํ•™์ด์‹  Yann Lecun, Yoshua Bengio, Geoffrey Hinton์ด ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋”ฅ๋Ÿฌ๋‹์˜ ์ „๋ฐ˜์„ ์†Œ๊ฐœํ•œ ๋‚ด์šฉ์„ ๋‹ด์•„ ๋„ค์ด์ฒ˜์ง€์— ๊ฒŒ์žฌํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ๋ฅผ ๊ณต๋ถ€ํ•˜๋‹ค๋ณด๋ฉด, ๋…ผ๋ฌธ์„ ์ฝ์„ ์ผ์ด ์ •๋ง ๋งŽ์Šต๋‹ˆ๋‹ค. ์ด ๊ธ€์€ ์ž…๋ฌธ์ž์—๊ฒŒ ์ด ๋ถ„์•ผ์— ๋Œ€ํ•œ ์ „๋ฐ˜์ ์ธ ์ง€์‹์„ ์ œ๊ณตํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๋…ผ๋ฌธ ์ฝ๊ธฐ์— ๋Œ€ํ•œ ๋ฌธํ„ฑ์„ ๋‚ฎ์ถ”๋Š” ๋ฐ๋„ ๋งŽ์€ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
โ€ข
๋…ผ๋ฌธ์—์„œ โ€œ๋„์ž…๋ถ€, Supervised Learning, Distributed representations and language processing, Recurrent neural networks, The future of deep learningโ€ (์•ฝ 3์žฅ ๋ถ„๋Ÿ‰) ๋ถ€๋ถ„์„ ์ฝ๊ณ , ์ดํ•ดํ•œ ๋‚ด์šฉ์„ ์ •๋ฆฌํ•ด์ฃผ์„ธ์š”.
โ€ข
๋‚ด์šฉ์„ ๋ฒˆ์—ญํ•˜๊ธฐ๋ณด๋‹ค๋Š” ๋”ฅ๋Ÿฌ๋‹์˜ ๋ฐœ์ „ ๊ณผ์ •์— ๋Œ€ํ•œ ๋ณธ์ธ์˜ ํ•ด์„์„ ๋‹ด์•„์ฃผ์„ธ์š”. ํ˜•์‹๊ณผ ๋ถ„๋Ÿ‰์€ ์ž์œ ์ž…๋‹ˆ๋‹ค. ํ…œํ”Œ๋ฆฟ ๋ณต์ œ ํ—ˆ์šฉ ์ƒํƒœ๋กœ ๊ฐœ์ธ ๋…ธ์…˜์— ์ž‘์„ฑ ํ›„ ๋งํฌ๋ฅผ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค.
๊ณผ์ œ๋ฅผ ์ž‘์„ฑํ•œ ํ›„ ๋…ธ์…˜ ๋งํฌ๋ฅผ ๊ตฌ๊ธ€ํผ์— ์ฒจ๋ถ€ํ•ด์ฃผ์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.