Search
๐Ÿ—จ๏ธ

Natural Language Processing

๋ฉ˜ํ† 
์„ธ์…˜ ์‹œ๊ฐ„
์„ธ์…˜ ์‹œ๊ฐ„ ํ† ์š”์ผ ์˜คํ›„ 2์‹œ - 5์‹œ (๋Œ€๋ฉด)
๋ชจ์ง‘ ์ธ์›
๋ชจ์ง‘ ์ธ์› 6๋ช… (2๊ฐœ ํŒ€)
๊ณผ์ œ ๋ฐ ๋ฉด์ ‘
๊ณผ์ œ O | ๋ฉด์ ‘ O

NLP 2024 ์—ฌ๋ฆ„ ์ปค๋ฆฌํ˜๋Ÿผ

๋ชจ์ง‘ ์ธ์› 6๋ช… (2๊ฐœ ํŒ€)
ํ™œ๋™ ์‹œ๊ฐ„ | ๋งค์ฃผ ํ† ์š”์ผ ์˜คํ›„ 2์‹œ - 5์‹œ
ํ™œ๋™ ๋ฐฉ๋ฒ• | ์ฃผ 1ํšŒ ๋Œ€๋ฉด ์ •๊ธฐ ์„ธ์…˜ + ํŒ€๋ณ„ ๋ฏธํŒ…(๋Œ€๋ฉด ๊ถŒ์žฅ)
โ€ข
์„ธ์…˜ ์žฅ์†Œ๋Š” ์ถ”ํ›„ ๊ฒฐ์ •๋˜๋ฉฐ, ์ด์ „ ๊ธฐ์ˆ˜๋Š” ์‹ ์ดŒ / ๊ฐ•๋‚จ์—์„œ ์ง„ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

NLP๊ฐ€ ๋ฌด์—‡์ธ๊ฐ€์š”?

NLP(Natural Language Processing)์€ ์šฐ๋ฆฌ๋ง๋กœ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ผ๊ณ  ํ•˜๋ฉฐ, ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•˜๊ณ  ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ChatGPT์˜ ๋“ฑ์žฅ์œผ๋กœ ์ธ๊ณต์ง€๋Šฅ, ํŠนํžˆ NLP์— ๋Œ€ํ•œ ๊ด€์‹ฌ์ด ํญ๋ฐœ์ ์œผ๋กœ ์ฆ๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ตœ๊ทผ ๋ช‡ ๋…„๊ฐ„ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ์…€ ์ˆ˜ ์—†์ด ๋“ฑ์žฅํ–ˆ๊ณ , ๊ด€๋ จ ์—ฐ๊ตฌ๋Š” ์—ฐ์ผ ์Ÿ์•„์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ธ๊ฐ„์˜ ์‚ฌ๊ณ ์™€ ์†Œํ†ต์€ ๋ชจ๋‘ ์–ธ์–ด๋ฅผ ๋งค๊ฐœ๋กœ ์ด๋ฃจ์–ด์ง€๋Š” ๋งŒํผ, ์ธ๊ณต์ง€๋Šฅ ์—ฐ๊ตฌ์˜ ์ข…์ฐฉ์ง€์ธ ์ธ๊ณต์ผ๋ฐ˜์ง€๋Šฅ(AGI)์— ๋„๋‹ฌํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์–ธ์–ด๋ฅผ ํ†ตํ•ด ์ธ๊ฐ„๊ณผ AI๊ฐ€ ์†Œํ†ตํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
NLP ํŒ€์—์„œ๋Š” ๋…ผ๋ฌธ ๋ฆฌ๋ทฐ๋ฅผ ํ†ตํ•ด ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์˜ ๋ฐœ์ „ ๊ณผ์ •์„ ์ „๋ฐ˜์ ์œผ๋กœ ๊ณต๋ถ€ํ•˜๊ณ , ๊ด€๋ จ ๊ฐœ๋…์„ ๋ฐ”ํƒ•์œผ๋กœ ํ”„๋กœ์ ํŠธ๋ฅผ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค. AI ๋ฐ NLP์— ๋Œ€ํ•œ ์‚ฌ์ „ ์ง€์‹์ด ํ•„์š”ํ•˜์ง€๋Š” ์•Š์ง€๋งŒ, ์งง์€ ๊ธฐ๊ฐ„ ์•ˆ์— ํ”„๋กœ์ ํŠธ๋ฅผ ์ˆ˜ํ–‰ํ•ด์•ผ ํ•˜๋Š” ๋งŒํผ ์ตœ์†Œํ•œ์˜ ๊ฐœ๋ฐœ ๊ฒฝํ—˜์ด ์š”๊ตฌ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
'24๋…„ deep daiv. ์—ฌ๋ฆ„ ๊ธฐ์ˆ˜ NLP ํŒ€์€ ์•„๋ž˜ ๋ชฉํ‘œ๋ฅผ ๊ฐ–๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
1.
NLP ์ „๋ฐ˜์— ๋Œ€ํ•œ ๋ฐฐ๊ฒฝ์ง€์‹์„ ์Œ“๊ณ , ๊ธฐ์กด์˜ ์—ฐ๊ตฌ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์ตํžˆ๊ธฐ
2.
๊ณผ์ • ์ค‘์‹ฌ์˜ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋ฅผ ํ™œ์šฉํ•œ ๋”ฅ๋Ÿฌ๋‹ ํ”„๋กœ์ ํŠธ๋ฅผ End-to-End๋กœ ๊ฒฝํ—˜ํ•˜๊ธฐ

ย ๋ชจ์ง‘ ์ธ์›๊ณผ ๋Œ€์ƒ์ด ์–ด๋–ป๊ฒŒ ๋˜๋‚˜์š”?

๋ชจ์ง‘ ์ธ์›์€ 6๋ช…์œผ๋กœ ์ตœ๋Œ€ ๋‘ ํŒ€์„ ๊ตฌ์„ฑํ•˜์—ฌ ํ™œ๋™ํ•ฉ๋‹ˆ๋‹ค. ์ธ๊ณต์ง€๋Šฅ๊ณผ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ์— ๊ด€์‹ฌ์ด ์žˆ๋Š” ๋ถ„์ด๋ผ๋ฉด ๋ˆ„๊ตฌ๋‚˜ ์ง€์›ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ ๊ฒฝํ—˜์ด ์žˆ๋‹ค๋ฉด ๋„์›€์ด ๋˜์ง€๋งŒ, ๊ธฐ๋ณธ์ ์ธ ํŒŒ์ด์ฌ ์ฝ”๋”ฉ ๋Šฅ๋ ฅ๋งŒ ์žˆ์–ด๋„ ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค. ํ•„์š”ํ•œ ์ง€์‹๊ณผ ๊ธฐ์ˆ ์€ daiv.์—์„œ ํ•จ๊ป˜ ๊ณต๋ถ€ํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค ๋‹จ, daiv.์˜ ๋ชจ๋“  ํ™œ๋™์€ ํŒ€ ๋‹จ์œ„๋กœ ์ด๋ฃจ์–ด์ง€๊ธฐ ๋•Œ๋ฌธ์— ๋ณธ์ธ์ด ํŒ€ ํ”„๋กœ์ ํŠธ์— ์ ํ•ฉํ•˜๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ฃผ์…จ์œผ๋ฉด ํ•ฉ๋‹ˆ๋‹ค. ์•ฝ 3๊ฐœ์›”์˜ ๊ธฐ๊ฐ„๋™์•ˆ ๋ชฐ์ž…ํ•ด์„œ ์„ฑ์žฅํ•˜๊ณ ์ž ํ•˜๋Š” ์—ด์ •๊ณผ ์˜์ง€๋งŒ ์žˆ๋‹ค๋ฉด, ์ฃผ์ €ํ•˜์ง€ ๋ง๊ณ  ๋„์ „ํ•˜์„ธ์š”!
๋‹จ, ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์—์„œ๋Š” ๋…ผ๋ฌธ ์ฝ๊ธฐ๊ฐ€ ๋น ์งˆ ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์˜์–ด์— ๋Œ€ํ•œ ๊ฑฐ๋ถ€๊ฐ๊ณผ ๋…ผ๋ฌธ์„ ์ฝ๋Š” ๋ฐ ๋ถ€๋‹ด์ด ์—†์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
(Optional) ๋ฉด์ ‘ ์•ˆ๋‚ด
์ง€์› ์ธ์›์— ๋”ฐ๋ผ ๋ฉด์ ‘ ์ ˆ์ฐจ๊ฐ€ ์ถ”๊ฐ€๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
์ผ์‹œ 7์›” 28์ผ ์ผ์š”์ผ ์˜คํ›„ 4์‹œ-10์‹œ
ํ˜•์‹ ์ผ๋Œ€์ผ ๋ฉด์ ‘, ์˜จ๋ผ์ธ ZOOM ๋˜๋Š” ์ „ํ™”
์˜ˆ์ƒ ์†Œ์š” ์‹œ๊ฐ„ 20๋ถ„ ์ดํ•˜
7์›” 26์ผ (๊ธˆ) ์˜คํ›„ 10์‹œ ์ด์ „์— ๋ฉด์ ‘ ๋Œ€์ƒ์ž์—๊ฒŒ ์•ˆ๋‚ด ๋ฉ”์ผ์ด ๋ฐœ์†ก๋  ์˜ˆ์ •์ž…๋‹ˆ๋‹ค.
๋ฉด์ ‘์—์„œ๋Š” ์ง€์›์„œ์— ์ž‘์„ฑํ•œ ๋‚ด์šฉ๊ณผ ๊ณผ์ œ์— ๋Œ€ํ•œ ๊ฐ„๋‹จํ•œ ์งˆ๋ฌธ์ด ์ฃผ์–ด์ง‘๋‹ˆ๋‹ค.
๊ธฐ์ˆ ์ ์ธ ๋‚ด์šฉ์— ๋Œ€ํ•ด์„œ๋Š” ๋ฌป์ง€ ์•Š์œผ๋‹ˆ, ๋ถ€๋‹ด์—†์ด ์ฐธ์—ฌํ•˜์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค!

์ฃผ์ฐจ๋ณ„ ๊ณ„ํš

ํ™œ๋™ ๋‚ด์šฉ๊ณผ ์‹œ๊ฐ„์€ ์ง„ํ–‰ ์ƒํ™ฉ์„ ๊ณ ๋ คํ•˜์—ฌ ๋ณ€๊ฒฝ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.
์ •๊ธฐ์„ธ์…˜์—์„œ๋Š” ๋ฆฌ๋ทฐํ•œ ๋…ผ๋ฌธ์„ ๋ฐœํ‘œํ•˜๊ณ , ๊ด€๋ จ ๋‚ด์šฉ์— ๋Œ€ํ•œ ๋…ผ์˜๋ฅผ ์ง„ํ–‰ํ•ฉ๋‹ˆ๋‹ค.
์ฃผ์ฐจ
ํ™œ๋™ ๋‚ด์šฉ
1์ฃผ์ฐจ
OT : Deep Learning, NLP Overview
2์ฃผ์ฐจ
Embedding, Sequence Modeling
3์ฃผ์ฐจ
Transformer, GPT, BERT
4์ฃผ์ฐจ
LLM Optimization (PEFT, Promt Engineering, RAG)
5์ฃผ์ฐจ
Open-source LLMs
6์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ
7์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ชจ๋ธ ๊ตฌํ˜„
8์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ์„ธ๋ฏธ๋‚˜ ์ค€๋น„
9์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ์„ธ๋ฏธ๋‚˜ ์ค€๋น„
10์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ: ๋ฆฌํ—ˆ์„ค
์ฃผ์ฐจ๋ณ„ ํ™œ๋™ ์„ธ๋ถ€ ์‚ฌํ•ญ์ด ๊ถ๊ธˆํ•˜๋‹ค๋ฉด ํ† ๊ธ€์„ ์—ด์–ด ํ™•์ธํ•ด์ฃผ์„ธ์š”!

์‚ฌ์ „ ๊ณผ์ œ ์•ˆ๋‚ด

๊ณผ์ œ๋Š” ๊ฐœ์ธ ๋…ธ์…˜์— ์ž‘์„ฑ ํ›„ ๋งํฌ๋ฅผ ์ œ์ถœํ•ด์ฃผ์„ธ์š”. ์ œ์ถœ ์‹œ ์•„๋ž˜ ์„ค์ •์„ ํ™•์ธํ•ด์ฃผ์„ธ์š”.
1.
์šฐ์ธก ์ƒ๋‹จ ๊ณต์œ  - ๊ฒŒ์‹œ - ์›น์— ๊ฒŒ์‹œ ํด๋ฆญ
2.
์›น์— ๊ฒŒ์‹œ๋œ ์ƒํƒœ์—์„œ ์‚ฌ์ดํŠธ ์„ค์ • - ์‚ฌ์ดํŠธ ์‚ฌ์šฉ์ž ์ง€์ • - ์ƒ๋‹จ ํŒŒ๋ž€ ๋ฐ•์Šค ํด๋ฆญ - ํ…œํ”Œ๋ฆฟ ๋ณต์ œ ํ—ˆ์šฉ

ํ•„์ˆ˜ ๊ณผ์ œ

NLP ์ง€์›์„œ ์ž‘์„ฑ
โ€ข
์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์— ๊ด€์‹ฌ์„ ๊ฐ–๊ฒŒ ๋œ ๊ณ„๊ธฐ, ํŠน๋ณ„ํžˆ ์ž์—ฐ์–ด์ฒ˜๋ฆฌ๋ฅผ ๊ณต๋ถ€ํ•˜๊ณ  ์‹ถ์€ ์ด์œ ์— ๋Œ€ํ•ด์„œ ๊ฐ„๋‹จํžˆ ๋ง์”€ํ•ด์ฃผ์„ธ์š”.
โ€ข
AI ๊ด€๋ จ ๊ฒฝํ—˜์ด ์•„๋‹ˆ๋”๋ผ๋„, ๊ฐœ๋ฐœ ๋ฐ ํŒ€ ํ”„๋กœ์ ํŠธ ๊ฒฝํ—˜์ด ์žˆ๋‹ค๋ฉด ๊ณผ์ •์„ ์ค‘์‹ฌ์œผ๋กœ ์†Œ๊ฐœํ•ด์ฃผ์„ธ์š”.
โ€ข
NLP ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•˜์—ฌ ์ˆ˜ํ–‰ํ•˜๊ณ  ์‹ถ์€ ํ”„๋กœ์ ํŠธ์— ๋Œ€ํ•ด ์„ค๋ช…ํ•ด์ฃผ์„ธ์š”.

์„ ํƒ ๊ณผ์ œ

๊ฐ€์‚ฐ์ ์ด ์žˆ์ง€๋งŒ, ์ •๋‹ต์€ ์—†์Šต๋‹ˆ๋‹ค. ์‹ค๋ ฅ์ด ์•„๋‹Œ ์ฐธ์—ฌ ์˜์ง€๋ฅผ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•จ์ž…๋‹ˆ๋‹ค.
Deep Learning ์•„ํ‹ฐํด ์ •๋ฆฌ
์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ๋Š” ๊ธ‰์†๋„๋กœ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฐ ๋งŒํผ ํŠธ๋ Œ๋“œ๋ฅผ ๋”ฐ๋ผ๊ฐ€๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋ฐœํ‘œ๋œ ์ง€ ์–ผ๋งˆ ๋˜์ง€ ์•Š์€ ๋…ผ๋ฌธ์ด๋‚˜, ์˜์–ด ์›๋ฌธ์œผ๋กœ ์ž‘์„ฑ๋œ ๋‰ด์Šค๋ฅผ ์ฝ์„ ์ผ์ด ๋งŽ์Šต๋‹ˆ๋‹ค. ๊ทธ๋งŒํผ ๊ธฐ์ˆ ์ ์ธ ๊ธ€์„ ์˜์–ด๋กœ ์ฝ๋Š”๋ฐ ๋ถ€๋‹ด์ด ์—†์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด์™€ ๊ด€๋ จํ•˜์—ฌ ํ•œ ๊ฐ€์ง€ ์‚ฌ์ „ ๊ณผ์ œ๋ฅผ ์ค€๋น„ํ–ˆ์Šต๋‹ˆ๋‹ค.
์ธ๊ณต์ง€๋Šฅ ๋ถ„์•ผ์˜ ์„ธ๊ณ„์ ์ธ ์„ํ•™์ธ Yann Lecun, Yoshua Bengio, Geoffrey Hinton์ด ๋จธ์‹ ๋Ÿฌ๋‹๊ณผ ๋”ฅ๋Ÿฌ๋‹์˜ ์ „๋ฐ˜์„ ์†Œ๊ฐœํ•œ ๋‚ด์šฉ์„ ๋‹ด์•„ ๋„ค์ด์ฒ˜์ง€์— ๊ฒŒ์žฌํ•œ ๊ธ€์ž…๋‹ˆ๋‹ค. ์ด ๊ธ€์€ ์ž…๋ฌธ์ž์—๊ฒŒ ์ด ๋ถ„์•ผ์— ๋Œ€ํ•œ ์ „๋ฐ˜์ ์ธ ์ง€์‹์„ ์ œ๊ณตํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๋…ผ๋ฌธ ์ฝ๊ธฐ์— ๋Œ€ํ•œ ๋ฌธํ„ฑ์„ ๋‚ฎ์ถ”๋Š” ๋ฐ๋„ ๋งŽ์€ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
์•„๋ž˜ ๋งํฌ์—์„œ PDF ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
๋…ผ๋ฌธ์—์„œ โ€œBackpropagation to train multilayer architectures ~ Image understanding with deep neural networksโ€๋ฅผ ์ œ์™ธํ•œ ๋ถ€๋ถ„์„ ์ฝ๊ณ , ์ดํ•ดํ•œ ๋‚ด์šฉ์„ ์ •๋ฆฌํ•ด์ฃผ์„ธ์š”.
โ€ข
๋‚ด์šฉ์„ ๋ฒˆ์—ญํ•˜๊ธฐ๋ณด๋‹ค๋Š” ๋”ฅ๋Ÿฌ๋‹์˜ ๋ฐœ์ „ ๊ณผ์ •์— ๋Œ€ํ•œ ๋ณธ์ธ์˜ ํ•ด์„์„ ๋‹ด์•„์ฃผ์„ธ์š”. ํ˜•์‹๊ณผ ๋ถ„๋Ÿ‰์€ ์ž์œ ์ž…๋‹ˆ๋‹ค.