Search
Login

Audio Deep Learning

๋ฆฌ๋”
๋ฉด์ ‘
๊ณผ์ œ O | ๋ฉด์ ‘ X
๋ชจ์ง‘ ์ธ์›
๋ชจ์ง‘ ์ธ์› 2๋ช…
๋ถ„๋ฅ˜
์ฑŒ๋ฆฐ์ง€
์„ธ์…˜ ์‹œ๊ฐ„
์ฑŒ๋ฆฐ์ง€ ํ™”์š”์ผ ์˜คํ›„ 10์‹œ - 11์‹œ

Audio Deep Learning 2024 ๊ฒจ์šธ ์ปค๋ฆฌํ˜๋Ÿผ

๋ชจ์ง‘ ์ธ์› 6๋ช…
ํ™œ๋™ ์‹œ๊ฐ„ ๋งค์ฃผ ํ™”์š”์ผ ์˜คํ›„ 10์‹œ-11์‹œ
ํ™œ๋™ ๋ฐฉ๋ฒ• ์ฃผ 1ํšŒ ๋น„๋Œ€๋ฉด ์ •๊ธฐ ์„ธ์…˜ + ์ฃผ 1ํšŒ ํŒ€๋ณ„ ๋ฏธํŒ…
<๋”˜์ด ๋ถ€๋ฅด๋Š” Hype Boy> ๋“ฑ์œผ๋กœ ์˜ค๋””์˜ค ๋”ฅ๋Ÿฌ๋‹์ด ์ฃผ๋ชฉ์„ ๋ฐ›๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์˜ค๋””์˜ค ๋”ฅ๋Ÿฌ๋‹์€ Text-to-Speech, Voice Conversion, Denoising ๋“ฑ์˜ ์˜์—ญ์œผ๋กœ ํ™œ๋ฐœํ•˜๊ฒŒ ์„ฑ์žฅ์„ ์ด๋ฃจ์–ด ๋‚ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ด„ ๊ธฐ์ˆ˜์—๋Š” Text-to-Speech ์œ„์ฃผ๋กœ ํ”„๋กœ์ ํŠธ๋ฅผ ์ˆ˜ํ–‰ํ•˜์˜€๋‹ค๋ฉด, ์ด๋ฒˆ ์—ฌ๋ฆ„ ๊ธฐ์ˆ˜์—๋Š” Text-to-Speech ์ด์™ธ์—๋„ Speech Recognition์ด๋‚˜ Audio Source Separation ๋“ฑ ๋‹ค์–‘ํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋ฉฐ ์˜๋ฏธ ์žˆ๋Š” ํ”„๋กœ์ ํŠธ๋ฅผ ๋งŒ๋“ค์–ด ๋ณด๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค.

ํ•„์ˆ˜ ๊ณผ์ œ

ํ•„์ˆ˜ ๊ณผ์ œ ์˜ค๋””์˜ค ๋”ฅ๋Ÿฌ๋‹ ์ฑŒ๋ฆฐ์ง€์— ์ฐธ์—ฌํ•˜์‹œ๋Š” ์—ฌ๋Ÿฌ๋ถ„์˜ ์—ด์˜์™€ ์—ญ๋Ÿ‰์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ๊ธฐ์กด๊ธฐ์ˆ˜ ๋ถ„๋“ค๊ณผ ์‹ ์ž…๊ธฐ์ˆ˜ ๋ถ„๋“ค ๋ชจ๋‘ ๊ณผ์ œ๋ฅผ ์ œ์ถœํ•ด ์ฃผ์…”์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๊ณผ์ œ์˜ ํ˜•์‹์€ ์•„๋ž˜์˜ pdf ํŒŒ์ผ์— ์ œ์‹œ๋˜์–ด ์žˆ์œผ๋ฉฐ ๊ธฐ์กด ๊ธฐ์ˆ˜ ๋ถ„๋“ค๊ณผ ์‹ ์ž…๊ธฐ์ˆ˜ ๋ถ„๋“ค๊ป˜ ์กฐ๊ธˆ์”ฉ ๋‹ค๋ฅธ ์–‘์‹์˜ ๊ณผ์ œ๋ฅผ ๋“œ๋ ธ๊ธฐ ๋•Œ๋ฌธ์— ํ˜ผ๋™ ์—†์œผ์‹œ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค. ๊ณผ์ œ๋Š” .ipynb ํ˜•ํƒœ๋กœ ์ œ์ถœํ•ด ์ฃผ์…”์•ผ ํ•˜๋Š”๋ฐ, ๋ฌธ์ œ์— ๋”ฐ๋ผ ์ฝ”๋“œ๊ฐ€ ์•„๋‹Œ ์„ค๋ช…์„ ํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ์—๋Š” ๋งˆํฌ๋‹ค์šด ์…€์„ ํ™œ์šฉํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค. ์ด์™ธ์˜ ํ˜•์‹์€ ์ž์œ ๋กญ๊ฒŒ ์ž‘์„ฑํ•ด ์ฃผ์„ธ์š”.
โ€ข
์‹ ์ž… ๊ธฐ์ˆ˜์˜ ๊ฒฝ์šฐ ๊ณผ์ œ๋ฅผ ์ž‘์„ฑํ•œ ํ›„ ๊ตฌ๊ธ€ํผ์— ์ฒจ๋ถ€ํ•ด ์ œ์ถœ ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค.
โ€ข
๊ธฐ์กด ์ˆ˜๋ฃŒ ํŒ€์›์˜ ๊ฒฝ์šฐ ๊ณผ์ œ๋ฅผ ์ž‘์„ฑํ•œ ํ›„ ์ด๋ฉ”์ผ๋กœ ์ œ์ถœ ๋ถ€ํƒ๋“œ๋ฆฝ๋‹ˆ๋‹ค.
24w แ„‹แ…ฉแ„ƒแ…ตแ„‹แ…ฉ แ„€แ…ชแ„Œแ…ฆ(แ„€แ…ตแ„Œแ…ฉแ†ซแ„€แ…ตแ„‰แ…ฎแ„‹แ…ญแ†ผ).pdf
70.0KB
24w แ„‹แ…ฉแ„ƒแ…ตแ„‹แ…ฉ แ„€แ…ชแ„Œแ…ฆ(แ„‰แ…ตแ†ซแ„‹แ…ตแ†ธแ„€แ…ตแ„‰แ…ฎแ„‹แ…ญแ†ผ).pdf
73.7KB
์ด๋Ÿฐ ํŒ€์›๊ณผ ํ•จ๊ป˜ํ•˜๊ณ  ์‹ถ์–ด์š”!
์˜ค๋””์˜ค ๋”ฅ๋Ÿฌ๋‹์€ ๋ฌด์ฒ™ ์žฌ๋ฐŒ์ง€๋งŒ, ๋˜ ํ•œํŽธ์œผ๋กœ๋Š” ์ƒ์†Œํ•œ ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค. ์Œ์„ฑ์— ๋Œ€ํ•ด์„œ๋„, ๋”ฅ๋Ÿฌ๋‹์— ๋Œ€ํ•ด์„œ๋„ ๊ณต๋ถ€ํ•ด์•ผ ํ•  ๋ถ€๋ถ„์ด ๋งŽ์Šต๋‹ˆ๋‹ค. ์ด์— 10์ฃผ๊ฐ„ ๋”ฅ ๋‹ค์ด๋ธŒ ํ™œ๋™์— ์—ด์ •์ ์œผ๋กœ ์ž„ํ•˜์‹ค ์ˆ˜ ์žˆ๋Š” ๋ถ„๋“ค๊ณผ ํ•จ๊ป˜ํ•˜๊ณ  ์‹ถ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ CNN, RNN ๋“ฑ ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ์ดˆ ๊ฐœ๋…์„ ์ˆ™์ง€ํ•˜์‹  ๋ถ„๋“ค์ด์…จ์œผ๋ฉด ์ข‹๊ฒ ์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ๋ถ„์˜ ์ฑŒ๋ฆฐ์ง€๋ฅผ ๋•๊ธฐ ์œ„ํ•ด ์ €๋„ ์—ญ์‹œ ์ตœ์„ ์„ ๋‹คํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

์ฃผ์ฐจ๋ณ„ ํ™œ๋™ ๊ณ„ํš

์ฃผ์ฐจ
ํ™œ๋™ ๋‚ด์šฉ
1์ฃผ์ฐจ
OT: What is Audio Deep Learning?
2์ฃผ์ฐจ
Audio Classification & Audio data Augmentation | ํ”„๋กœ์ ํŠธ ์ฃผ์ œ ๋…ผ์˜
3์ฃผ์ฐจ
Speech Recognition | ์ฃผ์ œ ํ™•์ • ๋ฐ ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘
4์ฃผ์ฐจ
Text-to-Speech | ํ”„๋กœ์ ํŠธ (1)
5์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ (2)
6์ฃผ์ฐจ
ํŒ€ ์„ธ๋ฏธ๋‚˜
7์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ (3)
8์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ (4)
9์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ ๋ฐ๋ชจ ์ค€๋น„
10์ฃผ์ฐจ
ํ”„๋กœ์ ํŠธ ๋ฆฌํ—ˆ์„ค