Diffusion이 무엇인가요?
Diffusion이란, 생성 모델 중 하나로 노이즈를 점차 추가하는 forward pass와 생성된 노이즈를 점차 제거해나가는 backward pass로 이루어져있습니다. 즉 디퓨전은 노이즈가 추가된 데이터를 점차적으로 데이터를 복원하는 과정을 확률적인 과정으로 모델링하는 것입니다. OpenAI의 DALL-E 2, Google의 Imagen 모두 diffusion model을 사용해 선보였습니다. Diffusion 모델이 GAN보다 다양성이 뛰어나고, 다양한 모달리티를 이미지와 함께 사용할 수 있다는 점에서 최근 생성 분야에서 가장 활발히 연구가 이루어지는 모델입니다.
Diffusion 2023 여름 스터디는 Diffusion을 공부하기 위해 반드시 알아두면 좋은 논문들로 리스트업 했습니다. 이미지 생성 분야에 관심이 있고, GAN과는 다른 디퓨전을 공부해보고 싶은 열정 넘치는 분들을 환영합니다!
Diffusion 2023 여름 커리큘럼
챌린지
일정 2023년 8월 1일 - 8월 29일 (5주)
시간 매주 화요일 오후 9시 - 11시
주차 | 날짜 | 논문 |
1주차 | 8월 1일(화) | DDPM DDIM |
2주차 | 8월 8일(화) | Diffusion Models Beat GANs on Image Synthesis |
3주차 | 8월 15일(화) | LDM |
4주차 | 8월 22일(화) | GLIDE textual inversion Dreambooth |
5주차 | 8월 29일(화) | DALL-E 2 ControlNet Imagen |
Diffusion 2023 상세 커리큘럼
1주차 DDPM DDIM
2주차 Diffusion Models Beat GANs on Image Synthesis
3주차 LDM(Stable Diffusion)
4주차 GLIDE textual inversion Dreambooth
5주차 DALL-E 2 ControlNet Imagen
진행 방식
Diffusion 2023 여름 스터디는 논문 스터디 방식으로 진행됩니다.
•
1~3주차에는 공통 논문을 리뷰하고, 4~5주차는 3개의 팀이 각각 하나의 논문을 맡아 리뷰할 예정입니다.
•
매주 팀원끼리 진행하는 팀 미팅과 스터디 리더가 함께 잠여하는 정기 세션으로 나누어 활동을 진행할 예정입니다.
•
팀 미팅에서는 각 주차의 논문을 읽고 팀끼리 미리 모여 내용을 정리하고 질문을 리스트업하는 시간을 가집니다.
•
정기 세션에서는 논문에 대한 발표를 진행하며, 각 팀별로 모은 질문을 해결하고, 또 미리 해결했다면 그 내용을 공유하는 시간을 가집니다.
리더를 소개합니다!
끝없이 확장하는 인공지능 분야의 매력과 상상력의 한계를 넓혀주고 세상을 다채롭게 만들어주는 생성모델이 매력적이어서 공부를 시작했습니다.
•
Visual Intelligence Lab @ ETRI, Student Intern(Assistant Researcher), Diffusion 기반 text-to-image, text-to-video 관련 연구 진행
•
GANs, Diffusion Models 관련 프로젝트 경험 및 논문 보유
•
Object Detection 관련 프로젝트 경험 보유, 타 프로젝트 Advisor 활동 중
•
22-23 GDSC ML Core Member @ Sookmyung W. Univ. 입문 및 심화 스터디 운영, 오픈 세미나 호스트 및 Generative AI 관련 스피커 세션 경험 다수
•
Google the Solution Challenge 2023 Global Top 100 Semi-Finalists 수상 (ML 엔지니어로 참여)