Search
Duplicate
📝

1주차 인스타그램 포스트 (1)

page 1.
알파벳만을 학습해서 문서를 분류해내는 인공지능
*기타 제목 후보 (?)
1.
알파벳만 읽고도 문서를 분류해내는 인공지능
2.
알파벳만 보고 문서를 분류해내는 1차원 CNN의 힘
3.
단어가 아닌, 알파벳으로! RNN이 아닌, CNN으로! 문서 분류하기
4.
문서를 분류해보자 단어보다는 알파벳으로! RNN이 아닌 CNN으로!
page 2.
2016년 3명의 연구진이 단어가 아닌 알파벳으로 문서를 분류하는 인공지능에 관한 논문을 발표했다.
page 3.
본 논문은 문서 분류를 위해 아래와 같은 새로운 접근을 시도했다.
1.
텍스트에 흔히 사용하는 RNN이 아닌 CNN을 사용
2) 입력값의 최소단위로 단어 대신 알파벳을 사용
page 4.
1) 1D CNN (1- Dimensional Convolutional Neural Network)
1차원 CNN은 필터가 데이터를 따라 한 축으로 이동하기 때문에 효과적으로 텍스트 분석을 수행할 수 있다.
CNN: 입력데이터에 필터를 적용하여 데이터의 특징을 추출하는 기법
page 5.
2) 알파벳의 벡터화
기존 연구들은 단어를 중심으로 벡터화를 시켰지만,
본 논문에서는 더 raw한 수준의 알파벳을 벡터화시켰다.
벡터화 : 단어를 컴퓨터가 이해할 수 있는 벡터로 변환
page 6.
알파벳 수준으로 벡터화 된 데이터와 CNN을 활용해 모델을 학습시켜 문서를 분류한다.
page 7.
텍스트에 CNN을 적용하면 통사, 의미구조에 대한 지식 없이
약간의 수정으로도 여러 언어에 적용될 수 있다.
또한 오탈자, 이모티콘 등에 강하다는 장점이 존재한다
page 8.
그러나 이러한 장점에도 불구하고 한계가 존재했다.
데이터셋의 크기나 대소문자 구별 여부에 따라 모델의 성능이 달라졌기 때문에,
실험을 통해 데이터셋에 가장 적합한 모델을 찾아야 한다.
page 9.
그럼에도 이 연구는 많은 의의를 지닌다.
자연어처리를 위해 단어 기반의 CNN을 사용하던 기존 방식을 벗어나
알파벳을 통해 근본적인 언어 구조의 특징을 추출하고자 한 최초의 연구이기 때문이다.
page 10.

character cnn에 대해 더 알아보고 싶다면?

논문

Word-based ConvNets <Convolutional Neural Networks for Sentence Classification>
CNN in NLP <Character-level Convolutional Networks for Text Classification>
관련 개념
# NLP 자연어 처리
# CNN 합성곱 신경망
# Text Classification 문서 분류