Search
🌃

생활 속 NLP - 오후 편

Created
2022/08/03
Editor
21세기 대한민국의 대학생 이딥다의 방에서는 벌써 세 번째 알람이 울리고 있습니다. 알람이 한참을 울리던 끝에 딥다는 미동도 않은 채로 “시리야, 알람 꺼줘”라고 말합니다. 시리의 답을 들으며 힘겹게 몸을 일으킨 딥다는 부엌으로 걸어가 물을 한 잔 마신 뒤, 식탁 위에 있던 핸드폰으로 어제 올라온 뉴스가 요약된 메일을 읽기 시작해요. 주식 뉴스 서비스에서 추천해주는 주식을 확인하며, 딥다는 갑부가 되는 상상을 그려보곤 실시간 강의를 듣기 시작해요.
이어 아침 겸 점심을 간단하게 해치운 딥다는 어제 미처 마무리하지 못한 레포트 과제를 시작합니다. 자료를 찾기 위해 검색한 영어권 사이트의 글을 한글로 번역해 정보를 얻고, 혹시라도 맞춤법이 틀릴까 싶어 맞춤법 검사도 돌려봅니다. 꽤 오랜 시간을 매달려 끝낸 레포트는 표절률 검사 사이트에 올려 표절률을 확인해보고 메일로 제출합니다. 과제를 끝낸 딥다는 한 어플에 들어가 영화 취향을 검색한 뒤 추천을 받고 자신의 취향을 저격한 영화를 틉니다. 엔딩 크레딧까지 보고 나서야 당장 내일 있을 AI 면접 후기를 찾아보며 준비하고, 딥다는 늦은 저녁이 되어서야 침대에 눕습니다.
지난 주 함께 했던 딥다의 하루, 기억하시나요?
이전 편에서는 딥다의 알람을 대신 꺼준 음성 어시스턴트 시리부터 뉴스 요약 AI 모델과 주식 추천 서비스까지, 오전 중에 딥다가 경험한 자연어처리 기술을 함께 알아봤었는데요. 이번 오후 편에서는 과제를 할 때 활용하는 기능, AI 면접에 적용된 자연어처리 기술을 찾아보며 그 기능을 톺아볼게요!

과제를 도와주는 자연어처리NLP

학교 생활에서의 수행평가, 레포트, 직무 관련 보고서를 작성하다보면, 내용적인 것 외에도 표현이나 문장 차원에서 잘못된 부분은 없는지 확인하며 마무리지어야 하는 경우가 많습니다. 능숙하지 않은 원어 자료를 참고해야 하기도 하고, 기존 자료의 내용과 다른 방향을 잡아야 할 때도 있고요. 지금부터 이런 상황에서 활용하는 번역 서비스, 맞춤법 검사, 표절률 검사의 원리를 알아보고 그 안에 적용된 자연어처리를 확인해보겠습니다.

번역 서비스 AI?

온라인 상에서 쉽게 활용할 수 있는 번역 서비스에는 네이버의 파파고, 구글 번역 등이 있습니다. 첫 기계번역은 1954년 조지타운 대학과 IBM의 러시아어-영어 자동번역 공개실험에서 공개되었어요. 이때를 기점으로 규칙 기반, 예제 기반을 거쳐 통계 기반 기계 번역(SMT, Statistical Machine Translation), 구문 기반 기계 번역(PBMT, Phrase Based Machine Translation)이 연구되었고, 지금에 이르러서는 딥러닝이 적용된 인공신경망 기반 번역 기술(NMT, Neural Machine Translation)이 활용되고 있어요.
이전에 주로 사용되었던 SMT의 경우, 기존 텍스트 데이터를 전처리해 컴퓨터가 이해할 수 있도록 만들어둔 특정 언어의 단어/구문의 의미 뭉치(말뭉치, corpus)를 저장한 데이터셋, 번역 엔진을 활용합니다. 사용자에게서 번역이 요청된 텍스트가 입력되면, 입력된 텍스트 내의 표현 중에 통계적으로 계산했을 때 번역 엔진 내의 단어, 구문과 가장 유사하다고 판단되는 결과를 출력해 번역 결과를 알려주는 거죠. 그런데 SMT, PBMT의 경우 통계적인 방법을 사용하다보니 동음이의어, 어순, 다양한 맥락을 충분히 고려하지 않은 번역 결과를 출력하는 문제점을 가지고 있었습니다.
이를 해결하기 위해 연구된 기술이 인공신경망 번역 기술이에요.인공신경망 번역 기술, NMT는 쉽게 말해 머신러닝 엔진을 통해 글 전체의 문맥을 파악하고, 문장을 구성하는 단어, 순서, 의미 등을 반영해 타 언어로 번역한 결과를 출력한다고 할 수 있어요. SMT와 비교해 연속적(continuous)이고 전체적인 판단(global decision)을 중시하는 기술이기도 합니다.
구글 번역의 경우에는 입력된 원문을 해석하는 과정은 인코더(Encoder), 번역 결과를 생성하는 과정은 디코더(Decoder)라고 하고, Attention 모듈로 인코더 네트워크와 디코더 네트워크를 연결하는 구조로 되어 있어요. 이를 통틀어 번역 과정에서 활용되는 신경망 모델에서는, 각 언어 간 번역 데이터라 할 수 있는 병렬 말뭉치들을 기계 학습하는 과정을 반복해 번역의 정확성을 높여나갑니다.
앞서 예시로 든 파파고는 NMT와 M2MT 엔진을, 구글 번역은 NMT와 GNMT 엔진을 활용해 번역 서비스를 제공하고 있어요. 또한 카카오엔터프라이즈에서는 transformer 기반의 기술을 적용하기도 하고, 다양한 기업에서 번역 모델의 성능을 높이기 위한 연구가 계속되고 있습니다.
물론 AI 번역 기술이 빠르게 발전하고 있지만, 아직 완전하게 해결하지는 못한 문제들도 남아있어요. 성별편향gender-bias, 동음이의어, 고유명사 등의 문제와 상황적인 맥락을 반영한 번역에 있어서 완전성을 갖추진 못했다는 부분 등에서 말이죠. 동시에 소수만 사용하는 언어를 보존하거나 전문성을 지닌 분야에서 특화된 번역 기술이 연구되고 있다는 소식도 들려오고 있어요. 이와 관련한 기사를 아래에 첨부해두었으니, AI 번역에서 더욱 갖추어야 할 기술이 어떤 것이 있는지 그리고 AI 번역을 통해 우리가 얻을 수 있는 바가 무엇일지 더욱 고민해봤으면 좋겠습니다.

맞춤법 검사 AI?

글의 문법, 맞춤법, 띄어쓰기 등의 요소는 그 자료의 신뢰도에 힘을 실어줄 수 있는 역할을 하는 부분입니다. 그렇기 때문에 글을 쓰는 사람의 입장에서 가장 마지막까지 신경쓰곤 하는 부분이기도 하구요. 일상 대화부터 공적인 문서까지 많은 글에서 우리는 맞춤법 등 글의 문법적 요소를 확인하는 경우가 많습니다. 이를 도와주는 서비스 중에는 네이버에서 베타 서비스로 제공하는 우리말 맞춤법 검사기, 최근 사라진 사람인 맞춤법 검사, 영어문법 검사기 grammarly 등이 있어요.
이번 글에서는 grammarly에 대해 알아볼게요. 진행 단계는 아래와 같이 그려볼 수 있고, 크게 사용자의 텍스트 입력 및 전처리 / AI 모델 적용 / 문법 교정 결과 출력 세 단계로 나눠볼 수 있습니다.
가장 먼저, 사용자는 메일, 레포트 등의 영작을 진행합니다. 참고로 grammarly의 경우에는 브라우저의 확장프로그램 형태, 어플리케이션 등에서 이용할 수 있기 때문에 이를 적용할 수 있는 상황에서 텍스트를 입력하는 것이 첫 번째 순서예요. 그 이후 텍스트를 문자, 개별 단어에서의 문법 구조, 문장, 단락 심지어 전체 텍스트 단위로 AI 모델에 적용할 수 있게끔 NLP 기술로 데이터를 전처리 하는 거죠.
그다음 AI 모델에 전처리된 텍스트 데이터를 적용할 수 있어요. 이때 AI 시스템을 구성하는 건 자연어처리NLP, 머신러닝ML, 딥러닝DL 기술이에요. 이 과정에서는 세 기술이 조합된 문법적 오류 수정 시스템(GEC), 문법 교정 가이드를 위한 주석이 달린 말뭉치corpus가 활용돼요.
GEC와 주석이 달린 말뭉치를 시작으로,영어 사용자, 웹 포럼, 소셜 미디어 등 다양한 출처로부터 훈련 데이터를 수집하고 예상치 못한 데이터를 경험하며 반복 학습을 거쳐 해당 데이터로 주석을 다는 가이드라인을 구축하는 거죠. 이렇게 훈련된 AI 모델은 표기 상의 오류 등을 학습하고 발전시키는 과정을 통해 올바른 맞춤법, 표현 등의 적절한 문법 사용을 익힐 수 있게 돼요.
입력된 텍스트에 대해 AI 모델을 적용해 도출된 결과(맞춤법 오류, 더 나은 표현 제언 등)는 어색하지 않은 문법을 갖춘 주석으로써 특정 텍스트의 결과를 나타내줍니다. 이때, grammarly의 경우, 피드백 매커니즘을 활용해 많은 사용자가 무시한 문장 및 표현 교정에 대해서는 더 나은 가이드를 제시하기 위해 알고리즘을 조정하기도 해요.
grammarly를 비롯한 문법/맞춤법 검사 서비스를 사용하면 무척 빠른 속도로 그 결과를 출력해주는 것을 볼 수 있는데요. 빠른 속도를 보여주는 와중에도 그 속에는 다량의 문단, 문장, 단어, 문법 텍스트 데이터로 반복 학습을 거친 인공지능이 숨어있었습니다. 딥다의 빠른 레포트 마감에 맞춤법 AI 모델도 한 몫 했다고 할 수 있는 거죠!
+ grammarly 블로그에서는 grammarly 서비스에 적용된 기능, 작법과 문법, 관련 트렌드에 대해 설명하는 글이 올라오고 있으니 참고하세요!

표절률 검사 AI?

수많은 자료를 인터넷에서 찾을 수 있게 됨에 따라, 그 자료들을 활용하면 활용할수록 작성한 글의 표절률 검사는 필수적으로 밟아야 하는 절차가 되고 있습니다. 특히 출처를 명시하지 않고 기존 글을 자신만의 의견인 체 할 수 없게 하기 위해서도 말이죠.
표절률 검사의 원리와 기능을 살펴보기에 앞서, 이 얘기를 짚고 넘어갈게요. 만약 여러분의 전공과 전혀 무관한 분야의 소논문을 제공하고 어떠한 인공지능의 힘도 빌리지 않고 이 소논문을 기존에 연구된 자료와 비교했을 때의 표절률 계산을 요청한다면 어떻게 진행하실 건가요?
저라면 소논문을 꼼꼼히 읽어보며 온라인 상에서 관련 키워드를 검색하고, 잦은 빈도를 가지는 어휘 및 용어, 연구 주제를 다루는 또다른 기존 자료를 찾기 위해 열을 올릴 것 같습니다. 아마 관련 자료를 찾다 지쳐 두손두발 다 들 것 같기도 하구요
과연 많은 시간을 요하고 다양한 자료와 대조하는 과정을 거쳐야 하는 표절률 검사를, 인공지능은 어떻게 해결하는 걸까요?
우선 전체적인 표절률을 확인하는 데 있어서 한 자료와 N개의 문서를 동시에 비교하며 표절한 영역을 곧바로 검출하는 방식을 사용합니다. 예시로 든 카피킬러를 운영하는 ‘무하유’의 경우 이때의 N개의 문서가 65억 개 이상의 문서라고 해요.
이때 한 논문과 한 논문을 비교하기 보다는 비교하고자 하는 자료들을 파편화시킨 다음 각각을 비교할 수 있도록 하는 방식도 포함됩니다. 입력된 자료의 문자열을 다른 문서의 각 문자열과 매칭시켜 일치 정도를 계산하는 거죠.
또한 철저히 출처를 남긴 인용구문을 표절 영역에서 해제하거나, 표절 검사를 진행할 영역을 한정하는 것, 띄어쓰기 교정을 통해 정확한 표절률을 확인할 수 있도록 하는 데에 있어서 NLP 기술을 활용한 인공지능은 그 역할을 톡톡히 해내고 있어요.
그리고 단순한 검색 결과만이 아니라 기관, 연구소, 연구재단 등에서 모두에게 공개하는 오픈 액세스 문서를 취합해 표절을 검사하게 돼요. 대조하는 데이터의 양이 증가할수록 훨씬 더 정확한 표절률을 계산하기 쉽겠죠?
온라인 상의 자료 공유가 활발해지고 자료에 수월하게 접근할 수 있는 만큼 저작권, 정보윤리, 표절 의식을 더욱 확고하게 다져야 할 필요가 있어요. 카피킬러, 턴잇인을 비롯해 연구직을 가지고 계신 분은 KCI 논문 검사 사이트를, 고입/대입 자기소개서를 써야하는 분은 스쿨로직 등을 활용하며 더욱 윤리적인 글을 쓰실 수 있길 바라면서 표절률 검사 AI에 대한 글은 마무리해보겠습니다.
지금까지 딥다가 보낸 오후의 시작을 알린 과제 관련 자연어처리, AI 기술을 알아봤습니다. 혹시 여러분이 과제 또는 글을 작성할 때 경험해본 서비스도 이 글에서 언급되어 있었나요? 세 가지 부분을 다루다보니 다소 간략하게 전달된 부분도 많았는데, 이 글만으로 해소가 되지 못한 궁금증은 글 중간 중간 덧붙인 자료, 기사 등을 읽어보며 더 많은 관심 가져주시길 바라며 글 마치겠습니다!

AI 면접

AI 면접의 특징

그 다음으로는 AI 면접에 관해 알아보려고 해요. 여러분은 AI 면접에 대해서 들어본 적이 있나요? AI 면접이란 말그대로 뇌신경과학 기반의 AI를 기업의 신입 사원 채용 면접에 활용하는 것인데요, 산업 유형을 가리지 않기에 국내의 많은 기업들이 활용하고 있다고 해요. AI 면접의 특징으로는 객관성 및 공정성과, 효율성을 뽑을 수 있어요. 먼저 AI 면접은 심사위원이 면접하는 것과 달리 학습된 AI가 기준에 따라 지원자의 역량을 파악하기 때문에 심사위원의 편견이 개입되지 않아 객관성 및 공정성을 확보할 수 있어요. 또한 인공지능이 자기소개서를 평가하는데 걸리는 시간은 평균 3초이므로 1만 명의 자기소개서를 평가하는데 9시간이 채 걸리지 않지만, 인사 담당자 10명이 처리하면 하루 8시간씩 7일이 꼬박 필요하다고 해요. 이 때문에 기업 입장에서는 효율성과 비용 절감을 이유로라도 일반 면접을 AI 면접으로 바꾸는 추세이죠. 들어가기에 앞서, 기자가 직접 경험한 AI 면접 영상을 보면서 AI 면접이 어떻게 이루어지는지 보면 뒤에 나오는 내용들을 더 쉽게 이해할 수 있을 것 같아요!

AI 면접의 분석 기술 - V4

AI 면접에서 사용하는 분석 기술은 V4 분석 기술과 P6 분석 기술 크게 두 가지로 나눌 수 있어요. 먼저 V4 분석 기술은 영상면접에 활용되며, V로 시작하는 4가지 분석 기술을 의미하는 것으로 4가지는 각각 Visual, Voice, Verbal, Vital이에요. 먼저 표정 분석 기술인 Visual은 영상 정보를 인식하고 처리하는 기술로, 지원자의 얼굴에서 68개의 점을 잡은 뒤 각 점의 움직임에 따라서 표정의 변화를 측정해요. 기쁨, 슬픔, 분노, 역겨움, 두려움, 긴장 혹은 화, 공포, 혐오, 즐거움, 슬픔, 놀람, 무표정 등으로 항목을 나누어 감정을 분석하며 시선 처리와 머리의 움직임도 함께 측정한다고 하네요. 다음으로 음성 분석 기술인 Voice는 인간의 청각 기능을 모방해 만들어진 것으로 음색, 음높이, 크기 변화, 속도, 휴지 변화, 발음 등을 분석해요. 그 다음으로 언어 분석 기술인 Verbal은 음성 내용을 문자로 전환해주는 STT(Speech-to-Text) 기술을 활용하여 단어 의미와 어휘 사용량, 감정 어휘를 파악해요. 이 STT 기술을 통해 면접이 끝난 뒤 워드 클라우드를 제공하는 곳도 있다고 하네요. 마지막으로 안면 분석 기술인 Vital은 영상 정보 처리 기술을 활용하여 지원자의 맥박 및 혈류량 정보를 측정함으로써 지원자의 정서와 감정 변화를 확인하고 답변의 신뢰도를 평가할 때 활용해요. 다만 얼굴색 변화나 온도 변화 감지 기술은 있지만 주변 환경 조명이나 온도에 따라 충분히 달라질 수 있기 때문에 잘 활용하지 않아요.

AI 면접의 분석 기술 - P6

위의 표에서 볼 수 있듯이 그 다음으로 활용되는 P6 분석 기술은 전전두엽의 6가지 영역의 역량을 측정하기 위한 역량 분석 게임에 활용돼요. 색-단어 일치 게임으로는 가치평가와 메타인지를 통해 성실성 여부를 판단해요. 카드 뒤집기 게임으로는 사회적 가치를 기반으로 하는 의사결정을 통해 적극성을 판단하며, 무거운 순서대로 나열하기 게임으로는 과거 경험 가치를 기반으로 하는 행동을 통해 긍정성을 판단하죠. 이외에도 사람의 표정을 보고 감정을 맞추는 게임으로는 상대방의 의도를 추론하여 동기력을 판단하고, 도형 위치 기억하기 게임으로는 작업 기억과 집중력을 통해 전략력을 평가해요. 마지막으로 방향 바꾸기 게임으로는 자기 조절 및 객관화를 통해 실행력을 판단하죠. 무거운 순서대로 나열하기 게임의 예시를 한 번 풀어보는건 어떨까요?

midas HRi의 인재 분석 알고리즘

각 분석 기술에 어떤 원리가 숨겨져 있는지 살펴보면 좋겠지만, 아쉽게도 몇몇 회사의 독자적인 기술이어서 각각의 원리를 파악하는 데는 어려움이 있었어요. 대신 간단하게나마 인재 분석 알고리즘을 알아보자면 다음과 같아요. AI 면접 및 역량평가에 있어서는 마이다스아이티가 우위를 점하고 있어 해당 기업의 분석 알고리즘에 대해서 알아보려고 합니다. 일단 질의 응답을 통해서, 그리고 게임 수행을 통해서 V4와 P6을 통해 지원자들이 반응을 보여주면 면접관의 평가 및 고성과자의 데이터를 기반으로 지원자의 역량을 판단하는 과정이 있어요. 각각 메타 분석, 우수 면접관 판단 결과 학습, 직군별 고성과자 특성 학습, 기업별 커스터마이징 분석이 있답니다.
먼저 역량 분석 게임으로 수집한 데이터를 기반으로 전전두엽의 기능과 관련한 메타 분석을 진행하여 지원자의 역량을 측정해요. 이후에는 우수 면접관들이 지원자들의 영상을 보고 평가한 데이터를 수집하여 판단 메커니즘을 학습하는거에요. 여기에 다양한 기업과 직군에서 일하고 있는 1~3년차 재직자들의 특성 및 이들의 응시 데이터 패턴을 분석해 이들의 역량과 지원자들의 역량을 비교할 수 있도록 데이터를 만들어요. 이렇게 한다면 재직자의 성과를 토대로 지원자의 미래 성과를 예측할 수 있겠죠? 마지막으로는 기업의 인재상과 특성에 맞춰 적합한 지원자를 선발할 수 있도록 기업별로 커스터마이징을 하면 된답니다. 최대 80% 이상의 확률로 역량을 분류할 수 있다고 하니 기업 입장에서는 정말 편리하겠는걸요?

AI 면접의 한계점

다만 이렇게 장점이 많은 AI 면접에도 몇 가지 한계점이 있는데요, 첫 번째는 투명성이에요. 위에 분석 기술의 원리를 파악하는 데에도 어려움이 있었다고 했는데요, 역량 검사에 있어서도 지원자에게는 어떠한 점이 중요하고, 어떤 내용이 검사 결과에 반영되는지/반영되지 않는지 잘 알려주지 않아서 많은 지원자들이 어려움을 겪고 있다고 해요. 특히 여기에서 가장 문제가 되는 지점은 질문과 무관한 답변이더라도 잘 걸러지지 않는 점이에요. 이 때문에 영상 확인에 많은 시간이 든다고 하니, 사실상 효율성이 좋다고만은 할 수 없겠네요.
그 다음으로는 신뢰성이에요. 특히 인천국제공항공사의 2019~2020년 AI 역량 검사 자료에 따르면 A등급을 받은 사람 가운데 최종 합격자 비율은 51%, D등급을 받은 사람 가운데 최종 합격자 비율은 35%로 높은 등급일수록 최종 합격자 비율이 다소 높았지만, 생각보다는 차이가 별로 안났다고 하네요. 특히 AI 역량 검사에 대해서 면접 위원들도 긍정적으로 평가하지 않는다는 것을 보면, 아직까지 데이터가 많이 쌓이지 않은 AI 면접의 신뢰성은 조금 더 지켜봐야 알 수 있을 것 같아요.
마지막으로 가장 문제가 되는 것은 향후 성장 가능성이에요. 인공지능에게 학습되지 않은 단어를 사용하면 잘 알아듣지 못하고, 기업들이 원하는 인재상인 ‘창의성’, ‘윤리의식’, ‘융합’ 등은 AI가 측정할 수 없기 때문에 아직까지 지원자의 창의성과 융합 역량을 확인하는 것은 어렵다고 해요. 즉, 창의적인 인재를 좋아하는 기업들도 AI 면접을 활용한다면 역설적으로 정형화된 인재를 뽑는 상황에 이른 것이죠. 다음은 AI 면접의 문제점 여러 가지를 설명하는 영상이에요. 특히 댓글에 이런저런 비판 지점이 있어 생각해볼 거리가 되는 듯 해서 가져와 봤는데, 관심 있는 분들은 한 번 시청해보시길 바랄게요.
이러한 AI의 한계점들로 인해 구글, 아마존, 페이스북 등의 글로벌 기업은 AI로 면접 자체를 보지는 않고, 지원자의 자기소개서 표절 여부를 활용하는 데에 AI를 활용하고 있어요. 면접은 교육된 면접관을 통해서 면대면으로 보고요. 하지만 국내 기업들은 AI 면접으로 서서히 바꾸고 있으며 AI 면접을 늘리고 있을 뿐, 다시 면대면 면접으로 회귀하지는 않는 것으로 보이네요. 앞으로 국내 기업들은 어떻게 채용 방식을 바꿀지 지켜보며 면접 트렌드를 익혀 나가야겠어요.
지금까지 AI 면접에 대해서 알아보았는데 어떠셨나요? 전 AI 면접에 대해서 처음 듣고 세상이 정말 발빠르게 변하고 있다... 는 생각이 들었는데요! 우리도 머지않아 취업할 때 AI 면접을 적극적으로 활용하게 되리라는 생각이 드네요. AI 면접에 대해서는 자세히 알아보고, 체험하는 과정까지 볼 수 있는 시간이었지만 정보의 한계로 인해 기술적인 원리는 제대로 파악할 수 없다는 점이 너무 아쉬운 포스팅이었어요. 다음에는 조금 더 알찬 포스팅으로 돌아올게요!
지난 번 오전 편을 거쳐 이번 오후 편까지, 두 편에 걸쳐 딥다의 하루 속 AI, NLP 기술을 찾아봤습니다. 음성 어시스턴트, 뉴스 요약 서비스, 과제 관련 AI, AI면접까지 이 기술들을 다룬 두 편의 포스트가 여러분의 완전한 궁금증까지 해소하진 못하더라도 궁금한 부분을 더 찾게 된 계기가 되었으면 좋겠네요! 앞으로 딥다의 하루에 이어, 여러분의 하루에는 어떤 자연어처리, AI 기술이 숨어있고 이와 관련해 어떤 의견이 오고가는지 더 많은 관심 가져주시길 바라요!