[비바100] 사람에 가까운 AI… IT 업계, '초거대 AI' 개발 각축전

[테크리포트] 대용량 데이터를 스스로 학습, 사람처럼 종합적으로 추론하는 '초거대 AI'

입력 2022-11-14 07:00
신문게재 2022-11-14 12면

(사진=UNSPLASH)

지난 2016년 구글 딥마인드의 ‘알파고’와 이세돌 9단의 바둑 대결이 펼쳐진 후 인공지능(AI)은 전 세계적인 화두로 떠올랐다. 기존 기계가 주로 담당하던 제어, 연산뿐 아니라 사람의 고유 영역이었던 인지·추론·판단까지 가능한 AI는 이제 IT를 넘어 산업 전반에 다양하게 활용되고 있다.

이러한 가운데 빅테크 기업을 중심으로 집중 연구 중인 AI 분야가 있다. 바로 ‘초거대 AI’다. 지난 2020년 글로벌 AI 기업 ‘오픈AI’가 초거대 AI 언어모델 ‘GPT-3’를 공개하면서 초거대 AI 개발은 급물살을 탔다. 이론상 파라미터가 많을수록 AI가 더 정교한 학습을 할 수 있는데, GPT-3는 무려 1750억개의 파라미터를 갖췄다. 이는 기존 GPT-1의 1000배, GPT-12의 117배에 달한다.

국내에서도 초거대 AI에 대한 연구가 활발히 진행 중이다. KT와 카카오, 네이버 등이 초거대 AI 개발에 나선 대표적인 기업들이다.

KT 목동IDC2센터에 시범 적용된 ‘AI IDC 오퍼레이터’를 KT 직원들이 모니터링하고 있다. (사진제공=KT)

KT는 ‘AI 원팀’을 통해 초거대 AI 개발을 진행하고 있다. 지난 2020년 2월 출범한 AI 원팀에는 KT를 비롯해 현대중공업그룹, 동원그룹, 한국투자증권, 한국과학기술원(KAIST), 한국전자통신연구원(ETRI) 등 국내 여러 산·학·연이 모였다.

초거대 AI를 개발하려면 데이터 정제, 학습 알고리즘, 분산·병렬학습, 경량화, 응용모델 발굴 등 다양한 분야의 연구가 필요하다. 이에 KT는 AI 원팀에서 기업의 대규모 투자를 통해 대규모 그래픽처리장치(GPU) 인프라를 구축하고 학교와 연구기관은 최신의 연구 동향을 반영한 기술을 제공하는 산·학·연 협력 모델을 도입했다.

KT와 AI 원팀은 연내 초거대 AI 모델을 상용화한다는 계획이다. 대규모 AI 연산 인프라를 구축하고 향후 2000억 파라미터 이상의 모델까지 가능하도록 인프라 규모를 점진적으로 확대한다.

특히, KT의 초거대 AI는 즉시 상용화가 가능한 과제 지향적 형태로 설계된다. 초거대 언어모델을 통해 향상된 STT(Speech to Text), 대화, TTS(Text to Speech) 등의 기술은 ‘KT 기가지니’와 ‘AICC’ 서비스 고도화를 위해 활용된다.

KT 관계자는 “‘AI 1등 대한민국’이라는 AI 원팀의 취지에 따라 국내외 많은 기업과 학교, 연구기관들이 AI 원팀의 초거대 AI 모델을 다양한 산업분야에 활용하도록 협력하겠다”며 “이를 통해 우리나라 산업 발전에 이바지할 것”이라고 말했다.

생물학자 최재천 교수가 네이버 ‘클로바 케어콜’을 체험한 후 소감을 말하고 있다. (사진제공=네이버)

네이버는 지난해 5월 국내 기업 최초로 자체 개발한 초거대 AI ‘하이퍼클로바’를 공개했다. 하이퍼클로바는 2040억개 파라미터 규모로 개발됐으며 한국어 데이터 학습량은 GPT-3의 6500배 이상이다.

현재 여러 네이버 서비스에 하이퍼클로바가 적용돼 활약하고 있다. 네이버의 대표 서비스 ‘검색’에서는 사용자가 오타를 입력하거나 맞춤법을 잘못 입력하는 경우, 혹은 잘못 알고 있는 검색어를 입력할 땐 하이퍼클로바가 올바른 단어로 전환해 검색하거나 적절한 검색어를 추천한다.

음성 검색의 경우 사용자 발화 맥락에 대한 이해도를 높여 △대용어 포함 모든 발화에 연속발화 적용 △긴 구어체나 어려운 질의를 키워드형으로 자동 변환 △음성인식 오류 감소 등으로 성능을 크게 개선했다.

노코드 AI 플랫폼 ‘클로바 스튜디오’는 코드가 아닌 자연어 지시문 및 예제만 제시하면 누구나 간단히 사용하도록 돕는다. 이로 인해 AI나 코딩 관련 지식이 없는 기획자, 마케터 등도 쉽게 AI의 적용 가능성을 탐색할 수 있다.

‘클로바 케어콜’의 방대한 학습 데이터 생성에도 하이퍼클로바 기술이 활용됐다. 이를 통해 독거 어르신 등 돌봄이 필요한 사람과 편안하고 자유롭게 대화하며 정서적인 지지까지 보낸다.

쇼핑 부문의 ‘클로바 MD’는 네이버의 쇼핑 기획전 자동 생성 AI로, 하이퍼클로바가 탑재돼 실제 쇼핑기획자(MD)처럼 기획전 주제 선정부터 제목 작성, 상품 선택까지 기획전 구성의 거의 모든 과정을 자동화해 수행한다.

네이버 관계자는 “네이버는 ‘모두를 위한 AI’라는 방향성 아래 하이퍼클로바를 모델 개발에 그치지 않고 다양한 네이버 서비스에 폭넓게 적용, 사용자 가치를 창출하고 초대규모 AI의 일상화에 앞장서고 있다”고 강조했다.

카카오는 AI 연구 전문 자회사 카카오브레인을 통해 지난해 말부터 초거대 AI 개발 성과를 공개하고 있다.

카카오브레인의 이미지 생성모델 ‘만달리’가 그린 이미지 예시. (이미지제공=카카오)

카카오브레인은 지난해 11월 자체 개발한 한국어 특화 초거대 AI 언어 모델 ‘KoGPT’를 최대 오픈소스 커뮤니티 깃허브에 ‘KoGPT’를 공개했다. GPT-3 모델의 한국어 특화 AI 언어모델인 KoGPT는 300억개의 매개변수와 2000억개 토큰의 한국어 데이터를 바탕으로 만들었다.

지난 8월에는 KoGPT를 기반으로 시 쓰는 AI 시인 ‘시아’를 선보였다. 미디어아트 그룹 슬릿스코프와 협업해 탄생한 시아는 인터넷 백과사전, 뉴스 등을 읽으며 한국어를 공부하고, 약 1만 3000여편의 시를 읽고서 작법을 배워 시를 쓸 수 있게 됐다. 8월 첫 번째 시집 ‘시를 쓰는 이유(총 53편)’를 출간했으며 현재 1쇄가 완판됐다.

카카오브레인은 언어모델뿐 아니라 AI 멀티모달 이미지 생성 모델의 고도화에도 힘쓰고 있다. 카카오브레인은 지난해 12월 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델 ‘minDALL-E(민달리)’를, 올해 민달리의 업그레이드 버전 ‘RQ-Transformer’를 공개했다.

이어 카카오브레인은 두 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트 ‘칼로’를 선보였다. 칼로는 1.2억장 규모의 텍스트-이미지 데이터셋을 학습해 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지를 생성할 수 있다.

최근에는 초거대 이미지-텍스트 데이터셋 ‘코요’를 추가 공개했다. 약 7억 4000만개의 이미지-텍스트로 이루어진 데이터셋 코요는 독자 개발한 기술로 이미지-텍스트를 온라인에서 자동 수집함으로써 투입되는 비용과 시간을 효과적으로 줄이고, 양질의 데이터를 선별해 높은 성능을 구현했다.

김일두 카카오브레인 대표는 “AI가 사람처럼 생각하고 말하려면 어떤 요소가 필요할지, AI에게 기억력, 추론 능력, 이해 능력이 있다면 사람처럼 소통할 수 있을지 등 끝없이 질문을 던지며 연구하고 있다”며 “연구자들의 기술 접근성을 높이자는 취지에서 오픈소스로 공개해 국내 IT 생태계 기술 발전에 기여할 것”이라고 말했다.

박준영 기자 pjy60@viva100.com

기자의 다른기사보기 >

#시리즈 #테크리포트