[기획] 이제는 ‘초거대 AI’ 시대…국내 빅테크 기업 개발 경쟁 후끈

네이버는 ‘하이퍼클로바’, 카카오는 ‘KoGPT’·‘민달리’ 공개
LG는 전사 차원에서 개발하고 있는 ‘엑사원’ 선보여
이동통신 3사도 기업·기관과 협력해 기술 개발 몰두

[시사포커스 / 임솔 기자] 국내 빅테크 기업들이 인공지능(AI)의 새로운 패러다임으로 부상하고 있는 ‘초거대 AI’ 개발에 박차를 가하고 있다.

초거대 AI는 지난해 5월 미국 ‘OpenAI’에서 발표한 GPT-3(Generative Pre-trained Transformer-3) 모델을 시작으로, 대용량 데이터와 슈퍼컴퓨팅 인프라를 활용해 AI의 규모를 수천억~수조개 매개변수 규모로 대폭 확장한 AI 기술이다. AI능의 성능 및 범용성이 비약적으로 향상돼 우리나라 주요 기업들도 기술 선도를 위한 초거대 AI 모델 구축에 대규모 투자를 진행 중이다.

■ 이미 하이퍼클로바 기술 상용화 시작한 네이버

네이버는 지난 5월 국내 기업 최초의 ‘초대규모 AI’인 ‘하이퍼클로바(HyperCLOVA)’를 공개했다. 그러면서 기존 한국어 AI의 패러다임을 바꾸는 ‘하이퍼클로바’를 통해 사용자, SME, 크리에이터에게 새롭고 차별화된 경험을 선보이며, ‘모두를 위한 AI’ 시대를 이끌어가겠다는 목표를 세웠다.

하이퍼클로바는 OpenAI의 GPT-3(175B)를 뛰어넘는 204B(2040억개) 파라미터(parameter, 매개변수) 규모로 개발됐다. AI 모델의 크기를 나타내는 파라미터의 수가 높아질수록, AI는 더욱 많은 문제를 해결할 수 있게 된다.

하이퍼클로바는 GPT-3보다 한국어 데이터를 6500배 이상 학습한, 현재 전세계에서 가장 큰 한국어 초거대 언어모델이기도 하다. 영어가 학습 데이터의 대부분을 차지하는 GPT-3와 달리, 하이퍼클로바 학습 데이터는 한국어 비중이 97%에 달한다. 영어 중심의 글로벌 AI 모델과 달리 한국어에 최적화한 언어모델을 개발함으로써, AI 주권을 확보한다는 의미도 있다.

이후 네이버는 하이퍼클로바의 딥러닝 기술을 음성인식 AI 엔진에도 접목해 성능을 대폭 강화했다. 클로바노트, 클로바 케어콜 등 음성인식 AI를 활용한 여러 서비스에 업그레이드된 엔진을 탑재해 더욱 편리한 사용자 경험을 제공하고 있다. 또 검색, 쇼핑 등 다양한 서비스에 하이퍼클로바 기술을 접목시키며 개발된 하이퍼클로바 기술 상용화에 속도를 내고 있다. 최근에는 독거 어르신들을 위한 ‘클로바 케어콜(CLOVA CareCall)’을 출시하기도 했다.

카카오브레인이 개발한 초거대 AI '민달리'가 명령을 수행하는 과정 예시. ⓒ카카오브레인

■ 카카오, 오는 17일 온라인으로 ‘오픈 미니 컨퍼런스’ 개최

카카오는 AI 전문 자회사 카카오브레인을 통해 초거대 AI를 개발하고 있다. 지난달 한국어 초거대 AI 언어모델 ‘KoGPT’를 공개한 데 이어 지난 15일 초거대 AI 멀티모달(multimodal) ‘민달리(minDALL-E)’를 공개했다.

우선 ‘KoGPT’는 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 구축했다. 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과값을 보여 준다. ▲주어진 문장의 긍정과 부정 판단 ▲긴 문장 한줄 요약 ▲문장을 추론해 결론 예측 ▲질문을 하면 문맥 이해해 답변하는 등 언어를 가지고 활용할 수 있는 모든 과제를 수행한다.

맥락에 따라 자동으로 글쓰기가 가능해지기 때문에 상품 소개글 작성, 감정 분석, 기계 독해, 기계 번역 등 높은 수준의 언어 과제를 해결하고 다양한 분야에서 활용할 수 있다.

지난 15일 공개한 ‘민달리’는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. Open AI의 'DALL-E'를 누구나 접근하기 쉽게 작은 사이즈 모델로 만든 것으로 1400만장의 텍스트와 이미지 세트를 사전 학습했다.

카카오브레인은 지난 달 공개한 KoGPT 모델의 성능 고도화에도 집중하고 있다. 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위/초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 연구 효율을 높였다. 아울러 KoGPT 모델의 매개변수(파라미터)를 60억개에서 300억개의 사이즈까지 5배 늘려 이전보다 더 정확하게 명령을 이행할 수 있도록 만들었다.

카카오브레인은 오는 17일 ‘오픈 미니 컨퍼런스’를 온라인으로 개최하고 ‘KoGPT’ 와 멀티모달 ‘민달리’에 관해 자세히 설명하는 자리를 갖는다. 본 행사는 카카오브레인의 최신 연구 성과와 기술 노하우, 미래 비전 등을 공유하기 위한 기술 컨퍼런스로 CEO세션을 비롯해 다양한 기술 소개를 총 집합한 19개 세션을 마련했다.

■ LG AI연구원도 ‘엑사원’ 공개

LG도 지난 14일 초거대 AI ‘EXAONE(엑사원)’을 전격 공개하고 글로벌 초거대 AI 생태계 확장을 예고했다. ‘EXAONE’은 ‘EXpert Ai for everyONE’의 축약어로, ‘인간을 위한 전문가 AI’를 의미한다.

‘EXAONE’은 국내 최대인 약 3000억개의 파라미터를 보유하고 있으며, 언어뿐 아니라 이미지와 영상에 이르기까지 인간의 의사소통과 관련된 다양한 정보를 습득하고 다룰 수 있는 멀티 모달리티(Multi-Modality) 능력을 갖췄다.

LG AI연구원은 ‘EXAONE’을 제조, 연구, 교육, 금융 등 사실상 모든 분야에서 ‘상위 1% 수준의 전문가 AI’로 활약할 수 있도록 만든다는 계획이다. AI연구원은 궁극적으로 초거대 AI를 일부 기업이 독점하는 것이 아니라, 일반 대중까지 공개하는 대중화를 통한 상생 환경 구축 방안도 검토 중이다.

지난달 10일서울 송파구에 위치한 소피텔 엠배서더 호텔에서 AI 원팀 서밋 2021 행사가 열렸다. ⓒKT

■ 이동통신 3사도 초거대 AI 기술 개발 박차

국내 이동통신사들도 초거대 AI 기술 개발에 열을 올리고 있다.

KT와 LG유플러스는 AI원팀 참여기업·기관인 동원그룹, 한국투자증권, 우리은행, 현대중공업그룹, 한국전자통신연구원(ETRI), KAIST, 한양대 등과 함께 ‘초거대 AI 모델’을 개발하고 있다. KT는 다른 참여기관들과 힘을 모아 대규모 GPU 인프라 구축, 데이터 수집/분석, 모델 학습, 응용태스크 적용 등 R&D 및 상용화 관련 업무를 총괄적으로 수행하고 있다.

AI 원팀은 올해 말까지 1차로 초거대 AI의 학습을 완료하고, 내년 상반기 내 초거대 AI모델을 상용화 한다는 계획이다. 또한 대규모 AI 연산 인프라를 구축하고, 향후 2000억 파라미터(매개변수) 이상의 모델까지 가능하도록 인프라 규모를 점진적으로 확대할 예정이다.

향후 AI 원팀은 영상/로봇 등의 복합인지, 이미지 기반 해석, 휴머니스틱 AI(인간중심 AI) 등에서 초거대 AI 모델로 영역을 확장해 나가며, 이번 연구로 개발되는 초거대 AI 모델은 ‘AI 1등 대한민국’이라는 AI 원팀의 취지에 따라 국내외 많은 기업들과 학교, 연구기관들이 AI 원팀의 초거대 모델을 활용해 한국어 언어지능에 대한 손쉽게 접근하고, 이를 다양한 산업분야에 활용하도록 지원할 계획이다.

SK텔레콤은 카카오와 AI 공동 개발 등에 협력하기로 하고, 조만간 1500억개 파라미터를 가진 초거대 AI ‘GLM’를 발표할 계획이다. SK텔레콤은 또 국립국어원의 언어 정보를 활용하여 한국어에 최적화된 차세대 AI 언어 모델을 개발하기로 했다.

GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있으며, 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대된다.

상단영역

본문영역