네이버, '챗GPT 대비 한국어 6500배 학습한 '하이퍼클로바X' 7월 공개...'서치GPT' 하이퍼클로바X 기반 출시할 것
네이버가 '챗GPT'에 비해 한국어를 6500배나 더 많이 학습한 초거대 AI(인공지능)의 후속 버전인 '하이퍼클로바X'를 7월 중 선보일 계획이다. 또 네이버는 하이퍼클로바X 기술을 바탕으로 개발되는 차세대 검색인 '서치GPT'의 기술에 대해 소개했다. 서치GPT를 통해 네이버가 20년간 쌓아온 사용자들의 검색 흐름 데이터를 모델링해 최적의 경로를 안내한다고 밝혔다. 김유원 네이버클라우드 대표는 27일 코엑스 그랜드 볼륨에서 국내 최대 규모의 개발자 콘퍼런스인 '데뷰(DEVIEW) 2023' 행사에서 "'하이퍼클로바'는 세계에서 3번째로 발표됐고 한국어로는 최초로 개발된 초거대 AI"라며 "커스텀 기능을 이용하면 자신이 가진 데이터로 자신 만의 하이퍼스케일 AI를 구울 수 있다. 사용자 니즈에 맞는 응답을 즉각 제공할 수 있으며, 더 많은 사람이 AI의 경쟁력을 누릴 수 있게 된다"고 밝혔다. 김 대표는 "하이퍼클로바X를 위해 하이퍼스케일 인프라가 필요하며 인프라 비용이 많이 요구된다"며 "네이버는 AI 반도체 솔루션을 삼성전자와 공동 개발하고 있으며, 데이터센터도 각 춘천에 이어 각 세종을 조만간 오픈할 계획"이라고 밝혔다. 그는 이어 "일본 시장에서 넘버 1을 차지하고 있는 비즈니스 메신저인 '네이버웍스'에 AI 기술을 더 하면 기업의 디지털 전환을 이끄는 DX 플랫폼으로 발전할 수 있다. 슈퍼 앱으로 성장하게 되는데, 네이버의 제 2 사옥인 '1785'에서 이 같은 실험을 시작했다"고 설명했다. 그는 "최근 네이버클라우드를 중심으로 기술 조직을 통합했으며, 클라우드에 하이퍼스케일 AI의 날개를 달아 본격적인 도약을 하려 한다"며 "인프라 기술 위에 하이퍼스케일이 더 해지고 인프라, 플랫폼, 서비스까지, AI 혁신을 위한 완전한 구조를 갖추게 된다"고 말했다. 성낙호 네이버클라우드 하이퍼스케일AI 기술 총괄은 "하이퍼클로바X는 2020년 9월부터 진행해온 하이퍼클로바의 개선된 버전으로 우리의 생산성을 높여줄 준비가 됐다"며 "누구나 자신 만의 하이퍼스케일 AI로 스타트업, 파트너들과 공유해 AI 생태계를 만들 수 있다. 네이버는 잘 만들어진 백본과 대규모 데이터, 대규모 슈퍼컴퓨팅 인프라를 갖춰 잘 운영할 기술과 노하우를 보유하고 있다. 초대규모 AI에서 의미 있는 성과를 만들고자 노력을 경주하고 있다"고 밝혔다. 성 총괄은 "클라우드에서 잘 서비스될 수 있도록 데이터로 학습된 초대규모 AI는 급격히 발전했지만 비효율이 있었던 것도 사실이다. 비효율을 극복하기 위해 연구 개발에 노력했으며 더 작은 모델 크기에서도 더 높은 성능을 내는 효율적인 AI가 만들어졌다"며 "규모를 늘리고 효율화 노력을 병행한 결과, 하이퍼클로바X가 만들어졌다. 하이퍼클로바X는 한국어능력시험에서 경쟁사의 모델 대비 더 높은 성능을 보여준다"고 설명했다. 그는 "하이퍼클로바는 지식인 처럼 질문을 입력하며 깔끔하게 정리된 답변을 볼 수 있다. 강력한 백본이기 때문에 약간의 지식 만으로 이러한 능력을 갖춰나갈 수 있다. 하이퍼클로바는 읽기, 쓰기, 검색, 요약 등에서 강력한 내재능력을 발휘한다"고 강조했다. 이와 함께 김용범 네이버 서치US 치프 사이언티스트는 네이버가 개발하고 있는 '서치GPT'에 대한 특성을 밝혔다. 네이버는 올 상반기 중 '서치GPT'를 출시할 계획이다. 김 사이언티스트는 "서치GPT를 활용하면 '인핸스드 네이밍'이라고 신뢰성이 강조된 답변을 채택할 수 있으며, 네이버 검색에 특화된 제너러티브 서치를 개발했다"며 "서치GPT는 트러스트 워씨, 커넥티드, 멀티모달의 특성을 가지고 작동할 것"이라고 밝혔다. 그는 "생성AI에게 신뢰성 보장은 어려운 데, 수많은 할루시네이션 현상으로 그럴 듯한 거짓말을 한다. 서치AI는 정보의 신뢰할 수 있는 결과를 제공해 정보의 신뢰성이 있다. 네이버 콘텐츠 생태계에서 사실에 기반한 정보들을 불러 최신 이슈 및 트렌드 정보를 얻을 수있다. 또 다양한 네이버 서비스 통계 기반 정보를 포함한다. 서로 다른 유형의 피드백을 활용해 입체적인 피드백을 구축하며 강화학습 모델의 정확성을지속적으로 개선했다. 최신성 답변 생성에 사용했던 출처를 제공할 수 있으며, 추가 질문도 가능하다"고 설명했다. 이어 "커넥티드로 네이버의 모든 정보를 연결해 답변을 생성하며, 콘텐츠 생산자와 소비자를 연결하게 된다. 사용자 골을 달성할 수 있는 최적의 블루프린트를 설계해준다"며 "사용자의 요청과 응답에 맞는 멀티모달이 존재하는 데, 멀티모달 모델을 사용하면 백본 모델 이미지를 여러 서비스에 활용할 수 있다. 사용자가 촬영한 인테리어 공간에서 파란색 소파를 구입할 수 있는 쇼핑 정보를 보여준다. 이를 통해 서치GPT의 경험을 한단계 높여준다"고 말했다. 또 곽용재 네이버클라우드 CTO는 "소프트웨어, 하드웨어, 운영환경을 묶어 통합적인 기능을 제공한다. 하이퍼스케일을 위해 저가 고속 반도체 솔루션을 개발하고 있으며, AI 서비스를 안정적으로 할 수 있는 클라우드 데이터센터를 구축하고 있다"고 밝혔다. 그는 "삼성전자와 개발 중인 AI반도체 솔루션은 LLM(대규모언어모델)의 연산과 학습, 추론에 필요한 기능을 갖추면서도 기존 GPU(그래픽처리장치) 대비 1/10의 모델 사이즈로 4배 이상의 전력효율을 낼 수 있게 된다"며 "국내 인터넷업계 최초로 IDC인 '각 춘천'을 구축한 데 이어 올해 '각 세종'을 오픈할 계획이다. 대지면적만 축구장의 41배 크기에 달하며, 춘천의 7배에 달하는 전원 공급 능력도 갖추고 있다"고 설명했다.