메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

SKT, 자체 LLM 기술로 초거대 AI 모델 도전

SK텔레콤 사옥. /뉴시스

SK텔레콤은 24일 오픈소스 플랫폼 '허깅페이스(Hugging Face)'를 통해 자체 구축한 대규모 언어모델 'A.X 3.1'을 공개했다. 총 340억개(34B)의 파라미터를 기반으로 한 이번 모델은 모델 설계부터 학습까지 전 과정을 자체 기술로 완성한 '프롬 스크래치(From Scratch)' 방식으로 개발됐다.

 

A.X 3.1은 이전 버전인 A.X 3.0의 대화 성능을 바탕으로 코드 및 수학 처리 능력을 크게 개선한 모델이다. 이번 공개를 통해 SKT는 A.X 3.1 표준형과 경량형, 그리고 대규모 학습(CPT, Continual Pre-Training)을 거친 A.X 4.0 표준형과 경량형까지 총 4종의 모델을 오픈소스로 제공하게 됐다. 이 모델들은 학술 및 상업적 목적으로 자유롭게 활용 가능하다.

 

A.X 3.1은 상위 모델인 A.X 4.0(72B)에 비해 파라미터 수는 절반 이하지만, 동일한 한국어 기반 서비스에 적용 시 약 90% 수준의 성능을 보인다. KMMLU 벤치마크에서는 A.X 3.1이 69.2점을 기록해 A.X 4.0의 78.3점 대비 약 88%, CLIcK 벤치마크에서는 각각 77.1점과 85.7점으로 약 90% 수준의 성능을 보였다.

 

한편 SK텔레콤은 자사 모델을 중심으로 다양한 기업·기관과 컨소시엄을 구성해 과학기술정보통신부의 '독자 AI 파운데이션 모델' 사업에 참여 중이다. 컨소시엄에는 크래프톤, 포티투닷, 리벨리온, 라이너, 셀렉트스타 등 다양한 산업군의 기업과 서울대, KAIST 연구진이 함께하고 있으며 SK하이닉스, SK이노베이션 등도 사용 의향서를 제출했다.

 

SK텔레콤은 텍스트뿐 아니라 이미지, 음성, 영상 등 다양한 데이터를 통합적으로 처리할 수 있는 '옴니모달(Omni-Modal)' 기술을 적용한 초거대 AI 모델 개발을 추진하고 있다. 또한 기존 트랜스포머 구조를 넘어서는 새로운 모델 구조에 대한 연구도 함께 진행 중이다.

 

SK텔레콤은 이러한 기술 개발을 통해 국내 AI 생태계의 자립성과 경쟁력을 높인다는 계획이다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr