메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
사회 > 보도자료

강승식 국민대 교수팀, ‘한국어 형태소 분석과 단어 임베딩’ 기술 개발

국민대학교 전경/국민대 제공

국민대학교(총장 임홍재)는 강승식 소프트웨어학부 교수 연구팀이 딥러닝 언어처리에서 필수적으로 요구되는 한국어 형태소 분석기(KLT2000)를 파이썬 플랫폼에서 편리하게 활용할 수 있는 임베딩 기술을 개발했다고 17일 밝혔다.

 

KLT2000 형태소 분석기는 국내외 최고 수준의 언어처리 기술로써 강승식 교수 연구팀은 이를 기반으로 한국어 워드 임베딩 모델을 개발했다. 이 모델은 딥러닝 언어처리 기술 수준을 한 단계 향상시키는데 활용되며 국내외 연구자들이 자유롭게 사용할 수 있다.

 

한국어 워드 임베딩 모델은 IT융합 시대의 국가경쟁력 확보를 위해 SW기반 원천기술 확보를 목적으로 수행됐던 과학기술정보통신부의 차세대정보컴퓨팅 사업(과제명: 한국어 정보처리 원천기술 연구개발)의 결과물로 구축된 국내 최대 규모의 한국어 원시말뭉치(7억3000만 어절, 49000만 문장)를 기반으로 개발됐다.

 

강승식 교수는 "단어 벡터를 이용한 추론 기능과 단어간 유사도 계산 및 연관관계 분석 기술은 대용량 텍스트 분석, 딥러닝 언어처리, 텍스트마이닝 등 한국어 언어처리와 관련된 다양한 연구 분야에서 활용돼 언어처리 기술과 자연어처리 분야의 학문 발전에 매우 큰 기여를 할 것으로 기대된다"고 말했다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr