특허 상세 보기 글쓰기

특허 상세 보기

[KO] 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법

[EN] Method for Natural Langage Understanding Based on Distribution of Task-specific Labels
  • 출원번호 10-2017-0104871 출원일 : 2017.08.18
  • 등록번호 10-2012404-0000 등록일 : 2019.08.13
  • 법적상태
    • 등록
    • 소멸
Contact point
동아대학교 산학협력단 기술사업화팀 김기연 051 - 200 - 6534 kky1216@dau.ac.kr
출원인
구분 이름 국적 주소
1 동아대학교 산학협력단 국적 : 대한민국 주소 : 부산광역시 사하구...
발명자
구분 이름 국적 주소
1 고영중 국적 : 주소 : 부산광역시 해운대구...
2 유홍연 국적 : 주소 : 울산광역시 북구...
3 윤정민 국적 : 주소 : 부산광역시 북구...
4 안재현 국적 : 주소 : 부산광역시 연제구...
대리인
구분 이름 국적 주소
1 국적 : 주소 :
요약
본 발명은 기존의 일반적인 단어 임베딩 벡터가 언어 분석기별 특징을 잘 표현하지 못하는 문제점을 언어 분석기별 정답 레이블 분포 벡터를 결합하여 해결함으로써, 기존 시스템과 비교하여 성능을 향상하는 방법을 제공하기 위한 것으로서, (A) 학습 모델로 Bidirectional LSTM CRF를 이용하여 한국어 개체명을 인식하는 단계와, (B) 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반 단어 임베딩 벡터 중 적어도 하나를 사용하여 입력되는 단어 표상을 확장하는 단계와, (C) 상기 확장된 단어 표상으로 LSTM을 이용하여 단어를 이루고 있는 음절 단위의 벡터들을 결합하여 단어 단위 벡터 및 분석기별 정답 레이블 분포 벡터를 결합하는 단계와, (D) 분포 벡터에 활성화 함수인 소프트맥스(softmax)를 이용하여 확률로 변환하여 모델로 입력하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
IPC
G06F 40/205(2020.01.01)
G06F 40/279(2020.01.01)
G06F 40/268(2020.01.01)
G06N 3/044(2023.01.01)
CPC
G06F 40/205(2020.01)
G06F 40/279(2020.01)
G06F 40/268(2020.01)
G06N 3/044(2023.01)
  • TEL. 051. 200. 6498
    FAX. 051. 200. 6507
    ADDRESS. 49315 부산광역시 사하구 낙동대로 550번길 37(하단동)
    산학관(S14) 3층 301호 314호 316호
COPYRIGHT ⓒ 2023 동아대학교산학렵력단 ALL RIGHT RESERVED.