기술이전 상세 정보를 불러오는 중입니다...
한국어의 교착어 특성으로 인해 기존 개체명 인식 기술은 미등록어 및 복합명사 처리 시 정확도 저하 문제를 겪어왔습니다. 본 발명은 이러한 문제점을 해결하기 위해, 한국어 개체명이 어절 어두에 위치하는 경향을 효과적으로 활용하는 새로운 개체명 인식 방법 및 장치를 제안합니다. 텍스트를 음절 바이그램으로 분할하고, 어절 어두 음절 바이그램에 특수 표식을 부가하여 임베딩을 생성함으로써 의미적 모호성을 해소합니다. 이를 통해 구축된 룩업테이블과 딥러닝 기반 알고리즘(LSTM-CRF)을 활용하여 질의문장의 개체명을 기존보다 월등히 높은 정확도로 인식할 수 있습니다. 본 기술은 한국어 자연어 처리 분야의 성능 향상에 크게 기여합니다.
기술명 | |
한국어 개체명 인식방법 및 장치 | |
기관명 | |
서강대학교산학협력단 | |
대표 연구자 | 공동연구자 |
서정연 | - |
출원번호 | 등록번호 |
1020170134970 | 1019416920000 |
권리구분 | 출원일 |
특허 | 2017.10.18 |
중요 키워드 | |
교착어 특성정확도 향상기계학습자연어 처리LSTM-CRF음절 바이그램딥러닝 알고리즘의미적 모호성 해결임베딩 학습텍스트 분석한국어 개체명 인식어절 어두 정보언어 모델미등록어 처리룩업 테이블인공지능소프트웨어 |
기술이전 상담신청
연구자 미팅
기술이전 유형결정
계약서 작성 및 검토
계약 및 기술료 입금
보유 기술 로딩 중...
인기 게시물 로딩 중...