
AI 음성인식 성능 높이는 잡음/반향 강인 음원 국지화 개발
AI 요약
원거리 및 잡음, 반향 환경에서 AI 음성인식 스피커의 성능 저하가 문제였습니다. 본 기술은 이러한 한계를 극복하기 위해 분산도 마스크를 이용한 혁신적인 음원 국지화 방법 및 장치를 제안합니다. CDR(Coherence to Diffuseness ratio) 기반의 이진화 마스크를 통해 입력 신호를 전처리하고, GCC-PHAT 또는 SRP-PHAT 알고리즘을 적용하여 잡음과 반향에 매우 강인하며 정확한 음원 방향 추정을 가능하게 합니다. 이로써 음성인식률을 획기적으로 개선하고 안정적인 AI 서비스를 제공합니다. 본 기술은 차세대 AI 음성인식 시스템 개발에 필수적인 핵심 기술입니다.
기본 정보
기술명 | |
분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치 | |
기관명 | |
서강대학교산학협력단 | |
대표 연구자 | 공동연구자 |
박형민 | - |
출원번호 | 등록번호 |
1020180009446 | 1020882220000 |
권리구분 | 출원일 |
특허 | 2018.01.25 |
중요 키워드 | |
음원 국지화잡음 제거 기술음성인식 성능교차 상관 기법소음 환경 개선인공지능 스피커스마트 디바이스분산도 마스크음향 신호 처리반향 제거 기술위치 추정 기술다중 마이크로폰CDR 알고리즘음향 공간 분석마이크 어레이음향기기인공지능 |
기술완성도 (TRL)
기본원리 파악
기본개념 정립
기능 및 개념 검증
연구실 환경 테스트
유사환경 테스트
파일럿 현장 테스트
상용모델 개발
실제 환경 테스트
사업화 상용운영
기술 소개
매도/매수 절차
기술이전 상담신청
연구자 미팅
기술이전 유형결정
계약서 작성 및 검토
계약 및 기술료 입금

서강대학교
보유 기술 로딩 중...
인기 게시물 로딩 중...