AI 음성인식 성능 높이는 잡음/반향 강인 음원 국지화 개발

음향기기 외

AI 음성인식 성능 높이는 잡음/반향 강인 음원 국지화 개발

기술분야

음향 신호 처리

판매 유형

직접 판매

판매 상태

판매 중

거래방식

공동연구

특허판매

라이센스

노하우

AI 요약

원거리 및 잡음, 반향 환경에서 AI 음성인식 스피커의 성능 저하가 문제였습니다. 본 기술은 이러한 한계를 극복하기 위해 분산도 마스크를 이용한 혁신적인 음원 국지화 방법 및 장치를 제안합니다. CDR(Coherence to Diffuseness ratio) 기반의 이진화 마스크를 통해 입력 신호를 전처리하고, GCC-PHAT 또는 SRP-PHAT 알고리즘을 적용하여 잡음과 반향에 매우 강인하며 정확한 음원 방향 추정을 가능하게 합니다. 이로써 음성인식률을 획기적으로 개선하고 안정적인 AI 서비스를 제공합니다. 본 기술은 차세대 AI 음성인식 시스템 개발에 필수적인 핵심 기술입니다.

기본 정보

문서 열람

기술명
분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치
기관명
서강대학교산학협력단
대표 연구자	공동연구자
박형민	-
출원번호	등록번호
1020180009446	1020882220000
권리구분	출원일
특허	2018.01.25
중요 키워드
음원 국지화잡음 제거 기술음성인식 성능교차 상관 기법소음 환경 개선인공지능 스피커스마트 디바이스분산도 마스크음향 신호 처리반향 제거 기술위치 추정 기술다중 마이크로폰CDR 알고리즘음향 공간 분석마이크 어레이음향기기인공지능

기술완성도 (TRL)

기본원리 파악

기본개념 정립

기능 및 개념 검증

연구실 환경 테스트

유사환경 테스트

파일럿 현장 테스트

상용모델 개발

실제 환경 테스트

사업화 상용운영

기본원리 파악

기본개념 정립

기능 및 개념 검증

연구실 환경 테스트

유사환경 테스트

파일럿 현장 테스트

상용모델 개발

실제 환경 테스트

사업화 상용운영

기술 소개

매도/매수 절차

기술이전 상담신청

연구자 미팅

기술이전 유형결정

계약서 작성 및 검토

계약 및 기술료 입금

문의처

서강대학교

담당자서강대학교산학협력단

이메일tlo@sogang.ac.kr

연락처02-3274-4863

보유 기술 로딩 중...