
발화자 위치 기반 빔포밍 음성인식 장치 개발
AI 요약
기존 음성인식 시스템은 주변 노이즈로 인해 정확도 저하 문제를 겪고 있습니다. 본 발명은 이러한 문제점을 해결하고자 소리 입력신호와 영상 입력신호를 동시에 분석하는 혁신적인 음성인식 장치 및 동작방법을 제안합니다. 발화자의 입술 움직임 및 얼굴 영역 영상 정보를 활용하여 발화자의 정확한 위치를 파악하고, 주변 잡음원의 위치를 식별합니다. 이를 바탕으로 빔포밍 기술을 적용, 발화자의 음성은 선명하게 증폭하고 불필요한 잡음은 효과적으로 제거하여 음성인식의 성능을 대폭 향상시킵니다. 이 기술은 스마트 기기, AI 스피커 등 다양한 음성인식 기반 시스템에 적용되어 더욱 정확하고 안정적인 사용자 경험을 제공할 수 있습니다.
기본 정보
기술명 | |
음성인식 장치 및 음성인식 장치의 동작방법 | |
기관명 | |
서강대학교산학협력단 | |
대표 연구자 | 공동연구자 |
박형민 | - |
출원번호 | 등록번호 |
1020190052951 | 1022085360000 |
권리구분 | 출원일 |
특허 | 2019.05.07 |
중요 키워드 | |
지능형음성시스템입술움직임분석음성인식음성인식정확도오디오비디오융합음향신호처리빔포밍노이즈캔슬링음원분리기술발화자위치인식스마트음성비서AI음성처리소음제거기술음성데이터처리영상신호처리디지털신호인공지능 |
기술완성도 (TRL)
기본원리 파악
기본개념 정립
기능 및 개념 검증
연구실 환경 테스트
유사환경 테스트
파일럿 현장 테스트
상용모델 개발
실제 환경 테스트
사업화 상용운영
기술 소개
매도/매수 절차
기술이전 상담신청
연구자 미팅
기술이전 유형결정
계약서 작성 및 검토
계약 및 기술료 입금

서강대학교
보유 기술 로딩 중...
인기 게시물 로딩 중...