기술이전 상세 정보를 불러오는 중입니다...
소음 환경에서 음성인식 정확도가 저하되는 문제에 직면하고 계십니까? 본 기술은 화자의 입술 영상과 입술 주변 랜드마크의 패치 영상을 컨볼루션 뉴럴 네트워크(CNN)로 학습시켜, 기존 음성인식의 한계를 획기적으로 극복합니다. 라벨 변형기를 활용한 영상 길이 조절로 학습 데이터 양을 극대화하며, 이를 통해 어떠한 환경에서도 뛰어난 음성인식 성능을 제공합니다. 고도화된 AI 음성인식 기술 도입으로 비즈니스 혁신을 이루시길 바랍니다.
기술명 | |
음성인식 장치 및 음성인식 장치의 동작방법 | |
기관명 | |
서강대학교산학협력단 | |
대표 연구자 | 공동연구자 |
박형민 | - |
출원번호 | 등록번호 |
1020190068439 | 1022449670000 |
권리구분 | 출원일 |
특허 | 2019.06.11 |
중요 키워드 | |
음성인식 성능 향상노이즈 제거 기술시각 정보 활용음성 분석패치영상랜드마크 영상음성인식AI 음성인식음성 인식 장치지능형 음성인식딥러닝 기반 음성인식영상 처리 기술입술영상음성인식 솔루션컨볼루션 뉴럴 네트워크인공지능음악 스트리밍 |
기술이전 상담신청
연구자 미팅
기술이전 유형결정
계약서 작성 및 검토
계약 및 기술료 입금
보유 기술 로딩 중...
인기 게시물 로딩 중...