기술이전
검색 도구를 불러오는 중...
기존 음원 위치 탐지 기술은 반향 환경이나 음성 신호의 높은 상관도로 인해 정확도 저하와 시간 지연 파악에 어려움이 있었습니다. 본 기술은 음향 채널 필터 계수의 '성김(sparsity)' 특성을 다채널 최소 평균 제곱법에 적용하여 이 한계를 극복합니다. 이 방법은 음원에서 센서까지의 직접 경로 시간 지연을 더욱 정확하게 추정하며, 반향이 심한 환경에서도 안정적인 음원 위치 파악이 가능하도록 하여 탐지 정확도를 획기적으로 개선합니다.
소음 환경에서 음성 인식 성능 저하는 중요한 문제입니다. 본 발명은 이러한 문제 해결을 위해, 마이크로폰에 대한 타겟 음원의 도달 방향 정보를 활용하여 독립 성분 분석(ICA) 기반의 실시간 타겟 음성 분리 방법을 제안합니다. 이 기술은 입력 신호에서 타겟 음성 신호를 정확하게 분리하고 노이즈를 효과적으로 제거하여, 기존 방법 대비 계산량을 대폭 감소시키고 음성 인식의 정확도와 강인한 특성을 획기적으로 향상시킵니다. 특히, 널포머를 이용한 더미 출력 설정과 비용 함수 최적화를 통해 안정적인 음성 신호 추출이 가능하여, 다양한 소음 환경에서도 뛰어난 음성 인식 성능을 제공합니다. 이 혁신적인 기술은 음성 인식 시스템의 전처리 단계 효율을 극대화하여 사용자 경험을 개선합니다.
기존 음성인식 시스템은 예측 불가능한 소음 환경에서 성능 저하를 겪는 문제가 있었습니다. 특히 DNN 기반 기술 또한 훈련 환경과 실제 환경 간의 불일치 시 정확도가 급락하는 한계가 존재했습니다. 본 기술은 DCICA(DOA Constrained Independent Component Analysis)를 DNN(Deep Neural Network) 기반 특징 향상 기술과 융합하여 이러한 문제점을 해결합니다. DCICA가 추출한 타겟 및 잡음 추정 신호를 DNN 학습에 활용함으로써, 다양한 소음 조건에서도 음성 신호의 특징을 적응적으로 강화하여 음성 인식 성능을 획기적으로 개선합니다. 이로써 예측 불가능한 실제 환경에서도 안정적이고 높은 정확도의 음성 인식을 실현할 수 있습니다.
스테레오 음악에서 고품질 반주 추출은 오랜 과제였습니다. 본 발명은 스테레오 음악신호에서 노래 음성 신호를 정교하게 분리하고, 손실될 수 있는 하모닉 및 타악 신호를 재조합하여 원곡에 가까운 고품질의 반주 신호를 추출하는 혁신 기술을 제공합니다. 패닝 프로세싱과 메디안 필터링 기법을 활용하여 보컬 분리 정확도를 높였으며, 향상된 계산 속도로 모바일 환경에서도 즉각적인 반주 서비스 이용이 가능하도록 합니다. 이 기술은 가라오케, 멜로디 전사 등 다양한 분야에서 활용될 수 있습니다.
기존 기술은 액체 내 기포의 생성 및 제거에 한계가 있었습니다. 본 발명은 초음파를 이용하여 액체 내 미세 기포(1~100μm)의 체적을 정밀하게 조절하는 방법과 장치를 제안합니다. 특정 공진 주파수의 초음파와 액면 높이 조절을 통해 다중 공진 효과를 극대화하여 기포의 성장, 수축, 제거를 안정적으로 제어합니다. 이는 의료용 진단 및 약물전달, 화학적 혼합, 초음파 세척 등 다양한 산업 분야의 혁신적인 발전에 기여할 것으로 기대됩니다. 이 기술은 정밀한 기포 제어가 필요한 분야에 새로운 가능성을 제시합니다.
기존 음원 위치 탐지 기술은 반향 환경에서의 성능 저하 및 대량 데이터 요구 등의 문제점을 안고 있습니다. 본 발명은 이러한 한계를 극복하고 음원의 위치를 정확하게 탐색하는 방법을 제공합니다. 두 개의 마이크 센서로 입력된 신호 간의 오차 신호를 분석하여 비용 함수값을 최소화하고, 이를 통해 음원의 지연 시간 및 방향을 정밀하게 검출합니다. 이 기술은 특히 반향이 있는 환경에서도 음원의 경로차를 효과적으로 파악하여 음원의 정확한 위치와 방향을 파악할 수 있도록 돕습니다.
원거리 및 잡음, 반향 환경에서 AI 음성인식 스피커의 성능 저하가 문제였습니다. 본 기술은 이러한 한계를 극복하기 위해 분산도 마스크를 이용한 혁신적인 음원 국지화 방법 및 장치를 제안합니다. CDR(Coherence to Diffuseness ratio) 기반의 이진화 마스크를 통해 입력 신호를 전처리하고, GCC-PHAT 또는 SRP-PHAT 알고리즘을 적용하여 잡음과 반향에 매우 강인하며 정확한 음원 방향 추정을 가능하게 합니다. 이로써 음성인식률을 획기적으로 개선하고 안정적인 AI 서비스를 제공합니다. 본 기술은 차세대 AI 음성인식 시스템 개발에 필수적인 핵심 기술입니다.
스피커 사용 환경에서 발생하는 스테레오 에코 신호는 음성 통신 품질을 저하시키는 주요 원인입니다. 본 기술은 이러한 스테레오 노이즈를 효과적으로 제거하여 선명한 음성 신호를 제공하는 장치 및 방법을 제안합니다. 이전 및 현재 프레임의 Far-end 채널필터를 기반으로 추정 출력신호를 계산하고 이를 업데이트하여, 입력신호로부터 노이즈 신호를 정교하게 제거합니다. 이 기술은 스테레오 환경뿐만 아니라 모노 또는 3개 이상의 다중 노이즈 소스에도 적용 가능하여, 다양한 음향 환경에서 깨끗한 음성 전달을 가능하게 합니다. 통화 품질 향상, 컨퍼런스 시스템 등 폭넓은 분야에 활용될 수 있습니다.
마이크와 스피커 사용 환경에서 발생하는 스테레오 에코 노이즈는 음성 통화 품질을 저해하는 주요 문제입니다. 본 발명은 이러한 문제점을 해결하고자 입력 신호에 포함된 파-엔드 신호의 분산에 따라 채널 필터를 업데이트하여, 스테레오 에코 신호를 효율적으로 제거하는 장치와 방법을 제공합니다. 이를 통해 사용자에게 노이즈가 제거된 선명한 음성 신호를 제공하여 더욱 깨끗한 통신 환경을 구현합니다.