연구자 정보를 불러오는 중입니다...
서강대학교 전자공학전공 박형민 교수님은 음성 및 음향 신호처리 분야의 권위 있는 연구자입니다. 교수님은 소음 환경에서의 음성인식 정확도 저하 문제, 다중 음원 분리의 어려움, 그리고 제한적인 정보로 인한 인공지능 시스템의 한계 등을 해결하는 데 집중하고 있습니다. 특히, 빔포밍, 독립 성분 분석(ICA), 딥러닝(DNN) 등 최첨단 기술을 활용하여 음성 향상, 음원 분리 및 위치 탐지, 멀티모달 데이터 융합 기술을 개발하고 있습니다. 이러한 연구는 AI 음성 비서, 스마트홈 기기, 자율주행 차량, 재난 안전 시스템 등 다양한 분야에서 혁신적인 성능 향상을 이끌어 내고 있습니다. 박형민 교수님은 다수의 연구 과제 수행과 특허 등록, 국내외 저명 학술지 논문 게재를 통해 해당 분야의 발전에 크게 기여하고 계십니다.
교수
소속 | 서강대학교 |
부서 학과 | 전자공학과 |
직책 | 교수 |
사무실 번호 | 027058916 |
이메일 | hpark@sogang.ac.kr |
연구실 | 지능정보처리연구실 |
연구실 홈페이지 |
인공지능연계전공 주임교수
[학회/위원회 활동] - 한국뇌공학회 학술, 총무, 재무이사 - IEEE Senior Member - ICONIP 2013 Publication Co-chair - HAI 2015 Publicity Co-chair - IEEE ICASSP 2018 GOLD Chair - Interspeech 2023 Tutorial Session Chair (내정) - IEEE ICASSP 2024 Organizing Committee
[연구 분야] 다채널 신호처리, 통계적 신호처리, 인공지능/신경회로망, 뇌정보처리 기반 학습알고리즘 개발 등 음성 및 음향 신호 처리, 음성 인식, 음원 분리, 잡음 제거, 빔포밍, 멀티모달 기술, 영상 처리 및 패턴 인식, 그리고 AI/딥러닝 기반 기술의 다양한 응용 분야를 연구하고 있습니다. 특히 로봇 공학, 스마트홈, 재난안전, 차량용 시스템 등 실제 환경에 적용 가능한 기술 개발에 중점을 둡니다. [대표 연구 내용] 문제 정의: 다양한 환경에서 발생하는 소음과 반향은 음성 인식 시스템의 성능을 저하시키는 주요 원인입니다. 특히 다화자 환경이나 원거리 음성 인식 시, 여러 음원 간의 간섭으로 인해 정확한 음성 신호 추출이 어렵습니다. 기술 우위: 박형민 교수는 음향 채널의 '성김(sparsity)' 분포 특성을 활용한 적응 채널 필터 및 공간 제약 조건이 걸린 독립성분 분석(ICA)을 기반으로 한 빔포밍 기술을 개발하여, 기존 방식 대비 훨씬 정확하고 강인한 음성 신호 분리 및 음원 위치 탐지 성능을 제공합니다. 또한, 화자의 입술 움직임 정보를 활용하는 멀티모달 음성 인식 기술은 시각 정보를 통합하여 음성만으로 인식하기 어려운 환경에서도 높은 정확도를 보장합니다. 이러한 기술들은 음원 신호 왜곡 문제를 해결하고, 타겟 음원만을 고정적으로 추출하여 성능을 극대화합니다. 사업 가치: 본 연구에서 개발된 기술들은 스마트홈 기기, 차량용 음성 비서, 회의록 작성 시스템, 재난 구조 로봇, 지능형 CCTV 등 다양한 산업 분야에 적용되어 제품의 음성 인식 정확도를 획기적으로 향상시킬 수 있습니다. 특히, 소음이 심한 환경이나 원거리 음성 인식의 필요성이 높은 분야에서 탁월한 성능을 발휘하여 사용자 경험을 개선하고, 새로운 서비스 모델 창출에 기여할 것입니다. 또한, AI 기반 행동 인식 및 3D 측정 기술은 산업 현장의 자동화, 안전 관리 시스템 구축, 품질 검사 등에서 효율성과 경제성을 높이는 데 기여할 수 있습니다.
보유 기술 로딩 중...