연구자 정보를 불러오는 중입니다...
서강대학교 전자공학전공 박형민 교수님은 음성 및 음향 신호처리 분야의 권위 있는 연구자입니다. 교수님은 소음 환경에서의 음성인식 정확도 저하 문제, 다중 음원 분리의 어려움, 그리고 제한적인 정보로 인한 인공지능 시스템의 한계 등을 해결하는 데 집중하고 있습니다. 특히, 빔포밍, 독립 성분 분석(ICA), 딥러닝(DNN) 등 최첨단 기술을 활용하여 음성 향상, 음원 분리 및 위치 탐지, 멀티모달 데이터 융합 기술을 개발하고 있습니다. 이러한 연구는 AI 음성 비서, 스마트홈 기기, 자율주행 차량, 재난 안전 시스템 등 다양한 분야에서 혁신적인 성능 향상을 이끌어 내고 있습니다. 박형민 교수님은 다수의 연구 과제 수행과 특허 등록, 국내외 저명 학술지 논문 게재를 통해 해당 분야의 발전에 크게 기여하고 계십니다.

교수
| 소속 | 서강대학교 |
| 부서 학과 | 전자공학과 |
| 직책 | 교수 |
| 사무실 번호 | 027058916 |
| 이메일 | hpark@sogang.ac.kr |
| 연구실 | 지능정보처리연구실 |
| 연구실 홈페이지 |
AI 기반 강인 음성/음향 신호처리
본 연구실은 음성 및 음향 신호처리 분야의 권위 있는 연구를 수행하고 있으며, 특히 현실 환경에서의 강인한 음성인식 성능 확보에 주력하고 있습니다. 소음이 심한 환경에서의 음성인식 정확도 저하 문제, 다중 음원 분리의 어려움, 그리고 제한적인 정보로 인한 인공지능 시스템의 한계 등을 해결하는 데 집중합니다. 이를 위해 빔포밍, 독립 성분 분석(ICA), 딥러닝(DNN)과 같은 최첨단 기술을 활용하여 음성 향상, 음원 분리 및 위치 탐지 기술을 개발합니다. '강인한 음성 인식을 위한 실시간 타겟 음성 분리 방법' 및 '스테레오 노이즈 제거 장치 및 스테레오 노이즈 제거 방법'과 같은 다수의 특허는 소음 및 반향 환경에서의 음성 품질 개선 및 특정 음원 분리 기술력을 입증합니다. 또한, 'Convolutional Maximum-Likelihood Distortionless Response Beamforming With Steering Vector Estimation for Robust Speech Recognition' 논문을 통해 강건한 음성인식 기술의 이론적, 실용적 발전에 기여하고 있습니다. 이러한 연구 결과는 AI 음성 비서, 스마트 스피커, 스마트홈 기기, 자율주행 차량의 음성 제어 시스템 등 다양한 분야에서 혁신적인 성능 향상을 이끌어내며, 인간이 직관적으로 편리하게 시스템을 운용하는 데 필수적인 기반 기술을 제공합니다. 실제 산업 현장 적용을 위해 ㈜사운드잇에 기술을 이전하고 SK텔레콤(주)에 기술지도를 제공하는 등 활발한 산학협력을 통해 기술 상용화를 선도하고 있습니다.
멀티모달 인공지능 및 인간-중심 인터랙션
본 연구실은 사용자의 편리성을 최우선으로 하는 인간 중심의 인공지능 인터랙션 기술 개발을 목표로, 실제 환경에 적용 가능한 영상, 음성 및 음향 정보처리 알고리즘 연구에 집중하고 있습니다. 특히, 음성, 영상 등 여러 형태의 데이터를 융합하여 인공지능 시스템의 한계를 극복하고 사용자 경험을 고도화하는 멀티모달 기술에 주력하고 있습니다. '멀티 모달 기술을 활용한 실시간 VAD, EPD 기술 개발', '강인음성인식을 위한 멀티모달 전처리 시스템 개발'과 같은 연구 과제를 통해 다양한 모달리티 데이터를 효율적으로 처리하고 융합하는 기술력을 축적했습니다. 'Audio-visual speech recognition based on Dual Cross-Modality Attentions with the Transformer Model' 논문은 시청각 정보를 통합하여 음성인식 성능을 극대화하는 최신 기법을 제시하며, '발화자 영상 생성장치' 및 '영상 처리 장치 및 이의 동작방법' 특허는 멀티모달 데이터 기반의 자연스러운 인간-AI 상호작용 기술의 핵심 역량을 보여줍니다. 이러한 멀티모달 인공지능 기술은 Metaverse/Digital Human 구현의 핵심 기반이며, AI 스피커, AR/VR 게임, 로봇, 차세대 자율주행 자동차, 스마트 가전, IoT 기반 홈 네트워크 등 다양한 스마트 시스템의 기능 다양화 및 고도화에 필수적인 역할을 수행합니다. 궁극적으로 인간이 인공지능 시스템과 보다 직관적이고 편리하게 상호작용할 수 있는 미래 환경을 조성하는 데 기여합니다.
스마트 시스템을 위한 인공지능 응용 및 패턴인식
본 연구실은 인공지능의 광범위한 응용 가능성을 탐구하며, 다양한 스마트 시스템에 적용될 수 있는 지능화 기술 개발에 매진하고 있습니다. 특히, 복잡한 환경에서 발생하는 데이터의 패턴을 정확하게 인식하고, 이를 기반으로 시스템이 지능적인 판단과 행동을 수행할 수 있도록 하는 패턴 인식 및 행동 인식 알고리즘 개발에 강점을 가지고 있습니다. 신경회로망, 딥러닝(DNN) 기반의 최신 기법들을 활용하여 '타성 패턴 인식 시스템 및 방법' 특허와 'Efficient Two-Stream Network for Online Video Action Segmentation', 'Minimax Monte Carlo object tracking', '동영상 기반 행동인식 장치 및 시스템' 등의 연구를 수행하여 복잡한 영상 및 음향 데이터 내에서 의미 있는 패턴과 행동을 추출하는 높은 기술력을 보유하고 있습니다. 또한 'DNN-Based Human Face Classification Using 61 GHz FMCW Radar Sensor'와 같은 혁신적인 연구를 통해 새로운 센서 데이터 기반의 패턴 인식 응용 분야를 개척하고 있습니다. 이러한 인공지능 및 패턴인식 기술은 스마트홈 기기, 차량용 시스템, 로봇, 재난 안전 시스템 등 다양한 스마트 시스템에 적용되어 혁신적인 기능을 제공합니다. 구체적으로 '이동형 홈로봇의 음원 탐색을 이용한 공간이해 기술 개발', '재난 상황에서 인명 구조용 음향 인지 기술 개발', '터널 환경에서의 음향 기반 교통사고 자동탐지 기술'과 같은 다수의 과제 수행을 통해 실제 생활 안전 및 편의성 증진에 기여하고 있습니다. 본 연구는 정부, 대기업, IT/벤처기업들과의 활발한 인공지능 프로젝트를 통해 기술의 실질적인 상용화를 추진하고 있습니다.
인공지능연계전공 주임교수
[학회/위원회 활동] - 한국뇌공학회 학술, 총무, 재무이사 - IEEE Senior Member - ICONIP 2013 Publication Co-chair - HAI 2015 Publicity Co-chair - IEEE ICASSP 2018 GOLD Chair - Interspeech 2023 Tutorial Session Chair (내정) - IEEE ICASSP 2024 Organizing Committee

보유 기술 로딩 중...