김지환

김지환

재직중

AI 요약

김지환 교수는 서강대학교 컴퓨터공학과 소속으로, AI 기반 음성인식 및 자연어처리 분야의 선도적인 연구자입니다. 특히 한국어 음성인식 기술 고도화, LLM을 활용한 성능 향상, E2E STT 모델 개발 등에 집중하고 있습니다. 다수의 국책 과제와 산학 협력을 통해 산업계와 학계에 실질적인 기여를 해왔으며, 자동 어휘 생성 및 코퍼스 구축 관련 특허를 보유하고 있습니다. 다양한 논문 발표를 통해 음성 AI 기술 발전에 기여하고 있습니다.

김지환 썸네일

김지환

교수

서강대학교
컴퓨터공학과
소속서강대학교
부서 학과컴퓨터공학과
직책교수
사무실 번호027058924
이메일kimjihwan@sogang.ac.kr
연구자 홈페이지
연구실청각지능 연구실
연구실 홈페이지

경력정보

-
-

Sogang University

ep. 2007 ~ Present : Professor

-
-

LG Electronics Institute of Technology

Dec. 2001 ~ Aug. 2007 : Chief & Senior Research Engineer

-
-

MIT Media Lab

Oct. 2004 ~ Nov. 2004 : Visiting Scholar

중요 키워드

음향분석자연어처리딥러닝음성인터페이스음성인식인공지능LLM한국어평가E2E음성인식STT화자인식AI컨설팅오디오이벤트분류음성처리대화모델

대외활동

[기술 이전 및 기술 지도] - 특허: 최대 우도에 기반한 자동 어휘 생성 (등록번호: 1018464610000) - 특허: 코퍼스 구축 서비스 제공 서버 및 방법 (등록번호: 1026996070000) - 기술지도: AI 음성 전문가 과정 개발 컨설팅 - 기술지도: AI 음성/언어 전문가 과정 개발 컨설팅 [학회 및 위원회 활동] - 2024 한국 HCI 학회 이사 - 2024 한국 음성학회 이사 - 2023 한국 음성학회 부회장 - 2023 한국정보과학회 인공지능 소사이어티 이사 - 2022 한국 음성학회 부회장 - 2022 한국정보과학회 인공지능 소사이어티 이사 - 2021 한국 HCI 학회 이사 - 2021 한국 음성학회 부회장 - 2021 한국정보과학회 인공지능 소사이어티 이사 - 2020 한국 HCI 학회 이사 - 2020 한국 음성학회 이사 - 2019 한국 음성학회 이사 - 2018 한국 음성학회 이사 - 2017 한국 음성학회 이사 - 2016 한국 음성학회 이사 - 2015 한국 음성학회 학술 이사 - 2014 한국 음성학회 학술 이사 - 2013 한국 음성학회 사업 이사 - 2012 한국 음성학회 사업 이사 - 2011 한국 음성학회 사업 이사 - 2009 한국음성학회 총무이사 - 2008 한국음성학회 이사 [수상 내역] - 2021년 20회 한국 HCI 학술대회 최우수 논문상 (공동수상, 제목: “눈으로 보는 오디오: 심층 잔여 네트워크 기반 오디오-텍스트 정합 모델”) - 2018년도 서강대학교 우수강의교수 표창장 - 2016년 국제표준화기구/국제전기기술위원회(ISO/IEC JTC1) 공로상 (Outstanding Contribution Award) - 2016년 2016 한국음성학회 가을학술대회 우수논문상 (공동수상, 제목: “전처리된 음성신호의 잡음 및 울림 제거와 후처리된 음성신호의 노이즈 제거의 특징에 따른 end-to-end 음성인식 결과 비교”) - 2014년 한국음성학회 기술상

주요 연구 내용

[연구 분야] 핵심 분야: 음성인식, 음성 처리, 자연어 처리, 오디오 이벤트 분류, 인공지능 기반 음성 인터페이스 개발 세부 분야: E2E(종단간) 음성인식 모델, 거대 언어 모델(LLM) 기반 음성인식 성능 향상, 한국어 평가 자동 출제 및 채점, 화자간 공유 경험을 활용한 페르소나 인식 장기 음성 대화 모델 개발 [대표 연구 내용] 언어 교육 시장의 자동화 및 효율성 증대라는 과제를 해결하기 위해, 김지환 교수 연구팀은 '세종한국어평가(SKA) 자동 출제·채점' 연구를 선도하고 있습니다. 기존 수동 평가 방식의 한계를 극복하고, 인공지능 기반의 정확하고 신뢰할 수 있는 자동 채점 시스템을 개발하여 한국어 교육의 새로운 지평을 열고 있습니다. 특히, E2E(종단간) 음성인식 기술과 LLM(거대 언어 모델)을 접목하여 음성인식 성능을 극대화하고 있으며, 이는 교육 분야뿐만 아니라 음성 기반 인공지능 서비스 전반에 걸쳐 혁신적인 사업적 가치를 창출할 수 있습니다. 본 기술은 학습자의 발음 및 대화 능력을 객관적으로 평가하고, 개인 맞춤형 피드백을 제공하여 교육 효과를 극대화하는 데 기여할 것입니다. 또한, '화자간 공유 경험을 활용한 페르소나 인식 장기 음성 대화 모델' 개발을 통해 보다 자연스럽고 지능적인 대화형 AI 시스템 구축 가능성을 제시하며, 이는 미래 음성 인터페이스 시장에서 독보적인 경쟁 우위를 확보할 것입니다.

학력

Cambridge University Engineering Department 음성인식 (2001) 한국과학기술원(KAIST) 컴퓨터공학과 화자 인식 (1998) 한국과학기술원(KAIST) 컴퓨터공학과 컴퓨터공학 (1996)

보유 기술 로딩 중...