
대규모 대화 시스템 위한 AI 정책 모델 최적화 개발
AI 요약
기존 대화 시스템의 대화 정책 모델은 규칙 기반으로 인해 유연성 및 확장성에 한계를 가졌습니다. 특히 방대한 대화 상태 공간에서의 강화 학습 적용은 어려웠습니다. 본 발명은 이러한 문제점을 해결하기 위해 사용자 발화 의도의 신뢰점수를 포함한 대화 상태를 연속적인 벡터로 표현합니다. 또한, 시간 단계마다 수신한 데이터를 활용하는 경험 재현(Experience Replay) 기법을 통해 대화 정책 모델을 강화 학습합니다. 이를 통해 경험 데이터를 효율적으로 재사용하고 샘플 간 상관관계를 줄여 데이터 효율성을 크게 향상시킵니다. 결과적으로, 더욱 지능적이고 유연하며 자연스러운 대화가 가능한 차세대 대화 시스템을 구현할 수 있습니다.
기본 정보
기술명 | |
대화 정책 모델의 최적화 방법 및 이를 구현하는 대화 시스템 | |
기관명 | |
서강대학교산학협력단 | |
대표 연구자 | 공동연구자 |
서정연 | - |
출원번호 | 등록번호 |
1020180116575 | 1021523390000 |
권리구분 | 출원일 |
특허 | 2018.09.28 |
중요 키워드 | |
경험 재현 기법자연어 처리강화 학습대규모 대화사용자 의도 분석대화 상태 벡터Q-러닝대화 정책 모델대화 관리 기술대화 시스템인공지능 대화화행 정보머신러닝 최적화데이터 효율성시스템 응답인공지능소프트웨어 |
기술완성도 (TRL)
기본원리 파악
기본개념 정립
기능 및 개념 검증
연구실 환경 테스트
유사환경 테스트
파일럿 현장 테스트
상용모델 개발
실제 환경 테스트
사업화 상용운영
기술 소개
매도/매수 절차
기술이전 상담신청
연구자 미팅
기술이전 유형결정
계약서 작성 및 검토
계약 및 기술료 입금

서강대학교
보유 기술 로딩 중...
인기 게시물 로딩 중...