본문 바로가기 주메뉴 바로가기

알림마당

회원사소식

<한화비전> GIST-한화비전 연구팀, 국제 AI 음향 인식 대회서 심사위원상 수상

관리자 2023-10-16 조회수 216

- GIST-한화비전 연구팀, 국제 AI 음향 인식 대회서 심사위원상 수상


국제 AI 음향 인식 대회서 심사위원상을 수상한 GIST와 한화비전 연구팀.
<국제 AI 음향 인식 대회서 심사위원상을 수상한 GIST와 한화비전 연구팀.>

광주과학기술원(GIST·총장 임기철)은 전기전자컴퓨터공학부 오디오지능연구실(AiTeR, 김홍국 교수)과 한화비전(AI연구소 소장 노승인) 공동 연구팀이 세계 최대 전기·전자기술자협회(IEEE)의 신호처리소사이어티가 주관한 '국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)' 워크숍에서 심사위원상(Judges' award)을 수상했다고 12일 밝혔다.

GIST 오디오지능연구실 소속 석사과정 김지원, 손상원 학생, 석박통합과정 송윤아 학생과 한화비전 송일훈, 임정은 수석연구원으로 구성된 'GIST-HanwhaVision 팀은 'DCASE 챌린지 2023'에 참가해 '실내 음향 이벤트 탐지 부문(Task 4A)'에서 단일 모델 분야 1위와 앙상블 모델 분야 2위를 달성했다.

특히 워크숍에서 제출한 기술 리포트를 중심으로 연구의 독창성과 우수성을 검토해 Task별 1팀에게만 주어지는 심사위원상을 수상해 연구의 혁신성과 기술의 완성도 및 논문의 품질 등 다양한 기준에서 우수한 성과를 인정받았다.

GIST-한화비전 팀은 '실내 음향 이벤트 탐지 부문(Task 4A)'에서 중앙대, 샤오미, 삼성리서치 중국-난징 등 유수한 기관 15개 팀을 제치고 이 상을 수상했다. 실내 음향 이벤트 탐지 기술은 실내 환경에서 발생할 수 있는 진공청소기 소리, 설거지하는 소리 등 10가지의 다양한 소리를 AI를 통해 탐지 및 구별하는 기술이다.

이 기술은 카메라를 통해 처리하는 데 제한이 있는 상황에서 소리만으로 음향 이벤트를 탐지할 수 있다는 강점을 통해 실내 상황 감시, AI스피커 등 다양한 어플리케이션에 활용될 수 있다.

GIST-HanwhaVision 팀은 문제를 해결하기 위해 다양한 오디오 지능을 표현할 수 있는 AI 기술들을 접목해 고성능 실내 음향 이벤트 탐지 기술을 개발했다. 인공지능이 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술, 사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술, 성능 향상을 위한 데이터를 정제하는 기술, 인공지능의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 인공지능 모델로 우수한 성과를 달성했다.

김홍국 교수는 “이번 대회를 통해 얻은 경험과 개발 기술은 한화비전의 CCTV내에서의 음향 이벤트 탐지에 적용될 예정”이라며 “소셜미디어 콘텐츠에서의 음성구간 및 음향 이벤트 검출을 통해 보다 효율적이고 사용자 친화적인 서비스 개발에 노력하겠다”고 말했다.

한편 GIST-AiTeR 팀이 소속된 GIST 오디오지능연구실(AiTeR, 지도교수 김홍국)에서는 음성 음향을 위한 AI 모델을 연구하고 있으며, 음향 이벤트 탐지뿐만 아니라 음성 합성, 음성 잡음 제거, 음성 인식, 이상 상황 감지, 생체정보 처리 등의 다양한 연구를 국내 산학연 연구기관 및 매사추세츠공대(MIT) 등 해외연구기관과 공동으로 진행하고 있다.

이번 연구는 올해 한화비전의 폐쇄회로(CC)TV 내 딥러닝 기반 음원 분류 상품화 지원 사업, △과학기술정보통신부 및 정보통신기획평가원의 미디어 콘텐츠 음성 언어 현지화 기술개발 사업의 지원으로 수이뤄졌다.






<관련기사>

전자신문: https://www.etnews.com/20231012000524