[참고] DCASE2020 Task2 #1 - 경연 개요


1. DCASE

DCASE는 Detection and Classification of Acoustic Scenes and Events의 약자로 매년(언제부터 시작된 것인지는 확인하지 않음 ^^) 경연대회(Challenge)를 개최하고 있다.

그중 이번 글은 DCASE2020 Challenge, 그 중에서도 Task2에 대한 내용을 정리하고자 한다.

2. DCASE2020 Challege Task2

1) 경연 명: 장비 상태 모니터링을 위한 비정상 소리의 비지도 탐지 (Unsupervised Detection of Anomalous Sounds for Machine Condition Monitoring)

2) 경연 개요

  • ASD(Anomalous Sound Detection)은 대상 장비에서 나오는 소리가 정상(normal)인지, 비정상(anomalous)인지를 분별하는 작업이다.
  • 본 작업에 있어서 핵심적인 도전은 정상 소리 샘플들만이 학습 데이터로 제공되는 상황에서 알려지지 않은(해당 샘플이 없는) 비정상 소리를 찾아내는 것이다. –> 현업/고객 환경은 사실 이와 같은 환경이다. 비정상 소리는 매우 드물게 발생하고 매우 다양(diverse)하다.

3) 데이터셋

  • 본 경연에 사용된 데이터셋은 ToyADMOS와 MIMII 2개의 데이터셋을 합친 것이다.
  • ToyADMOS –> Toy-car, Toy-conveyor (해당 데이터셋에 대한 설명 자료)
  • MIMII –> Valve, Pump, Fan, Slide (해당 데이터셋에 대한 설명 자료)
  • 대상 장비의 동작 소리(operating sound)를 배경 소음(environmental noise, 실제 공장에서 녹음된 소음)와 합쳐서 학습과 테스트 데이터로 제공

데이터셋 전체의 개요

  • 데이테셋은 총 6개의 장비 종류에 대한 데이터이며 장비 종류 별로 다른 ID를 가지는 장비들의 데이터가 포함되어 있다.
  • 개발을 위한 데이터셋(development dataset)은 학습 데이터와 테스트 데이터로 구성되어 있는데, 학습 데이터에는 1000개 정도의 정상 소리 데이터가, 테스트 데이터에는 100에서 200개의 정상, 비정상 소리 데이터가 포함되어 있다.
  • 개발을 위한 데이터셋 다운로드

4) Baseline 구현 Repository

3. 경연 결과






© 2021.03. by AIWithDaddy

Powered by theorydb