음악 정보 검색
관련링크
본문
최근 MP3P, PMP와 같은 휴대용 기기를 통해 음악 콘텐트가 활발히 이용되고 있다. 또한 많은 사용자들이 자신만의 음악 라이브러리를 구축하여 음악을 감상하고 있기도 하다. 이같은 대중성에도 불구, 현존하는 휴대용 기기나 어플리케이션에는 음악 콘텐트를 효율적/효과적으로 찾기 위한 인덱싱 방법이 어플리케이션의 형태로 나와있지 않다. 이런 상황에서, 음악 정보 검색 (MIR; Music Information Retrieval) 은 이와 같은 문제를 풀기 위한 전망 있는 분야로 떠오르고 있다. 2008년도 ISMIR (International Conference on Music Information Retrieval) 에서 모집한 MIR의 세부 연구 분야 중 몇몇을 소개하면 다음과 같다.
- Automatic Transcript-xion and Annotation
Query-by-Singing/Humming
Onset Detection in monophony and polyphony
- Acoustic Analysis
Computational musicology
Harmony, chords and tonality
Melody and motives
Rhythm, beat, tempo and form
Timbre, instrumentation and voice
- Automatic Classification and Recommendation
Genre/mood classification
Similarity metrics
Music summarization
- Evaluation of MIR systems
MIREX (Music Information Retrieval Evaluation and eXchange)
우리 연구실은 MIR 문제를 풀기 위한 다양한 솔루션을 가지고 있고, 또한 연구를 지속하고 있다. 또한, 그 결과물로서 IEEE나 ACM의 많은 conference, workshop, 그리고 학술지 등에 많은 성과를 내고 있다. 이들을 대표할만한 몇 가지 성과 혹은 진행중인 연구를 간략하게 소개하면 다음과 같다.
(i) AMTranscriber (Automatic Music Transcriber)는 본 연구실에서 개발한 음성 질의 악보 변환 엔진이다. 이 엔진은 time domain의 여러 특성들을 활용하여 정확한 uUdDR, LSR string을 추출해내며, Query-By-Singing/Humming 기반의 음악 정보 검색 엔진에 탑재되기 쉽도록 제작되어 있다.
(ii) MUSEMBLE (MUSic enEMBLE)은 RF (Relevance Feedback) 과 GA (Genetic Algorithm) 에 기반한 음악 정보 검색 시스템이다. AMTranscriber 의 초기 버전이 이 엔진과 연결되었다. 질의에 대한 결과를 최적화하여 빠르게 보여주기 위해 FAI (Frequently Accessed Index) 가 연결되어 있다.
(iii) DEMLP (Dynamic Expansible Multi-Layer Perceptrons)는 기존 순방향 인공 신경망 네트워크 (FANN, Feedforward Artificial Neural Network)의 변경성 및 성장성을 개선한 MLP 기반의 엔진이다. 현재 음악 장르/무드 추출을 위한 분류기(classifier)로 활용하기 위해 다양한 연구가 진행 중에 있다.
(iv) 사용자 감정 전이 행렬(User Emotion Transition Matrix)에 기반한 음악 추천 시스템(music recommendation system)은 사용자의 감정 전이에 대한 결과를 RF 방식으로 추출하고, 이를 machine learning 및 dimensionality reduction 기법에 기반한 분류 후, 사용자에게 유사한 감정 전이 효과를 가지는 음악을 추천해주는 시스템이다. 현재 사용자의 데이터를 효과적으로 추출하고, 이를 음악의 물리적 특성과 연계시키기 위한 연구가 진행 중에 있다.