# Audio Tagging

9개의 포스트
post-thumbnail

Sound Classification - 1) PANNs

CV와 NLP에서 Large-scale dataset을 활용한 Pretrained 모델이 좋은 일반화 성능을 보임. 그러나, Audio분야에선 관련 연구가 제한적. 이런 문제를 Audio 분야에서 해결하고자 Large-scale Audioset을 활용한 Pretrain

2023년 7월 10일
·
0개의 댓글
·
post-thumbnail

Sound Classification 정리 6. HTS-AT: A Hierarchical Token-Semantic Audio Transformer for Sound Classification and Detection

개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리했습니다.

2022년 12월 31일
·
0개의 댓글
·
post-thumbnail

Sound Classification 정리 5. SSAST: Self-Supervised Audio Spectrogram Transformer

개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리했습니다.

2022년 12월 31일
·
0개의 댓글
·
post-thumbnail

Sound Classification 정리 4. Efficient Training of Audio Transformers with Patchout (PaSST)

개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리했습니다.

2022년 12월 31일
·
0개의 댓글
·
post-thumbnail

Sound Classification 정리 3. AST: Audio Spectrogram Transformer

개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리했습니다.

2022년 12월 31일
·
2개의 댓글
·
post-thumbnail

Sound Classification 정리 2. PSLA: Improving Audio Tagging with Pretraining, Sampling, Labeling, and Aggregation

개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리했습니다.

2022년 12월 31일
·
0개의 댓글
·
post-thumbnail

Sound Classification 정리 1. PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition

개인적으로 Audio & Speech 분야의 Sound Classification 에서 중요하다고 생각하는 논문을 정리했습니다.

2022년 12월 31일
·
0개의 댓글
·