[논문리뷰] SpecAugument 논문 리뷰
📌 논문 소개 논문 이름 : 논문 링크 : arxiv.org/abs/1904.0877 핵심 아이디어 : 음성 인식을 위한 새로운 증강 기법을 통한 성능 향상 📄 논문 리뷰 ◼ 새롭게 제시한 증강 기법 1. 스펙트로그램 데이터를 특정한 시간 경로로 나눈 뒤, 이를 왜곡시킴.(늘리거나 줄이는 등) 데이터에 약간의 시간적 변화를 주는 것. 2. 입력 스펙트로그램에서 일정 시간 영역을 랜덤하게 가리는 기술. 가리는 영역의 최대 길이를 설정할 수 있고, 이를 통해 지나치게 큰 영역을 가리지 않도록 제어 가능하다. 3. 입력 스펙트로그램에서 일정 주파수 영역을 랜덤하게 가리는 기술. Time Masking과 같이 가리는 영역의 최대 길이를 설정할 수 있고, 이를 통해 지나치게 큰 영역을 가리지 않도록 제어 가능하다. ◼ 새로운 증강 기법을 사용한 전처리 정책 W : 시간 왜곡 매개 변수(에 사용) F : 주파수 마스킹 매개 변수(에 사용) mF : 적용된 주파수 마스킹 수(에 사용)…