오디오 데이터 (Audio Data)

목차

  1. 음성 인식
  2. 기타

음성 인식

V3

트랜스포머를 통한 자동 음성 인식 (Automatic Speech Recognition with Transformer)

.

기타

V2

CTC를 사용한 자동 음성 인식 (Automatic Speech Recognition using CTC)

.

V2

특징 매칭을 사용한 MelGAN 기반 스펙트로그램 반전 (MelGAN-based spectrogram inversion using feature matching)

.

V2

화자 인식 (Speaker Recognition)

.

V2

전이 학습을 사용한 영어 화자 억양 인식 (English speaker accent recognition using Transfer Learning)

.

V2

Hugging Face 트랜스포머를 사용한 오디오 분류 (Audio Classification with Hugging Face Transformers)

.


Table of contents