AI Hub Dialogue Speech

Speech Dataset generator from AI Hub multimodal video dataset

Dataset Download

data
└── 0001-0400
    ├── clip_1
    │   ├── clip_1.json
    │   └── clip_1.mp4
    └── clip_2
        ├── clip_2.json
        └── clip_2.mp4

Requirements:

python create_audio.py [--convert_video] [--sample_rate SR]

Option:

python split.py [--path FILELIST_PATH] [--ratio RATIO] [--seed SEED]

Option:

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.gitignore		.gitignore
README.md		README.md
create_audio.py		create_audio.py
split.py		split.py