AOSE_Unet(Audio Only Speech Enhancement using Unet)

0. Prepare dataset 관련(본인 취향의 Dataset을 만들거면 필자처럼 안해도 됨)

1) download

download and extract the file train / test dataset 28spk https://datashare.is.ed.ac.uk/handle/10283/2791
write address location of files in txt file /home/nas/clean/train.txt /home/nas/noise/train.txt /home/nas/clean/test.txt /home/nas/noise/test.txt

2) STFT the audio data and store it as a pickle.

48khz 데이터들을 16khz로 resampling해준다. 필자는 16khz로 사용했다.
python data_feature/demand_data_get_feature.py --clean_train /home/nas/clean/train.txt --noise_train /home/nas/noise/train.txt --clean_test /home/nas/clean/test.txt --noise_test /home/nas/noise/test.txt --train_save_path /home/nas/train/save/ --test_save_path /home/nas/test/save --fs 16
or sh make_data_feature.sh

1. train 관련

python train_DCUnet_jsdr_demand.py --train_data_root_folder /home/nas/train/save/ --val_data_root_folder /home/nas/test/save --gpu 0 --modelsave_path model/save/path --snr 0 --exp_day 0101 --batch_size 20 --frame_num 128 --learning_rate 0.0001 --fs 48
or sh train.sh

2. model 관련

frame_num is time value of STFT.
recommend frame_num = 128 or 256 like 2's power
if you don't like it, change model padding, stride, kernel etc.

3. test 관련

python test_DCUnet_jsdr_demand.py --fs 48 --test_model model/path.pth --test_data_root_folder /home/nas/test/audio --test_data_output_path /home/nas/test/output
or sh test.sh
test_data_root_folder is folder that has .wav audio files.
The length of the output audio is limited. To solve this, go intodataset/demand_dataset_test_librosa.py and add line 107-113 paragraphs appropriately to the length.

4. data 추가 관련

demand noise dataset download https://zenodo.org/record/1227121#.X1Ytv3kzaUk
To do, clean data + demand noise dataset
cd data_augment python data_aug_demand_dataset.py --clean_train_txt /home/nas/clean/train.txt --noise_txt /home/nas/demand/noise.txt --save_path /home/nas/save/path/ --snr 0 --fs 48

Name		Name	Last commit message	Last commit date
Latest commit History 118 Commits
audio_output/DCUnet_sample_test_0918_0db		audio_output/DCUnet_sample_test_0918_0db
data_augment		data_augment
data_feature		data_feature
data_txt		data_txt
dataset		dataset
model_ckpt		model_ckpt
.gitignore		.gitignore
AudioEnhance.yml		AudioEnhance.yml
DCUnet_jsdr_demand.py		DCUnet_jsdr_demand.py
README.md		README.md
data_augment.sh		data_augment.sh
make_data_feature.sh		make_data_feature.sh
requirement.txt		requirement.txt
test.sh		test.sh
test_DCUnet_jsdr_demand.py		test_DCUnet_jsdr_demand.py
train.sh		train.sh
train_DCUnet_jsdr_demand.py		train_DCUnet_jsdr_demand.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AOSE_Unet(Audio Only Speech Enhancement using Unet)

0. Prepare dataset 관련(본인 취향의 Dataset을 만들거면 필자처럼 안해도 됨)

1) download

2) STFT the audio data and store it as a pickle.

1. train 관련

2. model 관련

3. test 관련

4. data 추가 관련

About

Releases

Packages

Languages

jungwook518/AOSE_Unet

Folders and files

Latest commit

History

Repository files navigation

AOSE_Unet(Audio Only Speech Enhancement using Unet)

0. Prepare dataset 관련(본인 취향의 Dataset을 만들거면 필자처럼 안해도 됨)

1) download

2) STFT the audio data and store it as a pickle.

1. train 관련

2. model 관련

3. test 관련

4. data 추가 관련

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages