Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

想要支持更多数据集?在这里提建议 #10

Open
babysor opened this issue Aug 16, 2021 · 40 comments · Fixed by #7
Open

想要支持更多数据集?在这里提建议 #10

babysor opened this issue Aug 16, 2021 · 40 comments · Fixed by #7

Comments

@babysor
Copy link
Owner

babysor commented Aug 16, 2021

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

@yfq512
Copy link

yfq512 commented Aug 16, 2021

朋友,你是怎么跑起来的,我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了,这个datasets_root是指什么呢?

@babysor
Copy link
Owner Author

babysor commented Aug 16, 2021

假如你下载的 aidatatang_200zh文件放在D盘,train文件路径为 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data\

@hertz-pj
Copy link
Contributor

hertz-pj commented Aug 17, 2021

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

@babysor
Copy link
Owner Author

babysor commented Aug 17, 2021

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

@hertz-pj
Copy link
Contributor

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

@babysor
Copy link
Owner Author

babysor commented Aug 17, 2021

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

@XiuChen-Liu
Copy link
Contributor

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

推薦標貝數據集

@0we
Copy link

0we commented Aug 23, 2021

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

@loilih
Copy link

loilih commented Aug 27, 2021

aidatatang_200zh在哪里下载呢

@XiuChen-Liu
Copy link
Contributor

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

@babysor babysor pinned this issue Aug 27, 2021
@loilih
Copy link

loilih commented Aug 27, 2021

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

谢谢

@babysor
Copy link
Owner Author

babysor commented Aug 28, 2021

已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

#59 已支持aishell3,不过训练效果没增强

@XiuChen-Liu
Copy link
Contributor

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

@babysor
Copy link
Owner Author

babysor commented Aug 28, 2021

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

@XiuChen-Liu
Copy link
Contributor

大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

好的,謝謝大佬的回覆,另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice

@FawenYo
Copy link
Contributor

FawenYo commented Sep 2, 2021

請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 CorentinJ/Real-Time-Voice-Cloning#819
檔案結構大致如圖
image
其中 clips 資料夾內容包含各項 xxx.mp3
希望日後能支持,謝謝

@Zhiqing-Xu
Copy link

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

@babysor
Copy link
Owner Author

babysor commented Sep 6, 2021

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

  1. 录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。
  2. 你指下载下来的数据集吗?
  3. 私信的话,可以走邮件,或者扫这里的二维码: > > WechatIMG54

@Zhiqing-Xu
Copy link

Zhiqing-Xu commented Sep 6, 2021 via email

@babysor
Copy link
Owner Author

babysor commented Sep 7, 2021

#20 这里有新的二维码

@ShouNichi
Copy link

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

@babysor
Copy link
Owner Author

babysor commented Sep 26, 2021

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息,不过我访问不了

@ShouNichi
Copy link

ShouNichi commented Sep 27, 2021

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息,不过我访问不了

是指数据集不能访问吗?如果是百度云不能访问的话我这边可以转mega或者GD
链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet

-----------------更新---------------------

访问不了是链接不知怎的最后多了个z,删掉就行了
https://github.com/fighting41love/zhvoice
写了貌似可以直接用于zhrtvc,同一个分支出来的
https://github.com/xingmegshuo/zhrtvc
突然发现上面已经有人推荐过了...

@Charlottecuc
Copy link

@babysor 二维码过期了,求重发一个~

@babysor
Copy link
Owner Author

babysor commented Sep 27, 2021

cb0f71d680c3b7d6c2aca6fce1a220d

@Charlottecuc

@LxKxC
Copy link

LxKxC commented Oct 7, 2021

群满了,加不进去,求作者微信号

@kslz
Copy link
Contributor

kslz commented Oct 11, 2021

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

@babysor
Copy link
Owner Author

babysor commented Oct 11, 2021

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

理论可行,可以联系我讨论

@kslz
Copy link
Contributor

kslz commented Oct 11, 2021

老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制

理论可行,可以联系我讨论

你好 已发到你的gmail里 [email protected] 上面的二维码过期了

@lcp580
Copy link

lcp580 commented Oct 14, 2021

新增标贝数据支持BZNSYP
MozillaCommonVoice
以上两个数据集支持在最新的主版本中没有看到?难道还没能合并进来吗?

@babysor
Copy link
Owner Author

babysor commented Oct 14, 2021

BZNSYP

都在分支上, #75

@woct0rdho
Copy link

给个思路,那些galgame都是几十万字的文本与语音对应的数据集

@ycMia
Copy link

ycMia commented Nov 24, 2021

给个思路,那些galgame都是几十万字的文本与语音对应的数据集

牵涉版权问题哦 🌱

@joshua54321
Copy link

3. 话,可以走邮件,或者扫这里的二维码: > >

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

作者您好,请问现在支持自动跑多个数据集了吗?如果手动分开跑,是如何操作的呢?

@babysor
Copy link
Owner Author

babysor commented Dec 26, 2021

  1. 话,可以走邮件,或者扫这里的二维码: > >

推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗

程序逻辑还没实现 囧 目前我是手动分开跑

作者您好,请问现在支持自动跑多个数据集了吗?如果手动分开跑,是如何操作的呢?

可以, https://zhuanlan.zhihu.com/p/417134499 分开跑比较麻烦,因为混合起来就不太能区分了

@l-i-p-f
Copy link

l-i-p-f commented Jan 30, 2022

请问有粤语数据集吗?

@ZeroAurora
Copy link

https://www.openslr.org/18/
THCHS-30 数据集,体量较小,想拿来练手用

@babysor
Copy link
Owner Author

babysor commented Sep 10, 2022

https://www.openslr.org/18/ THCHS-30 数据集,体量较小,想拿来练手用

最好确保有100hrs级别的语音

@123qq679
Copy link

123qq679 commented Jan 1, 2023

C:\Users\Administrator\Desktop\mockingbird\MockingBird-main>python pre.py D:\ -d data_aishell3
Traceback (most recent call last):
File "C:\Users\Administrator\Desktop\mockingbird\MockingBird-main\pre.py", line 55, in
assert args.dataset in recognized_datasets, 'is not supported, please vote for it in #10'
AssertionError: is not supported, please vote for it in #10
大佬,这是怎么回事?

@1044690543
Copy link
Contributor

cb0f71d680c3b7d6c2aca6fce1a220d

@Charlottecuc

求进群

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet