想要支持更多数据集？在这里提建议 #10

babysor · 2021-08-16T02:24:54Z

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

yfq512 · 2021-08-16T02:39:11Z

朋友，你是怎么跑起来的，我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了，这个datasets_root是指什么呢？

babysor · 2021-08-16T03:23:27Z

假如你下载的 aidatatang_200zh文件放在D盘，train文件路径为 D:\data\aidatatang_200zh\corpus\train , 你的datasets_root就是 D:\data\

hertz-pj · 2021-08-17T09:39:59Z

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

babysor · 2021-08-17T09:51:38Z

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

hertz-pj · 2021-08-17T11:04:53Z

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

babysor · 2021-08-17T11:13:08Z

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

XiuChen-Liu · 2021-08-17T13:10:47Z

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

推薦標貝數據集

0we · 2021-08-23T08:35:48Z

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

loilih · 2021-08-27T15:15:12Z

aidatatang_200zh在哪里下载呢

XiuChen-Liu · 2021-08-27T15:17:37Z

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

loilih · 2021-08-27T16:16:43Z

aidatatang_200zh在哪里下载呢

這裡 http://www.openslr.org/62/

谢谢

babysor · 2021-08-28T00:27:11Z

已支持的有 aidatatang（已验证200zh）, Magic Data(已验证open SLR68)
需要更多请在这里提建议，并+1投票，将为大家补充支持

aishell3 和 Mozilla Common Voice 数据集

#59 已支持aishell3，不过训练效果没增强

XiuChen-Liu · 2021-08-28T05:34:07Z

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

babysor · 2021-08-28T06:08:48Z

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

XiuChen-Liu · 2021-08-28T06:38:39Z

大佬，現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎

已经不再需要下载了

好的，謝謝大佬的回覆，另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice

FawenYo · 2021-09-02T12:48:02Z

請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 CorentinJ/Real-Time-Voice-Cloning#819
檔案結構大致如圖

其中 clips 資料夾內容包含各項 xxx.mp3
希望日後能支持，謝謝

Zhiqing-Xu · 2021-09-05T03:58:57Z

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

babysor · 2021-09-06T05:53:51Z

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

录制的话，建议是5-10秒长度的大于等于16khz的音频，每个语音单一说话人，尽可能多的覆盖男女生、不同声色（不要单独分开训练，混一起效果好）。预处理的话也就是把音频去噪，切割满足上面这个需求。
你指下载下来的数据集吗？
私信的话，可以走邮件，或者扫这里的二维码： > >

Zhiqing-Xu · 2021-09-06T14:45:02Z

你的群二维码过期了，可以给个微信么，有一些细节还是想请教

…

On Mon, 6 Sept 2021 at 01:54, Vega ***@***.***> wrote: 老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么 1. 录制的话，建议是5-10秒长度的大于等于16khz的音频，每个语音单一说话人，尽可能多的覆盖男女生、不同声色（不要单独分开训练，混一起效果好）。预处理的话也就是把音频去噪，切割满足上面这个需求。 2. 你指下载下来的数据集吗？ 3. 私信的话，可以走邮件，或者扫这里的二维码： > > [image: WechatIMG54] <https://user-images.githubusercontent.com/7423248/130546423-5588bc46-af02-4eda-a122-f64d8f4b7627.jpeg> — You are receiving this because you commented. Reply to this email directly, view it on GitHub <#10 (comment)>, or unsubscribe <https://github.com/notifications/unsubscribe-auth/ALODQYY2IKTK5WWYPXGOSL3UARJPVANCNFSM5CG2ISUQ> . Triage notifications on the go with GitHub Mobile for iOS <https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675> or Android <https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub>.

babysor · 2021-09-07T01:55:34Z

#20 这里有新的二维码

ShouNichi · 2021-09-26T15:41:27Z

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

babysor · 2021-09-26T15:56:40Z

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息，不过我访问不了

ShouNichi · 2021-09-27T01:12:00Z

https://github.com/fighting41love/zhvoicez
这个看着很厉害的样子
这边在研究改代码跑跑看
不过都是mp3的很麻烦

等你好消息，不过我访问不了

是指数据集不能访问吗？如果是百度云不能访问的话我这边可以转mega或者GD
链接: https://pan.baidu.com/s/16er-ubcLljayQM7ucd238Q 提取码: dwet

-----------------更新---------------------

访问不了是链接不知怎的最后多了个z，删掉就行了
https://github.com/fighting41love/zhvoice
写了貌似可以直接用于zhrtvc，同一个分支出来的
https://github.com/xingmegshuo/zhrtvc
突然发现上面已经有人推荐过了...

Charlottecuc · 2021-09-27T12:25:27Z

@babysor 二维码过期了，求重发一个～

babysor · 2021-09-27T13:26:05Z

@Charlottecuc

LxKxC · 2021-10-07T09:23:08Z

群满了，加不进去，求作者微信号

kslz · 2021-10-11T04:11:30Z

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

babysor · 2021-10-11T05:03:34Z

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

理论可行，可以联系我讨论

kslz · 2021-10-11T11:19:30Z

老哥，我留意到你的aidatatang200 数据集里声音背景噪音非常重，而且大部分是男声，我对这个项目非常感兴趣，计划按照你的重新找女声（涵盖不同音色声线，萝莉，少女，御姐）重新录制干净无噪声的数据集，我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。我的问题是，1. 我对音频文件的录制格式，编码，没有经验，可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛？ 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途，可以大致说一下么？ 3. 有更多细节我们可以私信交流一下么

有没有可能提取游戏里的音频素材，或者关闭背景音乐后用软件录制

理论可行，可以联系我讨论

你好已发到你的gmail里 [email protected] 上面的二维码过期了

lcp580 · 2021-10-14T03:38:47Z

新增标贝数据支持BZNSYP
MozillaCommonVoice
以上两个数据集支持在最新的主版本中没有看到？难道还没能合并进来吗？

babysor · 2021-10-14T04:16:27Z

BZNSYP

都在分支上， #75

woct0rdho · 2021-11-07T12:39:33Z

给个思路，那些galgame都是几十万字的文本与语音对应的数据集

ycMia · 2021-11-24T06:19:46Z

给个思路，那些galgame都是几十万字的文本与语音对应的数据集

牵涉版权问题哦 🌱

joshua54321 · 2021-12-23T02:17:59Z

3. 话，可以走邮件，或者扫这里的二维码： > >

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

作者您好，请问现在支持自动跑多个数据集了吗？如果手动分开跑，是如何操作的呢？

babysor · 2021-12-26T03:48:11Z

话，可以走邮件，或者扫这里的二维码： > >

推荐aishell3数据集，稍微干净一些，但是数据量很少。另外datasets_root确定是D:\data\而不是D:\data\aidatatang_200zh\corpus\train

是的，如果理解参数名，这里原本是希望同时支持多个dataset,所以叫datasets_root。

那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内，就可以同时跑两个数据集吗

程序逻辑还没实现囧目前我是手动分开跑

作者您好，请问现在支持自动跑多个数据集了吗？如果手动分开跑，是如何操作的呢？

可以， https://zhuanlan.zhihu.com/p/417134499 分开跑比较麻烦，因为混合起来就不太能区分了

l-i-p-f · 2022-01-30T03:38:39Z

请问有粤语数据集吗？

ZeroAurora · 2022-08-17T14:52:57Z

https://www.openslr.org/18/
THCHS-30 数据集，体量较小，想拿来练手用

babysor · 2022-09-10T16:04:45Z

https://www.openslr.org/18/ THCHS-30 数据集，体量较小，想拿来练手用

最好确保有100hrs级别的语音

123qq679 · 2023-01-01T09:36:23Z

C:\Users\Administrator\Desktop\mockingbird\MockingBird-main>python pre.py D:\ -d data_aishell3
Traceback (most recent call last):
File "C:\Users\Administrator\Desktop\mockingbird\MockingBird-main\pre.py", line 55, in
assert args.dataset in recognized_datasets, 'is not supported, please vote for it in #10'
AssertionError: is not supported, please vote for it in #10
大佬，这是怎么回事？

1044690543 · 2024-02-27T10:46:48Z

@Charlottecuc

求进群

babysor pinned this issue Aug 27, 2021

This was linked to pull requests Sep 1, 2021

Supporting new dataset SLR68 ! try python synthesizer_preprocess_audi… #7

Merged

Support new dataset "biaobei" BZNSYP High quality single speaker for … #72

Closed

babysor unpinned this issue Mar 7, 2022

18klove mentioned this issue Jun 19, 2022

is not supported, please vote for it in https://github.com/babysor/MockingBird/issues/10 #625

Closed

想要支持更多数据集？在这里提建议 #10

想要支持更多数据集？在这里提建议 #10

Comments

babysor commented Aug 16, 2021

yfq512 commented Aug 16, 2021

babysor commented Aug 16, 2021

hertz-pj commented Aug 17, 2021 • edited Loading

babysor commented Aug 17, 2021

hertz-pj commented Aug 17, 2021

babysor commented Aug 17, 2021

XiuChen-Liu commented Aug 17, 2021

0we commented Aug 23, 2021

loilih commented Aug 27, 2021

XiuChen-Liu commented Aug 27, 2021

loilih commented Aug 27, 2021

babysor commented Aug 28, 2021

XiuChen-Liu commented Aug 28, 2021

babysor commented Aug 28, 2021

XiuChen-Liu commented Aug 28, 2021

FawenYo commented Sep 2, 2021 • edited Loading

Zhiqing-Xu commented Sep 5, 2021

babysor commented Sep 6, 2021

Zhiqing-Xu commented Sep 6, 2021 via email

babysor commented Sep 7, 2021

ShouNichi commented Sep 26, 2021

babysor commented Sep 26, 2021

ShouNichi commented Sep 27, 2021 • edited Loading

Charlottecuc commented Sep 27, 2021

babysor commented Sep 27, 2021

LxKxC commented Oct 7, 2021

kslz commented Oct 11, 2021

babysor commented Oct 11, 2021

kslz commented Oct 11, 2021

lcp580 commented Oct 14, 2021

babysor commented Oct 14, 2021

woct0rdho commented Nov 7, 2021

ycMia commented Nov 24, 2021

joshua54321 commented Dec 23, 2021

babysor commented Dec 26, 2021

l-i-p-f commented Jan 30, 2022

ZeroAurora commented Aug 17, 2022

babysor commented Sep 10, 2022

123qq679 commented Jan 1, 2023

1044690543 commented Feb 27, 2024

hertz-pj commented Aug 17, 2021 •

edited

Loading

FawenYo commented Sep 2, 2021 •

edited

Loading

ShouNichi commented Sep 27, 2021 •

edited

Loading