-
Notifications
You must be signed in to change notification settings - Fork 5.2k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
想要支持更多数据集?在这里提建议 #10
Comments
朋友,你是怎么跑起来的,我运行python synthesizer_preprocess_audio.py <datasets_root> 就迷惑了,这个datasets_root是指什么呢? |
假如你下载的 aidatatang_200zh文件放在D盘,train文件路径为 |
推荐aishell3数据集,稍微干净一些,但是数据量很少。另外datasets_root确定是 |
是的,如果理解参数名,这里原本是希望同时支持多个dataset,所以叫datasets_root。 |
那这里如果我把aishell3和slr68的数据都放在datasets_root文件夹内,就可以同时跑两个数据集吗 |
程序逻辑还没实现 囧 目前我是手动分开跑 |
推薦標貝數據集 |
aishell3 和 Mozilla Common Voice 数据集 |
aidatatang_200zh在哪里下载呢 |
|
谢谢 |
#59 已支持aishell3,不过训练效果没增强 |
大佬,現在你提供的版本還需要使用原項目的 encoder 和 vocoder 嗎 |
已经不再需要下载了 |
好的,謝謝大佬的回覆,另外推薦 zhvoice數據集: https://gitee.com/DataTraveler_0817/zhvoice |
請問有沒有大佬能提供 Mozilla Common Voice 架構的支援... 原 repo 中有人也發過類似的 issue 可以參考 CorentinJ/Real-Time-Voice-Cloning#819 |
老哥,我留意到你的aidatatang200 数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。 我的问题是,1. 我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛? 2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3. 有更多细节我们可以私信交流一下么 |
|
你的群二维码过期了,可以给个微信么,有一些细节还是想请教
…On Mon, 6 Sept 2021 at 01:54, Vega ***@***.***> wrote:
老哥,我留意到你的aidatatang200
数据集里声音背景噪音非常重,而且大部分是男声,我对这个项目非常感兴趣,计划按照你的重新找女声(涵盖不同音色声线,萝莉,少女,御姐)重新录制干净无噪声的数据集,我也在思考男女声分开训练的可能性。此外我有一块A100显卡可以在较短时间内完成各种计算。我也愿意分享我的成果。
我的问题是,1.
我对音频文件的录制格式,编码,没有经验,可以简单讲一下和这个aidatatang数据集相同的音频格式是有什么参数需要我在录制和process的过程中需要注意的嘛?
2. 我没有过多去了解aidatatang 数据组里 .metadata 和 .trn 文件的用途,可以大致说一下么? 3.
有更多细节我们可以私信交流一下么
1.
录制的话,建议是5-10秒长度的大于等于16khz的音频,每个语音单一说话人,尽可能多的覆盖男女生、不同声色(不要单独分开训练,混一起效果好)。预处理的话也就是把音频去噪,切割满足上面这个需求。
2. 你指下载下来的数据集吗?
3. 私信的话,可以走邮件,或者扫这里的二维码: > > [image: WechatIMG54]
<https://user-images.githubusercontent.com/7423248/130546423-5588bc46-af02-4eda-a122-f64d8f4b7627.jpeg>
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#10 (comment)>,
or unsubscribe
<https://github.com/notifications/unsubscribe-auth/ALODQYY2IKTK5WWYPXGOSL3UARJPVANCNFSM5CG2ISUQ>
.
Triage notifications on the go with GitHub Mobile for iOS
<https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675>
or Android
<https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub>.
|
#20 这里有新的二维码 |
https://github.com/fighting41love/zhvoicez |
等你好消息,不过我访问不了 |
是指数据集不能访问吗?如果是百度云不能访问的话我这边可以转mega或者GD -----------------更新--------------------- 访问不了是链接不知怎的最后多了个z,删掉就行了 |
@babysor 二维码过期了,求重发一个~ |
群满了,加不进去,求作者微信号 |
有没有可能提取游戏里的音频素材,或者关闭背景音乐后用软件录制 |
理论可行,可以联系我讨论 |
你好 已发到你的gmail里 [email protected] 上面的二维码过期了 |
新增标贝数据支持BZNSYP |
都在分支上, #75 |
给个思路,那些galgame都是几十万字的文本与语音对应的数据集 |
牵涉版权问题哦 🌱 |
作者您好,请问现在支持自动跑多个数据集了吗?如果手动分开跑,是如何操作的呢? |
可以, https://zhuanlan.zhihu.com/p/417134499 分开跑比较麻烦,因为混合起来就不太能区分了 |
请问有粤语数据集吗? |
https://www.openslr.org/18/ |
最好确保有100hrs级别的语音 |
C:\Users\Administrator\Desktop\mockingbird\MockingBird-main>python pre.py D:\ -d data_aishell3 |
求进群 |
已支持的有 aidatatang(已验证200zh), Magic Data(已验证open SLR68)
需要更多请在这里提建议,并+1投票,将为大家补充支持
The text was updated successfully, but these errors were encountered: