Skip to content
This repository has been archived by the owner on Oct 1, 2021. It is now read-only.

Не работает. #16

Open
alexgamechan opened this issue Jul 7, 2020 · 31 comments
Open

Не работает. #16

alexgamechan opened this issue Jul 7, 2020 · 31 comments

Comments

@alexgamechan
Copy link

Запустил демо-версию, не работает.
image

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Проблема с вашим файлом. Слева вверху есть значок папки, там можно вручную просмотреть(скачать) файл

@alexgamechan
Copy link
Author

Может быть в этом ошибка? Если да, то куда перекидывать этот файл?
image

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Гугл ругается
"В данный момент просмотр и скачивание этого файла недоступны.
За последнее время этот файл просматривали или скачивали слишком часто. Повторите попытку позже. Если файл очень большой или открыт для доступа широкому кругу пользователей, возможен отказ в доступе к нему в течение ближайших суток. Если через 24 часа ситуация не изменится, обратитесь к администратору домена."

@alexgamechan
Copy link
Author

Если вы про pretrained.zip, то я успел скачать.

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Тогда в чём проблема?
на первом скрине ругается на ваш файл
на втором, что не может скачать pretrained.zip. Его надо разархивировать в гланой папке

@alexgamechan
Copy link
Author

Хорошо, спасибо.

@alexgamechan
Copy link
Author

alexgamechan commented Jul 7, 2020

image
Всеравно. В какой директории нужно переместить файл?

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

В Multi

@DenTerNG
Copy link

DenTerNG commented Jul 7, 2020

image
А если точнее то куда?

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Копирует репазиторий, создавая папку Multi-Tacotron-Voice-Cloning
!git clone https://github.com/vlomme/Multi-Tacotron-Voice-Cloning.git
Переместиться в папку Multi-Tacotron-Voice-Cloning
cd Multi-Tacotron-Voice-Cloning/
Скачать веса в текущую папку(Multi-Tacotron-Voice-Cloning)
!gdown https://drive.google.com/uc?id=1aQBmpflbX_ePUdXTSNE4CfEL9hdG2-O8
Разархивировать веса в текущую папку(Multi-Tacotron-Voice-Cloning)
!unzip pretrained.zip

@Object21
Copy link

Object21 commented Jul 7, 2020

а мне что делать?
Снимок

@alexgamechan
Copy link
Author

В Multi

почему-то не работает, всеравно. Не хочет распаковаться.

@DenTerNG
Copy link

DenTerNG commented Jul 7, 2020

https://drive.google.com/uc?id=1ks_luZooH9d2K0w3wLKD3kxPKVN1ogc-
если надо то вот другая ссылка

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Откуда вас столько взялось?

  1. Еще раз, из-за большого наплыва людей, гугл ограничил скачивание весов. Попробуйте по ссылке выше
  2. Ошибка could not convert string to float скорее всего вызвана тем, что нет файлы. А файла нет, так как не выполнилась прошлая строчка, а прошлая команда не выполнилась из-за отсутствия весов см пункт 1
    Предлагаю сбросить сеанс в колабе, поменять ссылку на веса и заного запустить каждую строчку, наблюдая за результатами работы.

@Object21
Copy link

Object21 commented Jul 7, 2020

спасибо большое!

@TACHOEBELL
Copy link

eICtV5ocyUU
что делать если вставил файл вроде туда, название везде поменял, а результата вообще нет

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Не знаю. Посмотрите папку где вы находитесь. Возможно не в Multi-Tacotron-Voice-Cloning
Попробуйте перезапустить ячейку
И вы всегда можете просто скачать файл из панели слева. Вам не обязательно его выводить на экран

@tg-bomze
Copy link

tg-bomze commented Jul 7, 2020

Ох сколько людей тебе овер нагнал. Исчерпали квоту на скачивание весов) Теперь еще и как тех поддержка тебе сидеть тут) Чтож, крепись, Влад!

@vlomme
Copy link
Owner

vlomme commented Jul 7, 2020

Кружок по DS?
Да было бы зачем. Работает сейчас плохо, а судя по вопросам, врядли из них кто-то в ближайшее время возьмётся за улучшение

@mib32
Copy link

mib32 commented Jul 14, 2020

Круто конечно, но качество не доставляет( Загрузил свой 5-секундный файл (на английском) - вообще только два слова может выговорить, остальное мясо

@mib32
Copy link

mib32 commented Jul 14, 2020

Кстати, вопрос - это важно в каком формате предоставлять файл - я имею в виду sample rate, bit rate, stereo/mono?

@vlomme
Copy link
Owner

vlomme commented Jul 14, 2020

Можно попробовать с разными файлами и по несколько раз, может получиться лучше.
Формат не важен, там перевод в мелспектрограмму

@VinerX
Copy link

VinerX commented Sep 22, 2020

image
Добрый вечер! Не подскажите, почему выдает ошибку вот эту?

"Ошибка could not convert string to float скорее всего вызвана тем, что нет файлы. А файла нет, так как не выполнилась прошлая строчка, а прошлая команда не выполнилась из-за отсутствия весов см пункт 1", а что за весы, я не особо понял в данном ответе. Заранее спасибо за ответ.

@vlomme
Copy link
Owner

vlomme commented Sep 22, 2020

Вам нужно последовательно запустить все ячейки, убедившись, что нигде нет ошибок

@NeBomj
Copy link

NeBomj commented Oct 22, 2020

Здравствуйте, у меня проблема с вашим приложением, я использовал онлайн версию на Google Colaboratory по ссылке https://colab.research.google.com/github/vlomme/Multi-Tacotron-Voice-Cloning/blob/master/Multi_Tacotron_Voice_Cloning.ipynb
Программа не хочет озвучивать текст предоставленным голосом, вместо него использует голос стандартного мужика.
Первые 2 раза я запустил - он озвучил нужным голосом, потом только стандартным, даже смена браузера (и аккаунта) не помогла.
Я и на свой гугл диск загружал этот pretrained.zip и названия файлов менял и пытался вообще удалить оттуда изначальный голос, или заменить ex.wav своим, чтобы у него просто выбора не было. Он все равно использует стандартный. Не пробовал разве что использовать формат НЕ .wav
image
Скриншот - https://prnt.sc/v4rnqr
upd. Еще он будто английскую часть озвучивает нужным голосом, а русскую нужным

@vlomme
Copy link
Owner

vlomme commented Oct 22, 2020

Программа не хочет озвучивать текст предоставленным голосом, вместо него использует голос стандартного мужика.

В обучающей выборке было мало голосов, он и не научился

@NeBomj
Copy link

NeBomj commented Oct 22, 2020

Программа не хочет озвучивать текст предоставленным голосом, вместо него использует голос стандартного мужика.

В обучающей выборке было мало голосов, он и не научился

Там 4 минуты было, но всего 1 вид голоса. Надо больше материала тип?
И по логике он же вообще только шипение должен выдавать, если не научился

@vlomme
Copy link
Owner

vlomme commented Oct 23, 2020

Вы обучались на 4 минутах? Так это не работает, надо >1000 часов 1000 голосов
Или вы во время использования дали 4 минутный образец? В этот момент обучения не происходит.
Если вы использовали мои веса модели, то он будет выдавать что-то похожее на голос из обучающей выборки, или шипение, если голос сильно другой.

@NeBomj
Copy link

NeBomj commented Oct 23, 2020

Вы обучались на 4 минутах? Так это не работает, надо >1000 часов 1000 голосов
Или вы во время использования дали 4 минутный образец? В этот момент обучения не происходит.
Если вы использовали мои веса модели, то он будет выдавать что-то похожее на голос из обучающей выборки, или шипение, если голос сильно другой.

Я не очень вас понимаю, но я добавил свой файл exam.wav (2.wav это тот же самый файл, просто с другим названием) в папку Multi-Tacotron-Voice-Cloning. И вписал его туда вместо ex.wav в скрипт "!python demo_cli.py" . Насколько я слышал из ютуба - туда можно вписать даже 10 секундную запись. Я так понимаю вы это "образец" назвали.
image
Дак по итогу что мне надо сделать для того, чтобы он заговорил нужным мне голосом? С ваших слов я так понимаю - мне надо "обучающую выборку" изменить на более подходящую? Можно ли это через Colaboratory сделать?

@ElliotZeroNull
Copy link

image
Пробовал разные версии librosa ставить, там уже проблемы, связанные с другими библиотеками, есть фикс?

@ElliotZeroNull
Copy link

Исправил, почитал документацию, открыл demo_cli.py, и поменял файл:
Добавил строчку import soundfile as sf
image

и заменил librosa.output.write_wav на sf.write
image

Теперь сохраняет

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

No branches or pull requests

11 participants