Как вручную установить модель преобразования текста в речь

Если автоматическая установка моделей по каким-либо причинам вам не подходит, вы всегда можете скачать и установить их вручную.

Установка NTLK

Переход в нужную директорию:
Перейдите в директорию ~/.wunjo на Unix-подобных системах или %USERPROFILE%/.wunjo на Windows. Доступ к этой директории можно также получить из приложения, нажав на значок папки в левой части экрана.
Работа с директорией rtvc:
В этой директории хранятся голосовые модели для клонирования голоса и NTLK. Она также содержит файл с ссылками для скачивания определённых моделей.
Скачивание NTLK punkt:
В директории nltk_data, должна быть создана папка tokenizers. В tokenizers необходимо скачать https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/tokenizers/punkt.zip и распаковать:

P.S. Обратите внимание, что директория до файлов NTLK punkt: .wunjo/rtvc/nltk_data/tokenizers/punkt/

Установка моделей RTVC

Переход в нужную директорию:
Перейдите в директорию ~/.wunjo на Unix-подобных системах или %USERPROFILE%/.wunjo на Windows. Доступ к этой директории можно также получить из приложения, нажав на значок папки в левой части экрана.
Работа с директорией rtvc:
В этой директории хранятся голосовые модели для клонирования голоса и NTLK. Она также содержит файл с ссылками для скачивания определённых моделей.
Скачивание моделей RTVC: Откройте файл rtvc.json, внутри вы найдете ссылки на скачивание rtvc моделей. Например:

"en": {
    "encoder": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/rtvc/encoder/english_encoder.pt",
    "synthesizer": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/rtvc/synthesizer/synthesizer.pt",
    "vocoder": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/rtvc/vocoder/english_vocoder.pt"
}

Означает, что вам необходимо создать директорию .wunjo/rtvc/en и скачать файлы english_encoder.pt, synthesizer.pt и english_vocoder.pt. Далее переименовать english_encoder.pt в encoder.pt, synthesizer.pt должен называться synthesizer.pt, english_vocoder.pt должен называться vocoder.pt. Аналогично для других языков.

Установка моделей TTS

Переход в нужную директорию:
Перейдите в директорию ~/.wunjo на Unix-подобных системах или %USERPROFILE%/.wunjo на Windows. Доступ к этой директории можно также получить из приложения, нажав на значок папки в левой части экрана.
Работа с директорией voice:
В этой директории хранятся голосовые модели. Она также содержит файл с ссылками для скачивания определённых моделей.
Содержание директории:
В каждой поддиректории находятся две модели: Encoder и Vocoder.
Изучение файла voice.json:
Откройте файл voice.json и обратите внимание на структуру. В качестве примера рассмотрим голос "Russian man".

Пример конфигурации:

{
  "Russian man": {
    "avatar_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/avatar/Man.png",
    "checkpoint_download":  "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/tacotron2/checkpoint_man",
    "waveglow_download":  "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/waveglows/waveglow.pt",
    "voice_control_cfg": {
      "psola": {
        "max_hz": 2100,
        "min_hz": 30,
        "analysis_win_ms": 40,
        "max_change": 2.955,
        "min_change": 0.795
      },
      "phase": {
        "nfft": 256,
        "hop": 64
      }
    },
    "user_dict": null,
    "text_handler": {
      "config": "ru",
      "out_max_length": 200
    },
    "modules": {
      "engine": "tacotron2",
      "vocoder": "waveglow"
    },
    "engine": {
      "tacotron2": {
        "model_path": "voice/man/checkpoint_man",
        "hparams_path": null,
        "options": {
          "steps_per_symbol": 10,
          "gate_threshold": 0.5
        }
      }
    },
    "vocoder": {
      "waveglow": {
        "model_path": "voice/man/waveglow_man.pt",
        "options": {
          "sigma": 0.666,
          "strength": 0.1
        }
      }
    }
  }
}

Ссылки для скачивания моделей:
В конфигурационном файле вы найдёте ссылки для скачивания моделей.
- Encoder: "checkpoint_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/tacotron2/checkpoint_man"
- Vocoder: "waveglow_download": "https://wladradchenko.ru/static/wunjo.wladradchenko.ru/waveglows/waveglow.pt"
Скачивание и расположение файлов:
Скачайте модели и разместите их в соответствующих директориях. Учтите, что файлы должны быть в исходном формате, не распакованными. Если Windows автоматически преобразует файлы в папки, верните их в исходное состояние (например, архивировав и переименовав расширение).
- Для модели checkpoint_man, видно по пути, что необходимо создайть поддиректорию man и поместите туда файл с названием checkpoint_man.

"model_path": "voice/man/checkpoint_man"

Для модели waveglow.pt, видно по пути, что нужно создать поддиректорию man, но перед размещением переименовать файл в waveglow_man.pt.

"model_path": "voice/man/waveglow_man.pt"

Аналогично вы можете работать и с другими голосами. Теперь вы знаете, как вручную установить голосовые модели.

Navigation

Home
English
- How to install the application
- How to change the default directory for the .wunjo folder
- How to add another application language
- Speech documentation
  - How manually install model for text to speech
  - How to synthesize text to speech
  - How to clone a voice
  - How to translate speech to text
- Deepfake documentation
  - How to manually set models for deepfake animation of the face and lips
  - How to animate a face from an image
  - How to animate lip movement under audio
  - How to face swap target video face on source face from photo
  - How to use retouch to improve quality deepfake or remove object
  - How to get segmentation mask
  - How to use deepfake emotion
  - How to use video editor tools
- Diffusion documentation
  - How use video to video by text prompt
- How to use the GPU in the application
- File is too big
- Support the Project
- Acknowledgements
- Author
Русский
- Как установить приложение
- Как изменить директорию по умолчанию для папки .wunjo
- Как добавить другой язык приложения
- Документация по речи
  - Как вручную установить модель преобразования текста в речь
  - Как синтезировать речь из текста
  - Как клонировать голос
  - Как перевести речь в текст
- Документация по дипфейкам
  - Как вручную установить модели для дипфейка анимации лица и губ
  - Как анимировать лицо из изображения
  - Как анимировать движение губ под аудио
  - Как поменять лицо целевого видео на исходное лицо с фотографии
  - Как использовать ретушь для улучшения качества дипфейка или удаления объектов с видео
  - Как получить маску объектов
  - Как изменить эмоции человека на видео
  - Как использовать инструменты видеоредактора
- Документация по diffusion
  - Как изменить видео текстовым запросом
- Как использовать GPU в приложении
- Файл слишком большой
- Поддержите проект
- Благодарности
- Автор

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Как вручную установить модель преобразования текста в речь

Установка NTLK

Установка моделей RTVC

Установка моделей TTS

Navigation

Clone this wiki locally