pdf-icon

Product Guide

リアルタイム音声アシスタント

OpenAI ボイスアシスタント

XiaoLing ボイスアシスタント

AtomS3R-M12 Volcengine Kit

オフライン音声認識

Industrial Control

IoT Measuring Instruments

Air Quality

Module13.2 PPS

Ethernet Camera

ディップスイッチ使用ガイド

Module ExtPort For Core2

MeloTTS

  • 本節では、Raspberry Pi 5 上であらかじめコンパイルされた MeloTTS テキスト音声変換(TTS)サンプルを実行する方法のみを説明します。
  • モデル変換やサンプルソースコードのビルドについては、melotts.axcl を参照してください。
  1. ダウンロード
git clone https://github.com/ml-inory/melotts.axcl.git
chmod +x build_aarch64.sh
./build_aarch64.sh
  1. 事前コンパイル済みモデル
cd melotts.axcl
./download_models.sh

事前コンパイルモデルのダウンロード:

  1. ビルド

aarch64 プラットフォーム

./build_aarch64.sh
  1. MeloTTS の実行

melotts.axcl プロジェクトのルートディレクトリで実行します:

./install/melotts -s 文
./install/melotts -e ../MeloTTS-English-ax650/encoder-en.onnx -d ../MeloTTS-English-ax650/decoder-en-au.axmodel -l ../MeloTTS-English-ax650/lexicon-en.txt -t ../MeloTTS-English-ax650/tokens-en.txt --g ../MeloTTS-English-ax650/g-en-au.bin -s "M5Stack is a leading provider of IoT solutions, committed to providing developers worldwide with convenient and flexible development components and tools. "

実行結果:

m5stack@raspberrypi5:~/melotts.axcl $ ./install/melotts -e ../MeloTTS-English-ax650/encoder-en.onnx -d ../MeloTTS-English-ax650/decoder-en-au.axmodel -l ../MeloTTS-English-ax650/lexicon-en.txt -t ../MeloTTS-English-ax650/tokens-en.txt --g ../MeloTTS-English-ax650/g-en-au.bin -s "M5Stack is a leading provider of IoT solutions, committed to providing developers worldwide with convenient and flexible development components and tools. "
encoder: ../MeloTTS-English-ax650/encoder-en.onnx
decoder: ../MeloTTS-English-ax650/decoder-en-au.axmodel
lexicon: ../MeloTTS-English-ax650/lexicon-en.txt
token: ../MeloTTS-English-ax650/tokens-en.txt
sentence: M5Stack is a leading provider of IoT solutions, committed to providing developers worldwide with convenient and flexible development components and tools.
wav: output.wav
speed: 0.800000
sample_rate: 44100
Load encoder
Load decoder model
Encoder run take 535.47ms
decoder slice num: 9
Decode slice(1/9) take 40.15ms
Decode slice(2/9) take 39.87ms
Decode slice(3/9) take 39.86ms
Decode slice(4/9) take 39.75ms
Decode slice(5/9) take 40.19ms
Decode slice(6/9) take 39.79ms
Decode slice(7/9) take 39.77ms
Decode slice(8/9) take 39.82ms
Decode slice(9/9) take 40.34ms
Saved audio to output.wav
On This Page