
StackFlow AI プラットフォーム
Whisper は、事前学習済みの自動音声認識(ASR)および音声翻訳モデルです。本モデルは 680,000 時間のラベル付きデータで訓練され、微調整なしで複数のデータセットや分野に対して高い汎化性能を示します。
このモデルは多言語音声認識と翻訳に対応しています。
エンコード時間:248.0 ミリ秒
平均デコード時間:32.54 ミリ秒
apt install llm-model-whisper-tiny sudo apt install llm-model-whisper-tiny-axcl