StackFlow AI プラットフォーム
Search
Whisper は、自動音声認識(ASR)と音声翻訳のための事前学習モデルです。68 万時間のラベル付きデータで学習された Whisper モデルは、微調整を必要とせずに多くのデータセットやドメインに汎化する強力な能力を示しています。
このモデルは多言語の音声認識と翻訳をサポートしています。
エンコード 1606.08ms
平均デコード 148.92ms
apt install llm-model-whisper-small