StackFlow AI プラットフォーム
Whisper は、自動音声認識(ASR)と音声翻訳のための事前学習モデルです。68 万時間のラベル付きデータで学習された Whisper モデルは、微調整を必要とせずに多くのデータセットやドメインに汎化する強力な能力を示しています。
サポートプラットフォーム: LLM630 Compute Kit、Module LLM、Module LLM Kit
このモデルは多言語の音声認識と翻訳をサポートしています。
エンコード 660.31ms
平均デコード 51.11ms
apt install llm-model-whisper-base