pdf-icon

StackFlow AI プラットフォーム

アプリケーション

CVビジョンアプリケーション

VLMマルチモーダル

大規模言語モデル (LLM)

音声アシスタント

Whisper-tiny

説明

Whisper は、事前学習済みの自動音声認識(ASR)および音声翻訳モデルです。本モデルは 680,000 時間のラベル付きデータで訓練され、微調整なしで複数のデータセットや分野に対して高い汎化性能を示します。

利用可能な NPU モデル

whisper-tiny

対応プラットフォーム:LLM630 コンピューティングキット、Module LLM および Module LLM キット

  • このモデルは多言語音声認識と翻訳に対応しています。

  • エンコード時間:248.0 ミリ秒

  • 平均デコード時間:32.54 ミリ秒

インストール

apt install llm-model-whisper-tiny

対応プラットフォーム:Raspberry Pi5

インストール

sudo apt install llm-model-whisper-tiny-axcl
On This Page