StackFlow AI プラットフォーム
SmolVLM-256Mは世界で最小のマルチモーダルモデルです。画像とテキストの任意のシーケンス入力を受け取り、テキスト出力を生成することができます。 効率性を重視した設計が特徴で、画像に関する質問への回答、視覚コンテンツの説明、テキストの文字起こしなどを実行可能です。 軽量なアーキテクチャにより、マルチモーダルタスクで高い性能を維持しながらもデバイス上でのアプリケーションに適しています。 1GB 未満の GPU メモリで 1 枚の画像に対する推論を実行できます。
apt install llm-model-smolvlm-256m-ax630c