OpenAI API と互換性のある使用方法を提供しています。StackFlow パッケージをインストールするだけで利用できます。
apt install lib-llm llm-sys llm-llm llm-openai-api apt install llm-model-qwen2.5-1.5b-int4-ax650 curl http://127.0.0.1:8000/v1/models \
-H "Content-Type: application/json" curl http://127.0.0.1:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxxxxxxx" \
-d '{
"model": "qwen2.5-1.5B-Int4-ax650",
"messages": [
{"role": "developer", "content": "You are a helpful home assistant."},
{"role": "user", "content": "Write a one-sentence bedtime story about a unicorn."}
]
}'
from openai import OpenAI
client = OpenAI(
api_key="sk-",
base_url="http://127.0.0.1:8000/v1"
)
client.models.list()
print(client.models.list()) from openai import OpenAI
client = OpenAI(
api_key="sk-",
base_url="http://127.0.0.1:8000/v1"
)
completion = client.chat.completions.create(
model="qwen2.5-1.5B-Int4-ax650",
messages=[
{"role": "developer", "content": "You are a helpful home assistant."},
{"role": "user", "content": "Turn on the light!"}
]
)
print(completion.choices[0].message) ChatBox を取得します。
Setup Provider をクリックし、モデルプロバイダーを追加します。
Add provider で、Name に AI Pyramid を入力し、API Mode に OpenAI API Compatible を選択します。
API Host に AI Pyramid の IP と API パスを入力し、インストール済みのモデルを取得して追加します。
LLM8850 が提供する qwen2.5-1.5B-Int4-ax650 モデルを追加します。
最大コンテキストメッセージ長を 0 に変更します。
ストリーミング出力に対応しています。
