M5Module-LLM Arduino驱动库API文档。
M5ModuleLLM
用于初始化LLM Module, 并且提供内部成员用于快速初始化LLM的各个单元, 方便根据自己的需求构建应用。
class M5ModuleLLM {
public:
bool begin(Stream* targetPort);
bool checkConnection();
void update();
m5_module_llm::ApiSys sys;
m5_module_llm::ApiLlm llm;
m5_module_llm::ApiAudio audio;
m5_module_llm::ApiTts tts;
m5_module_llm::ApiKws kws;
m5_module_llm::ApiAsr asr;
m5_module_llm::ModuleMsg msg;
m5_module_llm::ModuleComm comm;
private:
};
函数原型:
bool begin(Stream* targetPort);
功能说明:
传入参数:
返回值:
函数原型:
bool checkConnection();
功能说明:
sys.ping
指令, 检查LLM Module连接状态传入参数:
返回值:
函数原型:
void update();
功能说明:
传入参数:
返回值:
M5ModuleLLM
的内部成员ApiSys sys
用于控制SYS单元实现系统复位等操作。
函数原型:
int ping();
功能说明:
sys.ping
指令, 检查LLM Module连接状态传入参数:
返回值:
函数原型:
int reset(bool waitResetFinish = true);
功能说明:
sys.reset
指令, 复位软件服务。传入参数:
返回值:
函数原型:
int reboot();
功能说明:
sys.reboot
指令, 复位系统。传入参数:
返回值:
M5ModuleLLM
的内部成员ApiAudio audio
用于控制AUDIO单元的初始化和配置。
函数原型:
String setup(ApiAudioSetupConfig_t config = ApiAudioSetupConfig_t(), String request_id = "audio_setup");
功能说明:
传入参数:
ApiAudioSetupConfig_t config:
struct ApiAudioSetupConfig_t {
int capcard = 0;
int capdevice = 0;
float capVolume = 0.5;
int playcard = 0;
int playdevice = 1;
float playVolume = 0.15;
};
参数 | 描述 | 输入值 |
---|---|---|
capcard | 麦克风声卡的索引 | 系统默认声卡:0 |
capdevice | 麦克风设备索引 | 板载硅麦:0 |
capVolume | 输入的音量 | 0.0~10.0 (1<volume将增益, 默认值为0.5) |
playcard | 扬声器声卡的索引 | 系统默认声卡:0 |
playdevice | 扬声器设备索引 | 板载扬声器:1 |
playVolume | 输出的音量 | 0.0~10.0 (1<volume将增益, 默认值为0.5) |
返回值:
M5ModuleLLM
的内部成员ApiKws kws
用于控制KWS单元的初始化和配置。
函数原型:
String setup(ApiKwsSetupConfig_t config = ApiKwsSetupConfig_t(), String request_id = "kws_setup");
功能说明:
传入参数:
ApiKwsSetupConfig_t config:
struct ApiKwsSetupConfig_t {
String kws = "HELLO";
String model = "sherpa-onnx-kws-zipformer-gigaspeech-3.3M-2024-01-01";
String response_format = "kws.bool";
String input = "sys.pcm";
bool enoutput = true;
};
参数 | 描述 | 输入值 |
---|---|---|
model | 转换模型 | 英文模型: "sherpa-onnx-kws-zipformer-gigaspeech-3.3M-2024-01-01" 中文模型: "sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01" |
kws | KWS唤醒词文本设置 | 不允许中文/英文混合, 英文要求全大写 |
enoutput | 启用UART输出 | 启用: true 禁用: false |
返回值:
M5ModuleLLM
的内部成员ApiAsr asr
用于控制ASR单元的初始化和配置。
函数原型:
String setup(ApiAsrSetupConfig_t config = ApiAsrSetupConfig_t(), String request_id = "asr_setup");
功能说明:
传入参数:
ApiAsrSetupConfig_t config:
struct ApiAsrSetupConfig_t {
String model = "sherpa-ncnn-streaming-zipformer-20M-2023-02-17";
String response_format = "asr.utf-8.stream";
String input = "sys.pcm";
bool enoutput = true;
bool enkws = true;
float rule1 = 2.4;
float rule2 = 1.2;
float rule3 = 30.0;
};
参数 | 描述 | 输入值 |
---|---|---|
model | 转换模型 | 英文模型: "sherpa-ncnn-streaming-zipformer-20M-2023-02-17" 中文模型: "sherpa-ncnn-streaming-zipformer-zh-14M-2023-02-23" |
response_format | 输出格式 | 普通输出: "asr.utf-8" 流式输出: "asr.utf-8.stream" |
input | 输入 | LLM输入: "llm.xxx"(输入llm单元的work_id) UART输入: "tts.utf-8" UART流式输入: "tts.utf-8.stream" |
enkws | 是否支持通过KWS唤醒 | 可通过KWS唤醒, 并进行ASR: true 不通过KWS唤醒, ASR单元将持续工作: false |
rule1 | 唤醒到未识别到内容超时时间 | 单位:秒 |
rule2 | 识别最大间隔时间 | 单位:秒 |
rule3 | 识别最长超时时间 | 单位:秒 |
enoutput | 启用UART输出 | 启用: true 禁用: false |
返回值:
M5ModuleLLM
的内部成员ApiLlm llm
用于控制LLM单元的初始化和配置。
函数原型:
String setup(ApiLlmSetupConfig_t config = ApiLlmSetupConfig_t(), String request_id = "llm_setup");
功能说明:
传入参数:
struct ApiLlmSetupConfig_t {
String prompt;
String model = "qwen2.5-0.5b";
String response_format = "llm.utf-8.stream";
String input = "llm.utf-8.stream";
bool enoutput = true;
bool enkws = true;
int max_token_len = 127;
};
参数 | 描述 | 输入值 |
---|---|---|
model | 转换模型 | 预置模型 "qwen2.5-0.5b" |
response_format | 输出格式 | 普通输出: "llm.utf-8" 流式输出: "llm.utf-8.stream" |
input | 输入 | ASR输入: "asr.xxx"(输入asr单元的work_id) UART输入: "llm.utf-8" UART流式输入: "llm.utf-8.stream" |
enkws | KWS唤醒是否终止过程 | KWS打断过程: true KWS不打断过程: false |
max_length | 配置最大输出token(最大返回推理文本长度) | 最大值: 1024, 推荐使用127 |
prompt | 模型初始化提示词 | String |
enoutput | 启用UART输出 | 启用: true 禁用: false |
返回值:
函数原型:
int inference(String work_id, String input, String request_id = "llm_inference");
功能说明:
M5ModuleLLM.msg
中的responseMsgList
列表容器中。传入参数:
返回值:
函数原型:
int inferenceAndWaitResult(String work_id, String input, std::function<void(String&)> onResult, uint32_t timeout = 5000, String request_id = "llm_inference");
功能说明:
传入参数:
返回值:
M5ModuleLLM
的内部成员ApiTts tts
用于控制TTS单元的初始化和配置。
函数原型:
String setup(ApiTtsSetupConfig_t config = ApiTtsSetupConfig_t(), String request_id = "tts_setup");
功能说明:
传入参数:
ApiTtsSetupConfig_t config:
struct ApiTtsSetupConfig_t {
String model = "single_speaker_english_fast";
String response_format = "tts.base64.wav";
String input = "tts.utf-8.stream";
bool enoutput = true;
bool enkws = true;
};
参数 | 描述 | 输入值 |
---|---|---|
model | 转换模型 | 英文模型: "single_speaker_english_fast" 中文模型: "single_speaker_fast" |
input | 输入 | LLM输入: "llm.xxx"(输入llm单元的work_id) UART输入: "tts.utf-8" UART流式输入: "tts.utf-8.stream" |
enkws | KWS唤醒是否终止过程 | KWS打断过程: true KWS不打断过程: false |
enoutput | 启用UART输出 | 启用: true 禁用: false |
返回值:
函数原型:
int inference(String work_id, String input, uint32_t timeout = 0, String request_id = "tts_inference");
功能说明:
传入参数:
返回值:
M5ModuleLLM
的内部成员ModuleMsg msg
提供了responseMsgList
容器用于用于缓存接收LLM Module返回的各种信息。参考以下案例,在主循环中遍历获取返回结果。
void loop()
{
module_llm.update();
// Handle response msg
for (auto& msg : module_llm.msg.responseMsgList) {
// KWS msg
if (msg.work_id == kws_work_id) {
Serial.printf(">> Keyword detected\n");
}
// ASR msg
if (msg.work_id == asr_work_id) {
if (msg.object == "asr.utf-8.stream") {
// Parse and get asr result
JsonDocument doc;
deserializeJson(doc, msg.raw_msg);
String asr_result = doc["data"]["delta"].as<String>();
Serial.printf(">> %s\n", asr_result.c_str());
}
}
}
module_llm.msg.responseMsgList.clear();
}
M5ModuleLLM_VoiceAssistant
用于快速创建LLM语音助手实例, 快速实现KWS(语音唤醒)->ASR(语音转文本)->LLM(大模型推理)->TTS(文本转语音)。
M5ModuleLLM
实例传入构造函数, 并注册对应事件的回调函数即可完成语音助手创建。/*
* SPDX-FileCopyrightText: 2024 M5Stack Technology CO LTD
*
* SPDX-License-Identifier: MIT
*/
#include <Arduino.h>
#include <M5Unified.h>
#include <M5ModuleLLM.h>
M5ModuleLLM module_llm;
M5ModuleLLM_VoiceAssistant voice_assistant(&module_llm);
/* On ASR data callback */
void on_asr_data_input(String data, bool isFinish, int index)
{
M5.Display.setTextColor(TFT_GREEN, TFT_BLACK);
M5.Display.printf(">> %s\n", data.c_str());
/* If ASR data is finish */
if (isFinish) {
M5.Display.setTextColor(TFT_YELLOW, TFT_BLACK);
M5.Display.print(">> ");
}
};
/* On LLM data callback */
void on_llm_data_input(String data, bool isFinish, int index)
{
M5.Display.print(data);
/* If LLM data is finish */
if (isFinish) {
M5.Display.print("\n");
}
};
void setup()
{
M5.begin();
M5.Display.setTextSize(2);
M5.Display.setTextScroll(true);
/* Init module serial port */
Serial2.begin(115200, SERIAL_8N1, 16, 17); // Basic
// Serial2.begin(115200, SERIAL_8N1, 13, 14); // Core2
// Serial2.begin(115200, SERIAL_8N1, 18, 17); // CoreS3
/* Init module */
module_llm.begin(&Serial2);
/* Make sure module is connected */
M5.Display.printf(">> Check ModuleLLM connection..\n");
while (1) {
if (module_llm.checkConnection()) {
break;
}
}
/* Begin voice assistant preset */
M5.Display.printf(">> Begin voice assistant..\n");
int ret = voice_assistant.begin("HELLO");
if (ret != MODULE_LLM_OK) {
while (1) {
M5.Display.setTextColor(TFT_RED);
M5.Display.printf(">> Begin voice assistant failed\n");
}
}
/* Register on ASR data callback function */
voice_assistant.onAsrDataInput(on_asr_data_input);
/* Register on LLM data callback function */
voice_assistant.onLlmDataInput(on_llm_data_input);
M5.Display.printf(">> Voice assistant ready\n");
}
void loop()
{
/* Keep voice assistant preset update */
voice_assistant.update();
}
enum ModuleLLMErrorCode_t {
MODULE_LLM_OK = 0,
MODULE_LLM_RESET_WARN = -1,
MODULE_LLM_JSON_FORMAT_ERROR = -2,
MODULE_LLM_ACTION_MATCH_FAILED = -3,
MODULE_LLM_INFERENCE_DATA_PUSH_FAILED = -4,
MODULE_LLM_MODEL_LOADING_FAILED = -5,
MODULE_LLM_UNIT_NOT_EXIST = -6,
MODULE_LLM_UNKNOWN_OPERATION = -7,
MODULE_LLM_UNIT_RESOURCE_ALLOCATION_FAILED = -8,
MODULE_LLM_UNIT_CALL_FAILED = -9,
MODULE_LLM_MODEL_INIT_FAILED = -10,
MODULE_LLM_MODEL_RUN_FAILED = -11,
MODULE_LLM_MODULE_NOT_INITIALISED = -12,
MODULE_LLM_MODULE_ALREADY_WORKING = -13,
MODULE_LLM_MODULE_NOT_WORKING = -14,
MODULE_LLM_NO_UPDATEABLE_MODULES = -15,
MODULE_LLM_NO_MODULES_AVAILABLE_FOR_UPDATE = -16,
MODULE_LLM_FILE_OPEN_FAILED = -17,
MODULE_LLM_WAIT_RESPONSE_TIMEOUT = -97,
MODULE_LLM_RESPONSE_PARSE_FAILED = -98,
MODULE_LLM_ERROR_NONE = -99,
};