AIUI文档中心
AIUI文档导览
1. AIUI平台服务
1.1 AIUI平台介绍
1.2 AIUI应用介绍
1.3 AIUI服务链路介绍
1.4 AIUI平台能力概述
1.5 快速体验
2. AIUI应用配置
2.1 应用发布
2.2 语义精简协议介绍
2.3 基础配置
2.4 语义模型配置
2.5 回复角色配置
2.6 语音识别配置
2.7 结构化语义配置
2.8 星火大模型配置
2.9 语音合成配置
2.10 应用后处理配置
2.11 三方大模型配置
3. AIUI SDK开发
3.1 AIUI SDK接入流程
3.2 AIUI SDK基础信息
3.2.1 SDK接口说明
3.2.2 参数配置说明
3.2.3 消息事件说明
3.2.4 SDK状态说明
3.2.5 数据发送方式
3.2.6 回调解析说明
3.2.7 交互结果协议说明
3.3 AIUI SDK基础能力
3.3.1 流式识别
3.3.2 离线识别
3.3.3 语音唤醒
3.3.4 语音合成
3.3.5 用户个性化
3.3.6 自定义参数
3.4 传统语义链路接入
3.4.1 链路配置说明
3.4.2 个性化数据使用
3.5 通用大模型链路接入
3.5.1 链路配置说明
3.5.2 个性化数据使用
3.5.3 超拟人合成
3.5.4 声音复刻
3.6 极速超拟人链路接入
3.6.1 链路配置说明
3.6.2 个性化数据使用
3.6.3 流式合成
3.6.4 声音复刻
3.6.5 RTOS系统SDK接入
3.7 错误码列表
3.8 发音人列表
4. AIUI API开发
4.1 传统语义链路
4.1.1 交互API
4.1.2 用户个性化API
4.1.3 合成能力使用
4.2 通用大模型链路
4.2.1. 服务鉴权
4.2.2 交互API
4.2.3 用户个性化API
4.2.4 声音复刻API
4.2.5 合成能力使用
4.3 极速超拟人链路
4.3.1 服务鉴权
4.3.2 交互API
4.3.3 用户个性化API
4.3.4 声音复刻API
4.3.5 合成能力使用
5. 自定义业务
技能工作室概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
智能体开发
智能体对接
问答库开发
语句问答
关键词问答
文档问答
设备人设开发
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
6. 硬件模组
RK3328 降噪板
RK3328降噪板白皮书
RK3328降噪板使用手册
RK3328降噪板规格书
RK3328降噪板协议手册
RK3328 AIUI评估板开发套件
RK3328评估板白皮书
RK3328评估板使用手册
RK3328评估板规格书
RK3328评估板开发手册
RK3588 AIUI多模态开发套件
RK3588一体机多模态产品规格书
RK3588多模态套件使用手册
视频传输协议
识别语义传输协议
音频传输协议
ZG803 离线语音识别套件
ZG803 产品白皮书
USB声卡套件
USB声卡产品白皮书
USB声卡使用指南
AC7911B AIUI语音开发套件
AC7911B-产品白皮书
AC7911B-快速体验指南
AIUI评估板接入
集成方式
软件包说明
AIUIServiceKitSDK
串口SDK
评估板参数配置
调试升级
7. 常见问题处理
7.1 AIUI常见问题
7.2 评估板常见问题
7.3 动态实体常见问题
8. 联系方式
9. 服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
3.3.3 语音唤醒
<div style="max-width: 100%; margin: 20px auto;"> <!-- 便签卡片容器 --> <div style="background-color: #ffffff; border-radius: 8px; box-shadow: 0 2px 8px rgba(0,0,0,0.1); overflow: hidden; font-family: 'Comic Sans MS', cursive, sans-serif;"> <!-- 便签头部 --> <div style="background-color: #F4F8FA; padding: 1px 10px; border-bottom: 1px solid #dee2e6; display: flex; justify-content: space-between; align-items: center;"> <div style="color: #0E42D2; font-weight: bold;font-size: 1.3rem;">语音唤醒能力概述</div> <div> </div> </div> <!-- 带横线的内容区域 --> <div style="padding: 25px; line-height: 29px; background-image: linear-gradient(transparent 26px, #dee2e6 27px, #dee2e6 27px, transparent 27px); background-size: 100% 28px; min-height: 100px; color: #333;"> <div>AIUI SDK配合唤醒SDK,配置语音唤醒能力后,用户语音说出唤醒词后,AIUI SDK进入“working”状态,处理并响应用户后续的语音指令。</div> <div>本文档主要介绍单麦系统录音语音唤醒集成方式,如开发者是多麦阵列+降噪CAE+AIUI一体使用,可联系AIUI技术同事咨询。</div> <a href="#集成步骤" style="color: #6f42c1; font-weight: 500;"> <strong>- 1.集成步骤>>>点击跳转</strong></a> <a href="#自定义唤醒词更换" style="color: #6f42c1; font-weight: 500;margin-left: 40px;">    <strong>- 2.自定义唤醒词更换>>>点击跳转</strong></a> <div></div> </div> <!-- 便签底部 --> </div> </div> </div> <div id="集成步骤"> </div> ## 1. 集成步骤 ### 1.1. aiui参数配置 在aiui参数配置文件(aiui.cfg)中开启语音唤醒配置,主要涉及三个部分: - `speech` 下配置语音唤醒开关 - `ivw` 下配置需加载的唤醒库和唤醒参数配置文件 - `recorder` 下配置录音音频通道 ~~~ json // 语音业务流程控制 "speech":{ "wakeup_mode":"vtn" //开启唤醒 } //唤醒参数配置 "ivw":{ "mic_type": "mic1", //唤醒库加载,建议取值和麦克类型保持一致,例Android系统当前取值代表加载 libvtn_mic1.so "res_type":"path", "res_path":"/sdcard/AIUI/ivw/vtn/vtn.ini" }, //音频通道设置,默认唤醒固定设置 "recorder":{ "channel_count": 1, "channel_filter": "0,-1" }, ~~~ ### 1.2. 唤醒参数配置文件说明 如上节所述,在aiui配置文件唤醒参数`ivw`中需配置唤醒参数配置文件`vtn.ini`,该文件主要需要修改两点: - `appid` 这是唤醒装机量鉴权appid信息,建议与aiui.cfg中appid取值保持一致 - `res_path` 这是唤醒词资源路径 ```properties [auth] appid=xxx [cae] cae_enable = 1 input_audio_unit = 2 [ivw] #唤醒功能, 0(关闭,默认),1(开启) ivw_enable = 1 #唤醒资源文件路径 res_path=/sdcard/AIUI/ivw/vtn/res.bin ``` ### 1.3. SDK调用 <div style="display: flex; align-items: flex-start; gap: 16px; padding: 16px; background: #fff5f6; border-radius: 5px; border-left: 4px solid #e83e8c; box-shadow: 0 4px 12px rgba(255, 215, 0, 0.08); margin-bottom: 16px; transition: transform 0.2s ease, box-shadow 0.2s ease;"> <div> <div style="font-weight: 600; margin-bottom: 4px;">温馨提示</div> <div style="font-size: 14px; line-height: 1.5;">AIUI SDK集成开发前,需要确保唤醒参数配置文件`vtn.ini`和唤醒词资源文件`res.bin`已复制或拷贝到对应的设置路径下。</div> </div> </div> **资源文件拷贝** - 将`ivw`下示例唤醒配置`vtn.ini`和示例唤醒资源`res.bin`(唤醒词小飞小飞)拷贝到对应的目录文件下。 Android示例: ```java FileUtil.copyAssetFolder("ivw", "/sdcard/AIUI/ivw"); ``` **接口调用**:创建AIUIAgent,根据SDK配置的录音方式,发送不同的事件: - `系统录音`:发送`CMD_START_RECORD`消息,即开始录音,设备进入待唤醒状态。 - `外部录音`:外部音频流通过`CMD_WRITE`事件写入,设备进入待唤醒状态。 ~~~ java //创建AIUIAgent mAIUIAgent = AIUIAgent.createAgent( this, getAIUIParams(), mAIUIListener ); //开始录音 - 系统录音 AIUIMessage msg = new AIUIMessage(AIUIConstant.CMD_START_RECORD, 0 ,0, "data_type=audio,sample_rate=16000", null); mAIUIAgent.sendMessage(msg); // 外部音频写入 - 外部录音 byte[] audio = xxx; // 外部录音获取的音频流 String params = "data_type=audio,sample_rate=16000"; AIUIMessage msg = new AIUIMessage(AIUIConstant.CMD_WRITE, 0, 0, params, audio); mAIUIAgent.sendMessage(msg); ~~~ - 此时喊唤醒词`小飞小飞`,SDK抛出唤醒事件(`EVENT_WAKEUP`),进入识别状态,响应后面的语音指令。 **回调事件**: ```java private final AIUIListener mAIUIListener = new AIUIListener() { @Override public void onEvent(AIUIEvent event) { switch (event.eventType) { //唤醒事件 case AIUIConstant.EVENT_WAKEUP: { String info = event.info; Log.i(TAG, "on EVENT_WAKEUP: " + info); if(info != null && !info.isEmpty()){ JSONObject jsInfo = new JSONObject(info); String ivwResult = jsInfo.getString("ivw_result"); JSONObject ivwInfo = new JSONObject(ivwResult); String keyword = ivwInfo.getString("keyword"); Log.i("本次唤醒为:" + keyword); } } break; ``` **结果解析**: ```json { "angle": 0, "beam": 0, "ivw_result": { "angle": 0,//唤醒角度 "beam": 0,//波束 "start_ms": 255370//唤醒音频开始时间点,用于切分音频做声源定位,开发者无需关注 "end_ms": 256390,//唤醒音频结束时间点,用于切分音频做声源定位,开发者无需关注 "keyword": "xiao3 fei1 xiao3 fei1",//唤醒词 "physical": 0, "power": 0,//音频能量大小,特殊版本才有 "score": 1072//唤醒得分,score>唤醒阈值才会唤醒 }, "type": 3 } ``` <div id="自定义唤醒词更换"> </div> ## 2. 自定义唤醒词更换 AIUI SDK默认提供的语音唤醒能力,支持开发者免费自定义更换,AIUI平台自定义唤醒词打包说明如下: - 唤醒词打包服务能力免费 - 不限制资源下载次数 - 仅支持中文唤醒词打包 - 默认单个唤醒词资源最多包含3个唤醒词 <div style="display: flex; align-items: flex-start; gap: 16px; padding: 16px; background: #fff5f6; border-radius: 5px; border-left: 4px solid #e83e8c; box-shadow: 0 4px 12px rgba(255, 215, 0, 0.08); margin-bottom: 16px; transition: transform 0.2s ease, box-shadow 0.2s ease;"> <div> <div style="font-weight: 600; margin-bottom: 4px;">温馨提示</div> <div style="font-size: 14px; line-height: 1.5;">此处生成的唤醒资源为浅定制版本,如果需要更好的唤醒效果,可联系商务进行唤醒词的深定制训练。</div> </div> </div> **操作步骤如下**: ① 登录 https:/aiui.xfyun.cn/ 创建应用或选择已创建的应用,进入应用配置页面。 ② 点击 资源下载 -> 配置唤醒词 -> 选择 3.17.7 引擎版本 下载 。页面弹窗的“温馨提示”可直接忽略。 ③ 解压下载的资源压缩包,获取其中的`res.bin`按照集成示例中的步骤替换对应路径的文件即可。 
admin
2025年9月19日 16:24
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码