AIUI文档中心
AIUI文档导览
1. AIUI平台服务
1.1 AIUI平台介绍
1.2 AIUI应用介绍
1.3 AIUI服务链路介绍
1.4 AIUI平台能力概述
1.5 快速体验
2. AIUI应用配置
2.1 应用发布
2.2 语义精简协议介绍
2.3 基础配置
2.4 语义模型配置
2.5 回复角色配置
2.6 语音识别配置
2.7 结构化语义配置
2.8 星火大模型配置
2.9 语音合成配置
2.10 应用后处理配置
2.11 三方大模型配置
2.12 流畅全双工交互配置
2.13 表情标签配置
2.14 长时记忆配置
2.15 声纹识别配置
3. AIUI SDK开发
3.1 AIUI SDK接入流程
3.2 AIUI SDK基础信息
3.2.1 SDK接口说明
3.2.2 参数配置说明
3.2.3 消息事件说明
3.2.4 SDK状态说明
3.2.5 数据发送方式
3.2.6 回调解析说明
3.2.7 交互结果协议说明
3.3 AIUI SDK基础能力
3.3.1 流式识别
3.3.2 离线识别
3.3.3 语音唤醒
3.3.4 语音合成
3.3.5 用户个性化
3.3.6 自定义参数
3.4 传统语义链路接入
3.4.1 链路配置说明
3.4.2 个性化数据使用
3.5 通用大模型链路接入
3.5.1 链路配置说明
3.5.2 个性化数据使用
3.5.3 超拟人合成
3.5.4 声音复刻
3.6 极速超拟人链路接入
3.6.1 链路配置说明
3.6.2 个性化数据使用
3.6.3 流式合成
3.6.4 声音复刻
3.6.5 RTOS系统SDK接入
3.7 错误码列表
3.8 发音人列表
4. AIUI API开发
4.1 传统语义链路
4.1.1 交互API
4.1.2 用户个性化API
4.1.3 合成能力使用
4.2 通用大模型链路
4.2.1 服务鉴权
4.2.2 交互API
4.2.3 用户个性化API
4.2.4 声音复刻API
4.2.5 合成能力使用
4.3 极速超拟人链路
4.3.1 服务鉴权
4.3.2 交互API
4.3.3 用户个性化API
4.3.4 声音复刻API
4.3.5 合成能力使用
4.3.6 声纹管理API
5. 自定义业务
技能工作室概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
智能体开发
智能体对接
问答库开发
语句问答
关键词问答
文档问答
设备人设开发
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
6. 硬件模组
6.1 USB声卡套件
6.1.1 USB声卡产品白皮书
6.1.2 USB声卡使用指南
6.2 RK3328 降噪板
6.2.1 RK3328降噪板白皮书
6.2.2 RK3328降噪板使用手册
6.2.3 RK3328降噪板规格书
6.2.4 RK3328降噪板协议手册
6.3 RK3328 AIUI评估板开发套件
6.3.1 RK3328评估板白皮书
6.3.2 RK3328评估板使用手册
6.3.3 RK3328评估板规格书
6.3.4 RK3328评估板开发手册
6.4 RK3588S 通用多模态开发套件
6.4.1 RK3588S 多模态套件白皮书
6.4.2 RK3588S 多模态套件使用手册
6.4.3 RK3588S 多模态主板规格书
6.5 RK3588 AIUI多模态开发套件
6.5.1 RK3588一体机多模态产品规格书
6.5.2 RK3588多模态套件使用手册
6.5.3 视频传输协议
6.5.4 识别语义传输协议
6.5.5 音频传输协议
6.5.6 AIUI类型消息事件
6.6 AC7911B AIUI语音开发套件
6.6.1 AC7911B-产品白皮书
6.6.2 AC7911B-快速体验指南
6.7 ZG803 离线语音识别套件
6.7.1 ZG803 产品白皮书
6.8 (旧)AIUI评估板接入
6.8.1 集成方式
6.8.2 软件包说明
6.8.3 AIUIServiceKitSDK
6.8.4 串口SDK
6.8.5 评估板参数配置
6.8.6 调试升级
7. 常见问题处理
7.1 AIUI常见问题
7.2 评估板常见问题
7.3 动态实体常见问题
8. 联系方式
9. 服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
6.4.1 RK3588S 多模态套件白皮书
# **目 录** 1. 产品概述 2. 产品组合速览 2.1. 组合矩阵 2.2. 组合选择指引 3. 语音主控 3.1. 产品清单 3.1.1. AIUI通用多模态主板(标配) 3.1.2. AIUI通用多模态主机(选配) 3.2. 主控规格 3.3. 接口规格 3.3.1. AIUI通用多模态主板接口实物图 3.3.2. AIUI通用多模态主机接口实物图 3.4. 尺寸信息 3.4.1. AIUI通用多模态主板尺寸信息 3.4.2. AIUI通用多模态主机尺寸信息 3.5. 电气性能(裸板) 3.6. 材料要求 4. 拾音模块 4.1. 产品清单 4.1.1. 四麦单目声卡三合一配件(标配) 4.1.2. 四麦单目声卡三合一结构件(选配) 4.2. 接口规格 4.2.1. 四麦单目声卡三合一配件接口规格 4.2.2. 四麦单目声卡三合一结构件接口规格 4.3. 尺寸信息 4.3.1. 四麦单目声卡三合一配件尺寸图 4.3.2. 四麦单目声卡三合一结构件尺寸图 4.4. 配套线束尺寸信息 5. 组装注意事项 5.1. 四麦单目声卡三合一配件安装要求 5.2. 四麦单目声卡三合一结构件安装要求 6. 交互范围说明 7. 系统接线与工作模式 7.1. 作为AI工控机主机模式 7.2. 作为输出语音交互指令从机模式 7.3. 作为输出多模态降噪音频从机模式 8. 产品功能点 9. 多模态应用版本更新说明 10. 技术服务与支持 10.1. 开发资料 10.2. 保修与售后 # 离线资料下载 RK3588S 多模态套件开发资料(产品白皮书、使用手册、规格书),可以点击下载: [【附件】RK3588S通用多模态套件开发资料.zip](/media/attachment/2026/03/RK3588S%E9%80%9A%E7%94%A8%E5%A4%9A%E6%A8%A1%E6%80%81%E5%A5%97%E4%BB%B6%E5%BC%80%E5%8F%91%E8%B5%84%E6%96%99.zip) # 1. 产品概述 RK3588S通用多模态开发套件采用RK3588S高性能、低功耗的八核应用处理器,搭载Android 13.0系统,主频高达2.4GHz。嵌入式3D GPU使RK3588S与OpenGL ES 1.1/2.0/3.2、OpenCL 2.2和Vulkan 1.2完全兼容。集成了LVDS、EDP、MIPI、千兆以太网、wifi、蓝牙,4G接口,5G接口,10W功放、TF卡扩展、红外遥控、串口/IO扩展、HDMI输出、背光供电等功能,显著降低了整机系统的设计与集成复杂度。 本套件是集成了免唤醒词人脸唤醒、多模态降噪与大模型交互于一体的软硬件一体化产品,硬件上由语音主控和拾音模块两部分组成,旨在彻底解决复杂环境下的语音交互难题,广泛应用到AI服务器、人脸支付设备、安防、医疗、交通、金融、工控、智慧教育、智能零售等等AI智能领域。 # 2. 产品组合速览 ## 2.1 组合矩阵 <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="15%" /> <col width="15%" /> <col width="15%" /> <col width="15%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center"><b>组合名称</b></td> <td align="center" valign="center"><b>主控模块</b></td> <td align="center" valign="center"><b>拾音模块</b></td> <td align="center" valign="center"><b>适用场景</b></td> </tr> <tr> <td valign="center">基础开发组合(主推)</td> <td valign="center">AIUI通用多模态主板(标配)</td> <td valign="center">四麦单目声卡三合一配件(标配)</td> <td valign="center">设备内部集成,开发调试,最灵活</td> </tr> <tr> <td valign="center">快速验证组合</td> <td valign="center">AIUI通用多模态主板(标配)</td> <td valign="center">四麦单目声卡三合一结构件(选配)</td> <td valign="center">快速原型验证,减少开发工作量</td> </tr> <tr> <td valign="center">工业部署组合</td> <td valign="center">AIUI通用多模态主机(选配)</td> <td valign="center">四麦单目声卡三合一配件(标配)</td> <td valign="center">外置主机 + 内部拾音,适合改造现有设备</td> </tr> <tr> <td valign="center">整机交付组合</td> <td valign="center">AIUI通用多模态主机(选配)</td> <td valign="center">四麦单目声卡三合一结构件(选配)</td> <td valign="center">整机交付,快速部署,即插即用</td> </tr> </tbody> </table> <center>表1 产品组合矩阵表</center> ## 2.2 组合选择指引 * 如果需要**嵌入自有设备**,选基础开发组合(主板+配件)。 * 如果需要**快速验证功能**,不想处理麦克风结构,选快速验证组合(主板+结构件)。 * 如果需要**外置主机**,但拾音部分嵌入设备,选工业部署组合(主机+配件)。 * 如果需要**整机外置**,不想做任何结构设计,选整机交付组合(主机+结构件)。 # 3. 语音主控 ## 3.1. 产品清单 ### 3.1.1. AIUI通用多模态主板(标配) 特点:主板尺寸小巧,适合集成到设备内部,占用空间少。 内容:AIUI通用多模态主板+电源适配器+ttl串口线+天线。  <center>图1 AIUI通用多模态主板实物图</center> ### 3.1.2. AIUI通用多模态主机(选配) 特点:主板集成到金属外壳内部,有一定防尘防水作用,适合外置使用。 内容:AIUI通用多模态主机+电源适配器+232串口线+天线棒。  <center>图2 AIUI通用多模态主机实物图</center> ## 3.2. 主控规格 <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="5%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center" colspan="2">主要硬件参数</td> </tr> <tr> <td>CPU</td> <td>八核(四核Cortex-A76,四核Cortex-A55)64位,主频最高2.4GHz</td> </tr> <tr> <td>GPU</td> <td>ARM Mali G610 3D GPU, 支持OpenGL ES 1.1/2.0/3.2、OpenCL 2.2、Vulkan 1.2</td> </tr> <tr> <td>NPU</td> <td>RKNN NPU,算力最大至 6 TOPS</td> </tr> <tr> <td>内存</td> <td>默认8G,4G/8G/16G(可选)</td> </tr> <tr> <td>内置存储器</td> <td>默认64G,32G /64G/128G/256G(可选)</td> </tr> <tr> <td>显示</td> <td>支持EDP/HDMI 2.1/MIPI/LVDS/DP(TYPE-C )</td> </tr> <tr> <td>系统</td> <td>Android 13</td> </tr> <tr> <td>播放模式</td> <td>支持循环、定时、插播等多种播放模式</td> </tr> <tr> <td>多媒体</td> <td>支持MPEG-1,MPEG-2,MPEG-4,H.263,H.264,H.265,VC-1,VP9,VP8,MVC,AV1</td> </tr> <tr> <td>电源供电接口</td> <td>1个内置2.54MM 6P电源输入接口及1个口径6.0 MM,内芯 2.0MM,DC头接口</td> </tr> <tr> <td>LVDS输出</td> <td>1路LVDS输出接口,30 PIN杜邦,可驱动50/60Hz多种分辨率液晶屏</td> </tr> <tr> <td>MIPI输出</td> <td>1路MIPI输出接口,40 PIN FPC座,最高支持4K @ 60fps输出</td> </tr> <tr> <td>EDP输出</td> <td>1路EDP输出接口,20 PIN杜邦,最高支持4K @ 60fps输出(和HDMI-OUT只能二选一输出)</td> </tr> <tr> <td>HDMI输出</td> <td>1个A型接口,支持HDMI TX 2.1,最高支持8K @ 60fps输出(和EDP只能二选一输出)</td> </tr> <tr> <td>TF卡</td> <td>支持16G/32G/64G/128G(只要是SD3.0,MMC ver4.51协议,更大容量的也是支持的)</td> </tr> <tr> <td>CTP接口</td> <td>1路I2C触摸屏接口</td> </tr> <tr> <td>遥控及指示灯</td> <td>支持红外遥控器按键控制,支持设备工作状态灯的指示</td> </tr> <tr> <td>串口/扩展接口</td> <td>4路TTL(2路可改232,2路可改485)串口, 4路GPIO</td> </tr> <tr> <td>音频输出</td> <td>1个3.5mm耳机接口,1个双通道喇叭输出接口</td> </tr> <tr> <td>重力感应</td> <td>支持,默认不贴</td> </tr> <tr> <td>RTC实时时钟</td> <td>支持、并支持定时开关机</td> </tr> <tr> <td>USB接口</td> <td>2个USB 3.0、2个内置USB插座</td> </tr> <tr> <td>系统升级</td> <td>支持本地USB升级,无线升级,电脑升级</td> </tr> <tr> <td>网络支持</td> <td>1、支持 10/100M/1000M自适应以太网<br>2、内置 WiFi,蓝牙,WIFI支持热点分享<br>3、可扩展4G 上网 </td> </tr> <tr> <td>尺寸</td> <td>138mm*85mm/±0.5mm,板厚1.6mm±10%</td> </tr> <tr> <td>工作环境</td> <td>温度:0度-70度,推荐5°C~35°C,湿度:10%~90%,无凝露</td> </tr> </tbody> </table> <center>表2 通用多模态主控规格说明</center> ## 3.3. 接口规格 语音主控板接口详细定义,请参考文档: https://aiui-doc.xf-yun.com/project-1/doc-829/ ### 3.3.1. AIUI通用多模态主板接口实物图  <center>图3 AIUI通用多模态主板正面接口</center>  <center>图4 AIUI通用多模态主板反面接口</center> ### 3.3.2. AIUI通用多模态主机接口实物图  <center>图5 AIUI通用多模态主机接口图1</center>  <center>图6 AIUI通用多模态主机接口图2</center> ## 3.4. 尺寸信息 ### 3.4.1 AIUI通用多模态主板尺寸信息   <center>图7 AIUI通用多模态主板尺寸图</center> - PCBA尺寸:138mm*85mm/±0.5mm;板厚1.6mm±10% - 螺丝孔规格:∮3.0mm x 4 /±10% 注意:DC头插孔为偏心圆,注意尺寸位置 ### 3.4.2. AIUI通用多模态主机尺寸信息  <center>图8 AIUI通用多模态主机尺寸图</center> - 主机尺寸:200*133*33mm(含固定支架) - 完整尺寸图请联系讯飞技术支持获取(support@iflytek.com) ## 3.5. 电气性能(裸板) <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="15%" /> <col width="10%" /> <col width="10%" /> <col width="10%" /> <col width="10%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center">参数</td> <td align="center" valign="center">最小值</td> <td align="center" valign="center">标准值</td> <td align="center" valign="center">最大值</td> <td align="center" valign="center">单位</td> </tr> <tr> <td>工作电压</td> <td>9</td> <td>12</td> <td>14</td> <td>V</td> </tr> <tr> <td>工作电流</td> <td>170</td> <td>183</td> <td>620</td> <td>mA</td> </tr> <tr> <td>关断电流</td> <td>6.56</td> <td>6.82</td> <td>7.06</td> <td>mA</td> </tr> <tr> <td>主板功率</td> <td>2.04</td> <td>2.19</td> <td>7.44</td> <td>W</td> </tr> <tr> <td>喇叭输出功率 (8R喇叭)</td> <td>4</td> <td>4.5</td> <td>5</td> <td>W</td> </tr> <tr> <td>RTC工作电流</td> <td>0.477</td> <td>0.492</td> <td>0.528</td> <td>uA</td> </tr> <tr> <td>USB输出电流( 5V ) *1</td> <td>1800</td> <td>2030</td> <td>2200</td> <td>mA</td> </tr> <tr> <td>UART输出电流( 3.3V )*2</td> <td>880</td> <td>1130</td> <td>1250</td> <td>mA</td> </tr> </tbody> </table> <center>表3 3588S裸板电气性能表</center> ## 3.5. 材料要求 <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="5%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center" colspan="2">电子器件材料</td> </tr> <tr> <td>PCB板材</td> <td>FR4 8层板 沉金阻抗板 TG150 哑光黑色无铅,无卤环保</td> </tr> <tr> <td>电子物料</td> <td>无铅环保物料(原装正品,符合ROSH要求)</td> </tr> <tr> <td>生产工艺</td> <td>无铅,环保生产工艺(符合ISO9001生产质量管理体系要求)</td> </tr> </tbody> </table> <center>表4 电子器件材料要求表</center> # 4. 拾音模块 ## 4.1. 产品清单 ### 4.1.1. 四麦单目声卡三合一配件(标配) 特点:麦克风跟摄像头为裸板,方便客户集成到设备内部,做一体化整机。 内容:包含线性四麦声卡麦板二合一板+3.3mm焦距摄像头+摄像头线束+USB音视频线束+回采线束。  <center>图9 3588S四麦单目声卡三合一配件实物图</center> ### 4.1.2. 四麦单目声卡三合一结构件(选配) 特点:线性四麦声卡麦板二合一板和摄像头集成到金属外壳内部,可以减少硬件集成开发工作量,直接安装在客户设备上即可使用。 内容:包含四麦单目结构件+USB音视频线束+回采线。  <center>图10 3588S四麦单目声卡三合一结构件实物图</center> ## 4.2. 接口规格 ### 4.2.1. 四麦单目声卡三合一配件接口规格  <center>图11 声卡麦板二合一板反面接口实物图</center> <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="10%" /> <col width="10%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center">序号</td> <td align="center" valign="center">接口名称</td> <td align="center" valign="center">接口定义</td> </tr> <tr> <td>1</td> <td>音视频接口</td> <td>4pinUSB1.25,pin脚定义GND,USB_DP,USB_DM,VUSB</td> </tr> <tr> <td>2</td> <td>回采接口</td> <td>5pin1.25,pin脚定义REFR-,REFR+,GND,REFR+,REFR-</td> </tr> <tr> <td>3</td> <td>回采增益拨码开关</td> <td>声卡提供了拨码开关可供调整一定范围的增益大小,对应第三位和第四位。对应的增益大小:00 => 10DB;01 => 20DB;10 => 30DB;11 => -6DB</td> </tr> <tr> <td>4</td> <td>摄像头接口</td> <td>4pinUSB1.25,pin脚定义VBUS_C,USB_DM2,USB_DP2,GND</td> </tr> </tbody> </table> <center>表5 声卡麦板二合一板接口定义</center>  <center>图12 摄像头接口实物图</center> <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="10%" /> <col width="10%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center">序号</td> <td align="center" valign="center">接口名称</td> <td align="center" valign="center">接口定义</td> </tr> <tr> <td>1</td> <td>摄像头接口</td> <td>4pinUSB1.25,pin脚定义VBUS_C,USB_DM2,USB_DP2,GND</td> </tr> </tbody> </table> <center>表6 摄像头接口定义表</center> ### 4.2.2. 四麦单目声卡三合一结构件接口规格  <center>图13 3588S四麦单目声卡三合一结构件接口实物图</center> ## 4.3. 尺寸信息 ### 4.3.1. 四麦单目声卡三合一配件尺寸图  <center>图14 麦板声卡二合一板尺寸图(117*20mm)</center>  <center>图15 单目500W摄像头尺寸图(40*16*14.6mm)</center> ### 4.3.2. 四麦单目声卡三合一结构件尺寸图  <center>图16 3588S四麦单目声卡三合一结构件尺寸图(主结构141*24*22.5mm)</center> 完整尺寸图请联系讯飞技术支持获取(support@iflytek.com) ## 4.4. 配套线束尺寸信息 <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="10%" /> <col width="10%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center">序号</td> <td align="center" valign="center">线束名称</td> <td align="center" valign="center">线束规格说明</td> </tr> <tr> <td>1</td> <td>电源适配器</td> <td>长度1.5米,航嘉电源适配器</td> </tr> <tr> <td>2</td> <td>USB音视频线束</td> <td>长度2.5米,4pinUSB1.25转4pinUSB2.0线束</td> </tr> <tr> <td>3</td> <td>摄像头线束</td> <td>长度5.6cm,4pinUSB1.25转5pinUSB1.25线束</td> </tr> <tr> <td>4</td> <td>回采线</td> <td>长度2.5米,5pin转3.5mm耳机口</td> </tr> <tr> <td>5</td> <td>串口线</td> <td>主板:配套1米,4pin ttl接口转USB串口线;<br> 主机:配套1米,4pin 232接口转USB串口线</td> </tr> <tr> <td>6</td> <td>天线</td> <td>主板:配套12cm天线 <br> 主机:配套12cm胶棒天线</td> </tr> </tbody> </table> <center>表7 配套线束尺寸说明表</center> # 5. 组装注意事项 ## 5.1. 四麦单目声卡三合一配件安装要求 * 设备上预留麦克风孔洞,孔径 > 2mm,孔深 < 3mm。 * 设备内表面预留一个防尘垫+泡沫棉的凹槽位置,规格:直径11mm,深度0.5mm,用于贴φ11mm 厚度1mm的泡沫棉和防尘网;硅胶垫中间孔洞直径2mm(双面可粘贴)。 * 设备需要预留螺丝位,用来固定麦克风板。  <center>图17 裸麦克风金属外壳设计参考图</center> ## 5.2. 四麦单目声卡三合一结构件安装要求 * 如果需要将四麦单目结构件安装到客户设备内部,需要注意外壳麦克风开孔的孔径 > 2mm,孔深 < 3mm。 * 四麦单目结构件跟客户设备外壳之间增加双面背胶,用来保证麦克风的气密性,双面背胶厚度为0.5mm,孔径3mm。 * 双面背胶贴合时要注意孔位对齐,不能堵住麦克风孔。 # 6. 交互范围说明 * 摄像头面向人脸,线性四麦麦克风板拾音孔面向正前方安装。 * 适用于距离屏幕0.5米~1.9米交互距离内使用。  <center>图18 水平方向交互距离说明</center>  <center>图19 垂直视场角场景说明</center> * 摄像头倾斜角度说明:表内角度基于摄像头65°垂直视场角,并以确保1.3米至1.9米身高用户的人脸能清晰落入画面中央为原则计算得出,举例:若摄像头安装在1.5米高度,推荐交互距离为0.6米,此时应将摄像头向下倾斜5度,可清晰捕捉身高1.38米至1.96米的人脸(表格数据仅供参考,实际安装时可微调)。 <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="5%" /> <col width="10%" /> <col width="5%" /> <col width="5%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center">摄像头安装高度</td> <td align="center" valign="center">推荐交互距离</td> <td align="center" valign="center">建议倾斜角度</td> <td align="center" valign="center">最低身高</td> <td align="center" valign="center">最高身高</td> </tr> <tr> <td>1.2</td> <td>0.6m</td> <td>向上倾斜20度</td> <td>1.3m</td> <td>2.07m</td> </tr> <tr> <td>1.3</td> <td>0.6m</td> <td>向上倾斜15度</td> <td>1.31m</td> <td>1.95m</td> </tr> <tr> <td>1.4</td> <td>0.6m</td> <td>向上倾斜10度°</td> <td>1.35m</td> <td>1.95m</td> </tr> <tr> <td>1.5</td> <td>0.6m</td> <td>向下倾斜5°</td> <td>1.38m</td> <td>1.96m</td> </tr> <tr> <td>1.6</td> <td>0.6m</td> <td>不倾斜</td> <td>1.41m</td> <td>1.98m</td> </tr> <tr> <td>1.7</td> <td>1m</td> <td>不倾斜</td> <td>1.33m</td> <td>2.33m</td> </tr> <tr> <td>1.8</td> <td>1m</td> <td>不倾斜</td> <td>1.43m</td> <td>2.43m</td> </tr> <tr> <td>1.9</td> <td>1.5m</td> <td>不倾斜</td> <td>0.95m</td> <td>2.85m</td> </tr> <tr> <td>2</td> <td>1.5m</td> <td>不倾斜</td> <td>1.05m</td> <td>2.95m</td> </tr> </tbody> </table> <center>表8 摄像头倾斜角度参考表</center> # 7. 系统接线与工作模式 按照回采接入分两种方式。 - 方式1:使用3588s板载功放,可直接通过3.5mm耳机口将合成音频接入到声卡回采接口,板载功放默认支持8欧姆10瓦; - 方式2:使用外置功放,需要接外置功放的一路信号到声卡板上的回采接口。 ## 7.1. 作为AI工控机主机模式  <center>图20 作为AI工控机主机模式示意图</center> ## 7.2. 作为输出语音交互指令从机模式  <center>图21 串口信息给到上位机示意图</center> ## 7.3. 作为输出多模态降噪音频从机模式 注意:默认3588S主板上的3.5mm耳机口和speaker播出的是合成音频,需要把aiui.cfg配置文件中mmps项下面的play_mmsp改成true且play_mode改成user,即可只输出降噪音频。  <center>图22 多模态降噪音频给上位机示意图</center> # 8. 产品功能点 <table border="0" class="docutils" style="width: 100%;"> <colgroup> <col width="5%" /> <col width="5%" /> <col width="5%" /> </colgroup> <tbody valign="top"> <tr> <td align="center" valign="center"><b>功能</b></td> <td align="center" valign="center"><b>特性</b></td> <td align="center" valign="center"><b>备注</b></td> </tr> <tr> <td valign="center">回声消除</td> <td valign="center">回声消除-25dB</td> <td valign="center">标配></td> </tr> <tr> <td valign="center">多模态降噪</td> <td valign="center">噪声抑制-10dB</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">人脸唤醒</td> <td valign="center">检测唇形,免语音唤醒,人脸检测准确率达 99.99%</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">语音二次唤醒</td> <td valign="center">支持修改cfg文件,自定义语音唤醒词,二次唤醒</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">话筒录音</td> <td valign="center">支持USB口插入话筒设备录音交互</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">在线识别</td> <td valign="center">支持中英文和方言识别</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">结构化语义</td> <td valign="center">支持自定义技能,提供 100 多个官方技能</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">语音合成</td> <td valign="center">支持中英文和方言合成</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">串口通信</td> <td valign="center">支持串口或者232接口发送指令给上位机</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">视频输出</td> <td valign="center">通过千兆网口输出视频内容给上位机使用</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">大模型交互</td> <td valign="center">可接入星火大模型,让交互更自然</td> <td valign="center">标配</td> </tr> <tr> <td valign="center">超拟人合成</td> <td valign="center">模拟人类的口语化现象、情感、停顿等细节信息</td> <td valign="center">选配功能</td> </tr> <tr> <td valign="center">语音服务私有化部署</td> <td valign="center">保障企业信息安全</td> <td valign="center">选配功能</td> </tr> </tbody> </table> <center>表9 产品功能点列表</center> # 9. 多模态应用版本更新说明 **新客户:**请直接基于2.5.1版本及以上版本进行开发。 **老客户(已对接2.4.0及以下版本):**如需升级至2.5.1以获取新特性,请注意两个版本在语义对接字段上不兼容,需申请新的appid并重新进行对接 **2.5.1及以上版本特性:** * 接入AIUI平台极速交互链路,交互响应时间降低300ms * 支持配置多种大模型 * 支持自定义语音唤醒词,实现二次唤醒交互 # 10. 技术服务与支持 我们为客户提供全面、及时的技术支持,确保开发流程顺畅无忧。 ## 10.1. 开发资料 **产品开箱视频:**AI交互中心视频号---产品开箱视频---第三集《讯飞AIUI通用多模态开发套件全新升级》 **产品使用手册:**提供详细的硬件操作与软件配置指南。 **对接协议文档:** - 视频传输协议:[点击跳转](https://aiui-doc.xf-yun.com/project-1/doc-360/ "点击跳转") - 识别语义协议:[点击跳转](https://aiui-doc.xf-yun.com/project-1/doc-367/ "点击跳转") - 音频传输协议:[点击跳转](https://aiui-doc.xf-yun.com/project-1/doc-392/ "点击跳转") **示例代码库:**提供丰富的场景化代码示例,加速开发集成。 **3D结构资料:**提供麦克风板、摄像头等组件的3D模型文件,便于结构设计。 ## 10.2. 保修与售后 **质保政策:**主板享受自购买之日起 壹年 质保。 **技术支持:**如需帮助,请通过以下方式联系我们: **技术支持邮箱:**support@iflytek.com **官方网站:**https://aiui.xfyun.cn/
admin
2026年4月2日 14:11
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码