AIUI文档中心
AIUI平台说明
什么是AIUI
AIUI平台能力介绍
AIUI交互流程说明
AIUI快速入门
AIUI应用管理说明
应用接入和配置
应用后处理
敏感词
AIUI开发接入
AIUI接入概述
声学接入
交互接入
SDK接入
SDK介绍
参数配置
消息事件
交互状态
结果解析
WebSocketAPI接入
精简协议接入
常用功能
交互控制
语音唤醒
语音合成
用户个性化
自定义参数
离线命令词
翻译模式
流式识别
语义VAD
发音人列表
关键词过滤
情景模式
错误码
星火交互认知大模型说明
大模型概述
开发接入
SDK接入
API接入
大模型API服务鉴权
特色能力
超拟人合成
大模型使用问答手册
大模型错误码列表
软硬件产品接入
RK3328 降噪板
RK3328降噪板白皮书
RK3328降噪板使用手册
RK3328降噪板规格书
RK3328降噪板协议手册
RK3328 AIUI评估板开发套件
RK3328评估板白皮书
RK3328评估板使用手册
RK3328评估板规格书
RK3328评估板开发手册
RK3588 AIUI多模态开发套件
RK3588一体机多模态产品规格书
RK3588多模态套件使用手册
视频传输协议
串口通信协议
音频传输协议
ZG803 离线语音识别套件
ZG803 产品白皮书
USB声卡套件
USB声卡产品白皮书
USB声卡使用指南
AC7911 AIUI语音开发套件
AC7911-产品白皮书
AC7911-快速体验指南
AC7911-开发指南
AC7911-协议手册
AC7911-硬件参数
AIUI评估板接入
集成方式
软件包说明
AIUIServiceKitSDK
串口SDK
评估板参数配置
调试升级
技能工作室
技能概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
问答
自定义问答
关键词问答
设备人设
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
硬件设计参考
常见问题
AIUI常见问题
评估板常见问题
动态实体常见问题
联系方式
服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
RK3588多模态套件使用手册
# 使用手册 **目 录** 1. 编写目的 2. 准备工作 3. 接口描述 4. Demo体验 5. 项目应用 5.1 使用降噪后音频 5.2 使用串口信息 6. 语义场景说明 # 1. 编写目的 本文档旨在让用户快速体验RK3588多模态开发套件,以及快速根据项目不同需求进行效果验证。 # 2. 准备工作 * **RK3588 多模态开发套件** * **HDMI线、显示屏** * **鼠标** * **上位机,如电脑(操作系统 windows10,用于查看调试信息和客制化)** # 3. 接口描述 ![3588接口](/media/202402//1709170973.806941.jpeg) <center>图1 RK3588主机接口图</center> |编号 |接口名称 |说明 | | :---- | :---- | :---- | |LAN |网口 |千M以太网 | |DC-12V |电源输入接口 |DC12V3A、DC5.5-2.1 | |USB3.0/USB2.0 |USB接口 |USB3.0 * 2 , USB2.0 * 4 | |复位孔 |复位按键 |外部插针按住上电进入刷机模式 | |Type-C |ADB/DP接口 |Typec接口,连接电脑OTA或调试 | |HDMI |HDMI接口 |HDMI 2.1接口 * 1 <br>可最高输出8K 60Hz,HDCP2.3| |MicArray |麦克风接口 |支持八路麦克风输入 | |REF |耳机口 |音频/回采输入 | |SPEAKER |喇叭口 |连接8Ω5W * 2 ,喇叭输出 4pin 2.0mm | |HPOUT |Line out口 |音频输出 | |RS232 |RS232 |RS232 * 2,串口通讯 | 表1 RK3588 多模态开发套件接口说明 # 4. Demo体验 **第一步:接线指导** 按照图示,从右向左依次连接网线,电源线,鼠标,摄像头线,HDMI线,音频线。 ![d545ffbbfd865ab9dceb7f5d50c41cc](/media/202402//1709170973.816158.jpeg) **第二步:打开apk** 1、打开图中红框的体验apk ![4df0f8b930896052456079c887039ba](/media/202402//1709170973.8206818.jpeg) 2、鼠标点击图像转换后预览 ![3d271845caab17711161869ecb9b908](/media/202402//1709170973.8405495.jpeg) 3、 进入体验界面,人脸框住时可开始交互 ![7787183b839fef3c891e7aee3cb079c](/media/202402//1709170973.8621018.jpeg) **第三步:交互安装指导** 1、根据不同的使用场景,需要注意摄像头的选型。 1米内交互近焦摄像头;1~3米内交互需要适配远焦摄像头。 2、 摄像头高度建议放在1.5米到1.8米之间,保证人脸及唇形能够被清晰捕捉到。 3、 摄像头尽量放在麦克风板的居中位置。 4、 如果用的是讯飞四麦或者八麦裸麦板,要注意麦板集成到设备上时,设备上需要预留麦克风的孔洞,规格是直径11mm,深度0.5mm;且需要配φ11mm 厚度1mm的硅胶垫+防尘网(双面可粘贴),中间直径2mm 。 5、 Demo交互指令支持:天气查询,闲聊问答等。 # 5. 项目应用 本章介绍两种使用方式: 1、 如果上位机有自己的语音服务,需要RK3588主机输出降噪后音频,可通过3.5mm音频线从HPOUT口输出音频给上位机,**结合RS232串口输出的人脸唤醒状态进行语音识别。** 2、 如上位机需要拿到RK3588输出的识别,语义结果,可以通过RS232接口输出主机串口信息给上位机。 ## 5.1使用降噪后音频 **第一步:**按照图示接好主机电源,麦克风音频线,摄像头线(接USB2.0),3.5mm耳机线(接HPOUT口),串口线(接RS232口); ![57c6fed07c788b1a7844fe7af6930d3](/media/202402//1709170973.8676333.jpeg) ![](/media/202402//1709170973.883642.png)**第二步:**3.5mm音频线另一端接入上位机,如果上位机为4段式3.5mm接口(例如笔记本电脑),需要另外装配一根耳麦二合一转接线,3.5mm接入到二合一线的麦克风口。 **第三步:**上位机通过对应的声卡进行录音 ## 5.2使用串口信息 **第一步:** 按照图示接好主机电源,麦克风音频线,摄像头线,串口线(接RS232接口); ![0a589293ab652818b17adfbc8db51fd](/media/202402//1709170973.8886616.jpeg) **第二步:** 串口线另一头连接上位机(可根据上位机接口选择USB口或RS232串口) ![微信图片_20240111191101](/media/202402//1709170973.9153702.jpeg) **第三步:** 打开开发包中的小草莓图标的AIUI串口调试工具,波特率选择115200,语音识别、语义的交互信息会在控制台中输出出来。 ![](/media/202402//1709170973.9195688.png) # 6. 语义场景说明 AIUI 默认场景包括天气、音乐、航班、火车、 诗词、智能家居,如果需要更多场景,请登录 http://www.xfyun.cn/services/aiui 进行配置。 (客户可以通过串口工具替换成自己的appid,配置不同的技能或识别引擎,但是改appid需要拿到讯飞的多模态授权,通过邮件申请:aiui_support@iflytek.com)
admin
2024年4月7日 10:25
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码