AIUI文档中心
AIUI平台说明
什么是AIUI
AIUI平台能力介绍
AIUI交互流程说明
AIUI快速入门
AIUI应用管理说明
应用接入和配置
应用后处理
敏感词
AIUI开发接入
AIUI接入概述
声学接入
交互接入
SDK接入
SDK介绍
参数配置
消息事件
交互状态
结果解析
WebSocketAPI接入
精简协议接入
常用功能
交互控制
语音唤醒
语音合成
用户个性化
自定义参数
离线命令词
翻译模式
流式识别
语义VAD
发音人列表
关键词过滤
情景模式
错误码
星火交互认知大模型说明
大模型概述
开发接入
SDK接入
API接入
大模型API服务鉴权
特色能力
超拟人合成
声音复刻
大模型功能
大模型错误码
软硬件产品接入
RK3328 降噪板
RK3328降噪板白皮书
RK3328降噪板使用手册
RK3328降噪板规格书
RK3328降噪板协议手册
RK3328 AIUI评估板开发套件
RK3328评估板白皮书
RK3328评估板使用手册
RK3328评估板规格书
RK3328评估板开发手册
RK3588 AIUI多模态开发套件
RK3588一体机多模态产品规格书
RK3588多模态套件使用手册
视频传输协议
串口通信协议
音频传输协议
ZG803 离线语音识别套件
ZG803 产品白皮书
USB声卡套件
USB声卡产品白皮书
USB声卡使用指南
AC7911 AIUI语音开发套件
AC7911-产品白皮书
AC7911-快速体验指南
AC7911-开发指南
AC7911-协议手册
AC7911-硬件参数
AIUI评估板接入
集成方式
软件包说明
AIUIServiceKitSDK
串口SDK
评估板参数配置
调试升级
技能工作室
技能概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
问答库开发
语句问答
关键词问答
文档问答
设备人设开发
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
硬件设计参考
常见问题
AIUI常见问题
评估板常见问题
动态实体常见问题
联系方式
服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
声学接入
声学接入指测试硬件声学效果,在早期发现硬件、结构缺陷。 ![](https://aiui-file.cn-bj.ufileos.com/aiui-doc/3_access_service/access_voice.jpg) ## 语音技术方案评估 客户填写项目表,根据客户的产品定义,确认语音方案。 ## 声学结构评估 具体评估内容包括: ### 电子优化 - 器件选择:确认麦克风、ADC和喇叭的电气参数; - 电路设计:麦克风和喇叭处的电路设计,线材选取,线长要求; - 其他:供电、音量设置、功放设置和参考回采确认; ### 结构优化 - 麦克风阵列设计:阵列的间距、拾音路径确认; - 麦克风开孔:单孔拾音和多孔拾音; - 防震措施:针对麦克风和喇叭的防震措施; - 防声音传导:线缆和结构的防声音传导处理; ### 录音优化 - 录音获取 - 麦克风检测:麦克风一致性检查、麦克风增益调整 - 参考信号检测:参考信号对齐、参考信号增益调整 - 元器件检测:功放功率是否合适、结构是否共振、喇叭是否失真、是否存在电流音、是否存在高频泄露 - 疑难问题:录音驱动是否正常、录音信号、结构是否传声严重 ## 声学前端算法集成 声学前端算法库可以利用麦克风阵列的空域滤波特性,在目标说话人方向形成拾音波束,抑制波束之外的噪声和反射声。集成前端算法后,产品将具有声源定位、降噪、回声消除、 语音唤醒等功能,接有 MIC 阵列的产品将具备远场语音交互的能力。当前算法支持单麦、2、4、6麦。 使用多麦阵列算法的客户,需要具备系统驱动调试、 linux 开发,C语言开发等能力。 算法特性: - 180\360 度声源定位 - 语音唤醒 - 回声消除 - 降噪(去混响、自动增益) ## 唤醒效果评估 ### 唤醒词选型 - 建议3-5个中文字,4个字最佳,选择发音开口明显、发音清晰容易分辨的词汇(字越少,误唤醒越高) - 最好是ABCD结构,每个字发音清晰。 - 没有声母的字只有韵母的字尽量避免,全是元音的也避免,比如 a、o、 e、 ai、ao等。 - 避免敏感词:包含政治,伟人名字等等; - 避免口语化词汇,口语对话使用频率很高,容易误唤醒; - 避免多音字和叠字,例:你好悠悠 - 避免命令含义的词,例:下一首 - 唤醒词越多,误唤醒率越高。 ### 唤醒词定制 唤醒词分为浅定制、深定制 - **浅定制** 工具在线生成唤醒词,免费但效果一般。 - **深定制** 客户付费录制数据训练模型,周期约2个月,效果很好。 ## 整机声学效果评估 确认产品整机麦克风阵列频率响应一致性和麦克风密封性、识别率、唤醒率、声源定位效果、以及回声消除效果。第三阶段评估完成后,针对客户当前整机产品给出整改建议。
admin
2024年8月29日 10:43
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码