AIUI文档中心
AIUI平台说明
什么是AIUI
AIUI平台能力介绍
AIUI交互流程说明
AIUI快速入门
AIUI应用管理说明
应用接入和配置
应用后处理
敏感词
AIUI开发接入
AIUI接入概述
声学接入
交互接入
SDK接入
SDK介绍
参数配置
消息事件
交互状态
结果解析
WebSocketAPI接入
精简协议接入
常用功能
交互控制
语音唤醒
语音合成
用户个性化
自定义参数
离线命令词
翻译模式
流式识别
语义VAD
发音人列表
关键词过滤
情景模式
错误码
星火交互认知大模型说明
大模型概述
开发接入
SDK接入
API接入
大模型API服务鉴权
特色能力
超拟人合成
声音复刻
大模型功能
大模型错误码
软硬件产品接入
RK3328 降噪板
RK3328降噪板白皮书
RK3328降噪板使用手册
RK3328降噪板规格书
RK3328降噪板协议手册
RK3328 AIUI评估板开发套件
RK3328评估板白皮书
RK3328评估板使用手册
RK3328评估板规格书
RK3328评估板开发手册
RK3588 AIUI多模态开发套件
RK3588一体机多模态产品规格书
RK3588多模态套件使用手册
视频传输协议
串口通信协议
音频传输协议
ZG803 离线语音识别套件
ZG803 产品白皮书
USB声卡套件
USB声卡产品白皮书
USB声卡使用指南
AC7911 AIUI语音开发套件
AC7911-产品白皮书
AC7911-快速体验指南
AC7911-开发指南
AC7911-协议手册
AC7911-硬件参数
AIUI评估板接入
集成方式
软件包说明
AIUIServiceKitSDK
串口SDK
评估板参数配置
调试升级
技能工作室
技能概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
问答库开发
语句问答
关键词问答
文档问答
设备人设开发
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
硬件设计参考
常见问题
AIUI常见问题
评估板常见问题
动态实体常见问题
联系方式
服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
语音技能设计规范
# 目 录 1. 技能场景定义 1.1 定义技能 2. 语料设计 2.1 简洁直白,亲切友好 2.2 丰富多变,应变能力强 2.3 以服务用户的核心意图为前提 2.4 清晰地给出选择 2.5 回应要为用户的 “耳朵” 服务 2.6 兜底语料 2.7 考虑用户关闭数据获取的情况 3. 多轮对话设计 3.1 首先列出最短的对话路径 3.2 将备选路径和决策树列举出来 3.3 概括出系统逻辑 3.4 对话中加入引导语 3.5 汇总选择 3.6 处理潜在需求 3.7 精细化拆分 3.8 无响应时主动反馈 4. 发布技能 4.1 确保服务稳定可靠 4.2 技能信息有标识度 4.3 技能描述简洁易懂 ## 1、技能场景定义 首先定义技能的**应用场景**,避免一个技能完成多个功能。 ### 1.1、 定义技能 定义技能的几个问题: 1. 这个技能能做什么?为什么用户需要这个技能? 2. 用户在使用这个技能之前、当时、之后,会干什么? 3. 在这个技能中,有什么是用户不使用这个技能或使用别的技能得不到的? 4. 有什么信息是用户希望得到的? 5. 用户通过说/做什么能唤醒这个技能? 6. 哪一个功能点能直接支持这个技能? 7. 技能提供的信息是否需要从别的网页或应用中调用? ## 2、语料设计 语料指用户发出指令后技能做出回应的话术,尽可能多地考虑用户和技能之间的对话的发展。好的语料应该: ### 2.1、简洁直白,亲切友好 1. 使用简洁、口语化语言。 正确示范 - 用户:订今晚去北京的机票。 - 技能:今晚飞北京已经没有票了,要不要改坐高铁呢? 错误示范 - 用户:订今晚去北京的机票。 - 技能:今晚去往北京的机票已无剩余,无法购买,可否改乘高铁? 2. 语料兼备幽默、风趣、委婉、温柔、俏皮的多重风格转换,增加生动活泼力。 正确示范 - 用户:你最喜欢的人是谁 - 技能:欲把相思说似谁,当然是你呀~ 错误示范 - 用户:你最喜欢的人是谁? - 技能:没什么喜欢的 3. 尽可能避免使用歉意词。 正确示范 - 用户:打电话给爸爸 - 技能:通讯录中没有找到“爸爸”呢。 错误示范 - 用户:打电话给爸爸。 - 技能:对不起,通讯录中没有找到“爸爸”。 4. 回应简洁,避免重复。 正确示范 - 用户:帮我找手机。 - 技能:好的,请说一下你的电话号码哦。 错误示范 - 用户:帮我找手机。 - 技能:感谢使用找手机技能,本技能可以通过拨打你的电话找到你的手机。现在说出你的手机号码,帮你拨打哦。 5. 尽可能只回复重点,省略无关消息。 正确示范 - 用户:今天要带伞吗? - 技能:今天北京雷阵雨,需要带伞哦。 错误示范 - 用户:今天要带伞吗? - 技能:今天北京雷阵雨,气温15~21度,空气湿度80%,记得要带伞哦。 6. 避免无意义交互。 正确示范 - 用户:给我讲个笑话吧。 - 技能:(随机讲笑话) 错误示范 - 用户:给我讲个笑话吧。 - 技能:你是要听笑话对吗? 7. 避免要求用户用特定的方式表达意图。 正确示范 - 用户:明晚八点有个饭局。 - 技能:需要我帮你设置一个明晚八点的提醒吗? 错误示范 - 用户:明晚八点有个饭局。 - 技能:如果你想设置提醒,请对我说:提醒我明晚八点有个饭局。 ### 2.2、丰富多变,应变能力强 1. 答复多样化。 举例 - 用户:红烧肉怎么做? - 技能回复1:鱼香肉丝是道不错的美味呦,做法是这样的:... - 技能回复2:做菜我最拿手哦,红烧肉的步骤是:... - 技能回复3:帮你找到啦:... ### 2.3、以服务用户的核心意图为前提 技能应优先回复用户的核心意图。当无法满足用户需求时,应表达清楚技能的状态,以免用户困惑。 正确示范 - 用户:我想看新浪财经频道。 - (没有新浪财经频道的信源,但找到爱奇艺财经频道) - 技能:没有找到新浪财经频道,可以看看爱奇艺财经频道。 错误示范 - 用户:我想看新浪财经频道。 - (没有新浪财经频道的信源,但找到爱奇艺财经频道) - 技能:为你找到爱奇艺财经频道。 ### 2.4、清晰地给出选择 在为用户提供选择的时候,要组织好语言,明确这是一个从几个选择里挑一个的问题,而不是“是与否”、“要或不要”的问题。 正确示范 - 用户:帮我定杯拿铁。 - 技能:你是想要中杯还是大杯呢? - 用户:大杯。 错误示范 - 用户:帮我定杯拿铁。 - 技能:你是要中杯或者大杯吗? - 用户:是的。 ### 2.5、回应要为用户的 “耳朵” 服务 以应用技能的设备没有屏幕,或者用户不会 “看” 信息为前提,让技能的回复能通过 “听” 就能很容易地理解。 正确示范 - 用户:火箭队和魔术现在比赛情况怎样? - 技能:火箭队目前得分66,魔术队目前得分54,比赛进行到第三场。 错误示范 - 用户:火箭队和魔术现在比赛情况怎样? - 技能:火箭(65-17-1)66,魔术(25-57-0)54,第三场,剩余时间 5:24。 ### 2.6、兜底语料 问题超出信源库范围时,生动的兜底语料提高用户体验。 正确示范 - 用户:红烧肉怎么做? - 技能回复1:我突然想不起来了,问我别的菜呗。 - 技能回复2:脑袋空空,咱们换个菜吧。 错误示范 - 用户:红烧肉怎么做? - 技能:我没听清,能再说一遍吗? ### 2.7、考虑用户关闭数据获取的情况 正确示范 - 用户:今天天气怎样? - 技能:请问你现在在哪个城市? - 用户:我在北京。 - 技能:今天北京天气晴朗,气温为15~21度。 错误示范 - 用户:今天天气怎样? - 技能:你还没授权定位数据,无法使用天气查询哦。 ## 3、多轮对话设计 基础的语料设计可能不能满足用户与技能的实际互动需求。用户可能会说得太少,也可能说得太多,还可能词不达意,说很多开发者预料不到的东西。运用以下技巧,开发者可以扩展语料库,用多轮对话的形式更好地捕获用户在对话中给出的重要信息。 ### 3.1、首先列出最短的对话路径 最短的对话路径通常是用户一次性提供所有有用信息的对话。 ### 3.2、将备选路径和决策树列举出来 如果用户所说的没有将所有必需的信息给出,可以在流程中确定备选路径。 ### 3.3、概括出系统逻辑 识别系统决策,如这是一个新用户还是一个老用户。检查用户遵循的流程可能可以改善用户体验。 ### 3.4、对话中加入引导语 不要假设用户知道接下来该做什么或将要发生什么。多轮对话中可以加入友好的引导语,让用户清晰地知道接下来该怎样与技能进行交流。如: 1. 提示用户何时需要提供更多信息。 2. 一次只要求一个信息。 3. 给用户提供选择,但尽量不要给出三个以上的选项。 4. 向用户确认他的选择和重要信息。 5. 传达多个信息时应通过“第一步”、“然后”、“最后”等序列词便于用户理解。 ### 3.5、汇总选择 进行多论对话后,应向用户确认各轮回答的信息并反馈给用户。 正确示范 - 用户:帮我订今天去北京的机票。 - 技能:好的,请说出发地点。 - 用户:广州 - 技能:好的请说起飞时间段。 - 用户:中午十二点之后。 - 技能:好的,你需要订X月X日,中午十二点后,从广州飞往北京的航班对吗? - 用户:是的。 - 技能:好的,为你找到... 错误示范 - 用户:帮我订今天去北京的机票. - 技能:好的,请说出发地点。 - 用户:广州。 - 技能:好的,请说起飞时间段。 - 用户:中午十二点之后。 - 技能:好的,为你找到.... ### 3.6、处理潜在需求 多为用户考虑场景中潜在的需求,并尽可能周全地满足。例如:当介绍复杂的规则时,可以为用户考虑没听清或没听懂的情况,提供再听一遍的选项。也可以为已经了解规则的用户提供跳过的选项。 ### 3.7、精细化拆分 某个场景下的各种交互情况均需进行考虑,作精细化拆分,针对各种情况,需要提供针对性更强的回答,要求符合语境及交互感。 正确示范 - 用户:成语接龙 - 技能:已为你打开成语接龙,你可以选择你先开始或者我先开始,不想玩了请对我说“退出”。 - 用户:你先开始。 - 技能:好的,那我先来咯~ 和风细雨。 - 用户:雨过天晴。 - 技能:真棒,回答正确,再接再厉。下一个,雨过天晴。 - 用户:熠熠生辉。 - 技能:你的回答不正确哦,再试一次吧~ - 用户:提示一下吧 - 技能:好的,雨过天晴可以接晴天霹雳。 - 用户:换一个吧 - 技能:如果你想重开一局,可以对我说“重来”。 错误示范 - 用户:打开成语接龙 - 技能:和风细雨 - 用户:雨过天晴 - 技能:晴天霹雳 - 用户:熠熠生辉 - 技能:你的回答不对哦,再试一次~ - 用户:提示一下吧 - 技能:我好像没听懂... - 用户:换一个吧 - 技能:我好像没听懂... ### 3.8、无响应时主动反馈 当用户连续多次没有命中意图时,在告知没有理解并且作出更清晰的引导同时,需要明确告知用户应该怎样退出技能或主动为用户退出当前技能。 尽可能用“鼓励”的方式引导用户更正“错误”,主动询问用户意图,引导用户完成目标,而不是轻易终结对话。 正确示范 - 用户:我想查天气。 - 技能:请问要查哪个城市的天气呢? - 用户:天气热要多喝水。 - 技能:这个没听清呢,请你说出要查天气的城市名哦。 错误示范 - 用户:我想查天气。 - 技能:请问要查哪个城市的天气呢? - 用户:天气热要多喝水。 - 技能:这个没听懂,自动为你退出技能。 ## 4、发布技能 ### 4.1、确保服务稳定可靠 应该严格保证技能的后端服务稳定可靠,快速响应用户请求,达到用户良好的使用预期。 ### 4.2、技能信息有标识度 通过定义独立且有差异化的技能功能,选用不易混淆的名称来命名你的技能,给用户一个清晰的印象,让你的技能脱颖而出。 ### 4.3、技能描述简洁易懂 尽可能完善技能的描述信息,具体要求可参照[技能审核规范](https://aiui-doc.xf-yun.com/project-1/doc-54/)。 <IflyHeader />
admin
2024年5月29日 10:21
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码