AIUI文档中心
AIUI文档导览
1. AIUI平台服务
1.1 AIUI平台介绍
1.2 AIUI应用介绍
1.3 AIUI服务链路介绍
1.4 AIUI平台能力概述
1.5 快速体验
2. AIUI应用配置
2.1 应用发布
2.2 语义精简协议介绍
2.3 基础配置
2.4 语义模型配置
2.5 回复角色配置
2.6 语音识别配置
2.7 结构化语义配置
2.8 星火大模型配置
2.9 语音合成配置
2.10 应用后处理配置
2.11 三方大模型配置
3. AIUI SDK开发
3.1 AIUI SDK接入流程
3.2 AIUI SDK基础信息
3.2.1 SDK接口说明
3.2.2 参数配置说明
3.2.3 消息事件说明
3.2.4 SDK状态说明
3.2.5 数据发送方式
3.2.6 回调解析说明
3.2.7 交互结果协议说明
3.3 AIUI SDK基础能力
3.3.1 流式识别
3.3.2 离线识别
3.3.3 语音唤醒
3.3.4 语音合成
3.3.5 用户个性化
3.3.6 自定义参数
3.4 传统语义链路接入
3.4.1 链路配置说明
3.4.2 个性化数据使用
3.5 通用大模型链路接入
3.5.1 链路配置说明
3.5.2 个性化数据使用
3.5.3 超拟人合成
3.5.4 声音复刻
3.6 极速超拟人链路接入
3.6.1 链路配置说明
3.6.2 个性化数据使用
3.6.3 流式合成
3.6.4 声音复刻
3.6.5 RTOS系统SDK接入
3.7 错误码列表
3.8 发音人列表
4. AIUI API开发
4.1 传统语义链路
4.1.1 交互API
4.1.2 用户个性化API
4.1.3 合成能力使用
4.2 通用大模型链路
4.2.1. 服务鉴权
4.2.2 交互API
4.2.3 用户个性化API
4.2.4 声音复刻API
4.2.5 合成能力使用
4.3 极速超拟人链路
4.3.1 服务鉴权
4.3.2 交互API
4.3.3 用户个性化API
4.3.4 声音复刻API
4.3.5 合成能力使用
5. 自定义业务
技能工作室概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
智能体开发
智能体对接
问答库开发
语句问答
关键词问答
文档问答
设备人设开发
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
6. 硬件模组
RK3328 降噪板
RK3328降噪板白皮书
RK3328降噪板使用手册
RK3328降噪板规格书
RK3328降噪板协议手册
RK3328 AIUI评估板开发套件
RK3328评估板白皮书
RK3328评估板使用手册
RK3328评估板规格书
RK3328评估板开发手册
RK3588 AIUI多模态开发套件
RK3588一体机多模态产品规格书
RK3588多模态套件使用手册
视频传输协议
识别语义传输协议
音频传输协议
ZG803 离线语音识别套件
ZG803 产品白皮书
USB声卡套件
USB声卡产品白皮书
USB声卡使用指南
AC7911 AIUI语音开发套件
AC7911-产品白皮书
AC7911-快速体验指南
AC7911-开发指南
AC7911-协议手册
AC7911-硬件参数
AIUI评估板接入
集成方式
软件包说明
AIUIServiceKitSDK
串口SDK
评估板参数配置
调试升级
7. 常见问题处理
7.1 AIUI常见问题
7.2 评估板常见问题
7.3 动态实体常见问题
8. 联系方式
9. 服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
3.6.4 声音复刻
<div style="max-width: 100%; margin: 20px auto;"> <!-- 便签卡片容器 --> <div style="background-color: #ffffff; border-radius: 8px; box-shadow: 0 2px 8px rgba(0,0,0,0.1); overflow: hidden; font-family: 'Comic Sans MS', cursive, sans-serif;"> <!-- 便签头部 --> <div style="background-color: #F4F8FA; padding: 1px 10px; border-bottom: 1px solid #dee2e6; display: flex; justify-content: space-between; align-items: center;"> <div style="color: #0E42D2; font-weight: bold;font-size: 1.3rem;">概述</div> <div> </div> </div> <!-- 带横线的内容区域 --> <div style="padding: 25px; line-height: 29px; background-image: linear-gradient(transparent 26px, #dee2e6 27px, #dee2e6 27px, transparent 27px); background-size: 100% 28px; min-height: 100px; color: #333;"> <div>声音复刻是录入一段音频生成AI定制音色的能力。</div> <a href="#资源注册" style="color: #6f42c1; font-weight: 500;"> <strong>- 资源注册>>>点击跳转</strong></a> <a href="#资源查询" style="color: #6f42c1; font-weight: 500;margin-left: 40px;">   <strong>- 资源查询>>>点击跳转</strong></a> <div> <a href="#资源删除" style="color: #6f42c1; font-weight: 500;"> <strong>- 资源删除>>>点击跳转</strong></a> <a href="#合成调用" style="color: #6f42c1; font-weight: 500;margin-left: 40px;">   <strong>- 合成调用>>>点击跳转</strong></a> </div> </div> <!-- 便签底部 --> </div> </div> </div> ## 1. 集成开发 <div style="display: flex; align-items: flex-start; gap: 16px; padding: 16px; background: #fff5f6; border-radius: 5px; border-left: 4px solid #e83e8c; box-shadow: 0 4px 12px rgba(255, 215, 0, 0.08); margin-bottom: 16px; transition: transform 0.2s ease, box-shadow 0.2s ease;"> <div> <div style="font-weight: 600; margin-bottom: 4px;">温馨提示</div> <div style="font-size: 14px; line-height: 1.5;">1、声音复刻能力使用前需先联系讯飞商务获取授权或发送邮件到 aiui_support@iflytek.com 提交申请。</div> <div style="font-size: 14px; line-height: 1.5;">2、每个设备(SN)最多注册绑定3个资源id。</div> </div> </div> ### 1.1 资源管理 AIUI SDK提供了声音复刻资源管理能力,开发者可以直接进行声音复刻资源相关操作,包括: - 复刻资源注册 - 复刻资源查询 - 复刻资源删除 <div id="资源注册"> </div> #### 1.1.1 资源注册 <div style="display: flex; align-items: center; background-color: #fff3cd; border-left: 6px solid #ffc107; border-radius: 4px; padding: 12px 16px; gap: 8px;"> <div style="width: 30px; height: 30px; flex-shrink: 0;"> <svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"> <path d="M12 9v2m0 4h.01m-6.938 4h13.856c1.54 0 2.502-1.667 1.732-3L13.732 4c-.77-1.333-2.694-1.333-3.464 0L3.34 16c-.77 1.333.192 3 1.732 3z"/> </svg> </div> <div style="flex: 1; line-height: 1.6;"> <h3 style="margin: 0 0 6px 0; font-weight: 600;">注意:</h3> <p style="margin: 0; font-size: 0.95rem;">使用时客户端需要自行存储res_id,避免丢失</p> </div> </div> - 加载音频文件注册,音频要求: > 时长: 建议20s~40s > 文件大小范围:[480KB, 3MB] > 采样率: 24000 > 通道数: 1 > 位深: 16 > 编码格式: 裸音频pcm - 接口调用方式如下(Android示例): ```java // 注册音频保存的路径 // 注意音频文件格式和参数要求 String path = ""; JSONObject paramsJson = new JSONObject(); paramsJson.put(AIUIConstant.KEY_RES_PATH, path); // 构建注册事件 AIUIMessage regVoice = new AIUIMessage(AIUIConstant.CMD_VOICE_CLONE,AIUIConstant.VOICE_CLONE_REG, 0, paramsJson.toString(), null); mAIUIAgent.sendMessage(regVoice); ``` <div id="资源查询"> </div> #### 1.1.2. 资源查询 查询当前设备所注册的所有资源id - Android示例: ```java // 构建资源查询事件 AIUIMessage queryVoice = new AIUIMessage(AIUIConstant.CMD_VOICE_CLONE, AIUIConstant.VOICE_CLONE_RES_QUERY, 0, "", null); mAIUIAgent.sendMessage(queryVoice); ``` <div id="资源删除"> </div> #### 1.1.3. 资源删除 根据指定注册的资源id进行删除。 - Android示例: ```java // 注册好的资源id String mCurResId = "resID"; JSONObject paramsJson = new JSONObject(); paramsJson.put(AIUIConstant.KEY_RES_ID, mCurResId); // 构建资源删除事件 AIUIMessage delVoice = new AIUIMessage(AIUIConstant.CMD_VOICE_CLONE, AIUIConstant.VOICE_CLONE_DEL, 0, paramsJson.toString(), null); mAIUIAgent.sendMessage(delVoice); ``` #### 1.1.4 结果回调解析 - 回调结果处理(Android示例): ```java /** * AIUI 回调 */ private final AIUIListener mAIUIListener = new AIUIListener() { @Override public void onEvent(AIUIEvent aiuiEvent) { switch (aiuiEvent.eventType) { // 声音复刻:资源注册、资源查询和资源删除回调 case AIUIConstant.EVENT_CMD_RETURN: { if (aiuiEvent.arg1 == AIUIConstant.CMD_VOICE_CLONE) { int retCode = aiuiEvent.arg2; int dtype = aiuiEvent.data.getInt(AIUIConstant.KEY_SYNC_DTYPE, -1); if (dtype == AIUIConstant.VOICE_CLONE_REG) { // 声音注册结果 if (retCode == AIUIConstant.SUCCESS) { String resId = aiuiEvent.data.getString(AIUIConstant.KEY_RES_ID, ""); showTip("注册成功,res_id=" + resId); } else { showTip("注册失败,error=" + retCode); } } else if (dtype == AIUIConstant.VOICE_CLONE_DEL) { // 声音删除结果 if (retCode == AIUIConstant.SUCCESS) { showTip("删除成功"); } else { showTip("删除失败,error=" + retCode); } }else if (dtype == AIUIConstant.VOICE_CLONE_RES_QUERY) { // 已注册声音查询结果 if (retCode == AIUIConstant.SUCCESS) { String result = aiuiEvent.data.getString("result", ""); try { JSONObject resultJson = new JSONObject(result); if (!resultJson.isNull("data")) { JSONArray dataArray = resultJson.getJSONArray("data"); if (dataArray != null) { showTip("查询结果:\n" + dataArray); } else { showTip("资源id为空"); } } else { showTip("没有注册资源"); } } catch (JSONException e) { e.printStackTrace(); } } else { showTip("查询失败,error=" + retCode + "," + getErrorDes(retCode)); } } } } } } }; ``` <div id="合成调用"> </div> ### 1.2 能力使用 #### 1.2.1 合成请求 根据资源成功后的资源id,进行合成请求。 声音复刻合成参数示例: > vcn:**x5_clone** > res_id:**fsdfwee234324** > scene:**IFLYTEK.tts** - 合成请求示例(Android): ```java // 合成文本 String text = "您好,欢迎使用科大讯飞语音合成技术。"; byte[] textData = text.getBytes("utf-8"); // 注册好的资源id String mCurResId = "fsdfwee234324"; // 声音复刻vcn固定x5_clone,附带res_id String params = "vcn=x5_clone,res_id=" + mCurResId; AIUIMessage startTTS = new AIUIMessage(AIUIConstant.CMD_TTS, AIUIConstant.START, 0,params,textData); mAIUIAgent.sendMessage(startTTS); ``` #### 1.2.2 结果解析 AIUI SDK所有类型合成结果处理方式一致,Android 示例如下: ~~~ java private AIUIListener mAIUIListener = new AIUIListener() { @Override public void onEvent(AIUIEvent event) { case AIUIConstant.EVENT_RESULT: { try { JSONObject bizParamJson = new JSONObject(event.info); JSONObject data = bizParamJson.getJSONArray("data").getJSONObject(0); JSONObject params = data.getJSONObject("params"); JSONObject content = data.getJSONArray("content").getJSONObject(0); String sub = params.optString("sub"); if ("tts".equals(sub)) { if (content.has("cnt_id")) { String sid = event.data.getString("sid"); String cnt_id = content.getString("cnt_id"); byte[] audio = event.data.getByteArray(cnt_id); //合成音频数据 /** * * dts:音频块进度信息,取值: * - 0(音频开始) * - 1(音频中间块,可出现多次) * - 2(音频结束) * - 3(独立音频,合成短文本时出现) * * 举例说明: * 常规合成dts顺序: * 0 1 1 1 ... 2 * 短文本合成dts顺序: * 3 **/ int dts = content.getInt("dts"); int frameId = content.getInt("frame_id");// 音频段id,取值:1,2,3,... int percent = event.data.getInt("percent"); //合成进度 boolean isCancel = "1".equals(content.getString("cancel")); //合成过程中是否被取消 } } } catch (Throwable e) { e.printStackTrace(); } } break; default: break; } } }; ~~~
admin
2025年9月15日 11:04
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码