AIUI文档中心
AIUI文档导览
1. AIUI平台服务
1.1 AIUI平台介绍
1.2 AIUI应用介绍
1.3 AIUI服务链路介绍
1.4 AIUI平台能力概述
1.5 快速体验
2. AIUI应用配置
2.1 应用发布
2.2 语义精简协议介绍
2.3 基础配置
2.4 语义模型配置
2.5 回复角色配置
2.6 语音识别配置
2.7 结构化语义配置
2.8 星火大模型配置
2.9 语音合成配置
2.10 应用后处理配置
2.11 三方大模型配置
3. AIUI SDK开发
3.1 AIUI SDK接入流程
3.2 AIUI SDK基础信息
3.2.1 SDK接口说明
3.2.2 参数配置说明
3.2.3 消息事件说明
3.2.4 SDK状态说明
3.2.5 数据发送方式
3.2.6 回调解析说明
3.2.7 交互结果协议说明
3.3 AIUI SDK基础能力
3.3.1 流式识别
3.3.2 离线识别
3.3.3 语音唤醒
3.3.4 语音合成
3.3.5 用户个性化
3.3.6 自定义参数
3.4 传统语义链路接入
3.4.1 链路配置说明
3.4.2 个性化数据使用
3.5 通用大模型链路接入
3.5.1 链路配置说明
3.5.2 个性化数据使用
3.5.3 超拟人合成
3.5.4 声音复刻
3.6 极速超拟人链路接入
3.6.1 链路配置说明
3.6.2 个性化数据使用
3.6.3 流式合成
3.6.4 声音复刻
3.6.5 RTOS系统SDK接入
3.7 错误码列表
3.8 发音人列表
4. AIUI API开发
4.1 传统语义链路
4.1.1 交互API
4.1.2 用户个性化API
4.1.3 合成能力使用
4.2 通用大模型链路
4.2.1. 服务鉴权
4.2.2 交互API
4.2.3 用户个性化API
4.2.4 声音复刻API
4.2.5 合成能力使用
4.3 极速超拟人链路
4.3.1 服务鉴权
4.3.2 交互API
4.3.3 用户个性化API
4.3.4 声音复刻API
4.3.5 合成能力使用
5. 自定义业务
技能工作室概述
名词解析
技能
意图和语料
实体
动态实体
模糊匹配
填槽对话
技能设计规范
语音技能设计规范
开放技能接入审核规范
开放技能图标图片规范
技能开发
创建技能和意图
意图配置
技能测试
技能发布
技能后处理
技能导入导出
云函数APIv2.1
云函数APIv2.0
智能体开发
智能体对接
问答库开发
语句问答
关键词问答
文档问答
设备人设开发
技能协议
语义协议:重要字段和通用字段
技能后处理协议:标准请求
技能后处理协议:请求校验
技能后处理协议:Request_v2.1协议
技能后处理协议:Response_v2.1协议
技能资源限制
6. 硬件模组
RK3328 降噪板
RK3328降噪板白皮书
RK3328降噪板使用手册
RK3328降噪板规格书
RK3328降噪板协议手册
RK3328 AIUI评估板开发套件
RK3328评估板白皮书
RK3328评估板使用手册
RK3328评估板规格书
RK3328评估板开发手册
RK3588 AIUI多模态开发套件
RK3588一体机多模态产品规格书
RK3588多模态套件使用手册
视频传输协议
识别语义传输协议
音频传输协议
ZG803 离线语音识别套件
ZG803 产品白皮书
USB声卡套件
USB声卡产品白皮书
USB声卡使用指南
AC7911 AIUI语音开发套件
AC7911-产品白皮书
AC7911-快速体验指南
AC7911-开发指南
AC7911-协议手册
AC7911-硬件参数
AIUI评估板接入
集成方式
软件包说明
AIUIServiceKitSDK
串口SDK
评估板参数配置
调试升级
7. 常见问题处理
7.1 AIUI常见问题
7.2 评估板常见问题
7.3 动态实体常见问题
8. 联系方式
9. 服务条款
AIUI开放平台服务协议
AIUI开放平台隐私政策
小飞在家用户协议
小飞在家隐私政策
小飞在家开源软件使用许可
讯飞账号隐私政策
讯飞账号用户协议
讯飞带屏音箱用户协议
讯飞带屏音箱隐私政策
AIUI SDK隐私政策
AIUI SDK合规使用说明
本文档使用 MrDoc 发布
-
+
首页
4.2.4 声音复刻API
<div style="max-width: 100%; margin: 20px auto;"> <!-- 便签卡片容器 --> <div style="background-color: #ffffff; border-radius: 8px; box-shadow: 0 2px 8px rgba(0,0,0,0.1); overflow: hidden; font-family: 'Comic Sans MS', cursive, sans-serif;"> <!-- 便签头部 --> <div style="background-color: #F4F8FA; padding: 1px 10px; border-bottom: 1px solid #dee2e6; display: flex; justify-content: space-between; align-items: center;"> <div style="color: #0E42D2; font-weight: bold;font-size: 1.3rem;">声音复刻API概述</div> <div> </div> </div> <!-- 带横线的内容区域 --> <div style="padding: 25px; line-height: 29px; background-image: linear-gradient(transparent 26px, #dee2e6 27px, #dee2e6 27px, transparent 27px); background-size: 100% 28px; min-height: 100px; color: #333;"> <div>声音复刻API提供了将特定声音特征进行提取与复刻的接口服务,包含服务说明、接口规范及核心功能接口详情。</div> <a href="#服务介绍" style="color: #6f42c1; font-weight: 500;"> <strong>- 1、服务介绍>>>点击跳转   </strong></a>    <a href="#接口说明" style="color: #6f42c1; font-weight: 500;"> <strong>- 2、接口说明>>>点击跳转   </strong></a> <br><a href="#功能接口" style="color: #6f42c1; font-weight: 500;"> <strong>- 3、功能接口>>>点击跳转   </strong></a> <div></div> </div> <!-- 便签底部 --> </div> </div> </div> <div id="服务介绍"> </div> ## 1. 服务介绍 声音复刻是录入一段音频生成AI定制音色的能力。 <div style="display: flex; align-items: flex-start; gap: 16px; padding: 16px; background: #fff5f6; border-radius: 5px; border-left: 4px solid #e83e8c; box-shadow: 0 4px 12px rgba(255, 215, 0, 0.08); margin-bottom: 16px; transition: transform 0.2s ease, box-shadow 0.2s ease;"> <div> <div style="font-weight: 600; margin-bottom: 4px;">温馨提示</div> <div style="font-size: 14px; line-height: 1.5;">1、本服务使用前需先联系讯飞商务获取授权或发送邮件到 aiui_support@iflytek.com 提交申请。</div> <div style="font-size: 14px; line-height: 1.5;">2、每个设备(SN)最多注册绑定3个资源id。</div> </div> </div> 本协议主要提供复刻资源管理服务,包括**资源注册**、**资源查询**和**资源删除**。具体合成调用需再交互服务API或AIUI SDK中具体实现。 `示例Demo` 点击超链接下载:[HTTP DEMO](https://gitee.com/iflytek-aiui/AIUICbmLiteDemo/tree/master/res-mngr/voice-clone "点击下载") <div id="接口说明"> </div> ## 2. 接口说明 ### 请求地址 > http[s]://aiui.xf-yun.com ### 接口鉴权 具体鉴权参数构建见[鉴权文档](https://aiui-doc.xf-yun.com/project-1/doc-404/ "大模型API服务鉴权")说明。 <div style="display: flex; align-items: center; background-color: #fff3cd; border-left: 6px solid #ffc107; border-radius: 4px; padding: 12px 16px; gap: 8px;"> <div style="width: 30px; height: 30px; flex-shrink: 0;"> <svg viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round"> <path d="M12 9v2m0 4h.01m-6.938 4h13.856c1.54 0 2.502-1.667 1.732-3L13.732 4c-.77-1.333-2.694-1.333-3.464 0L3.34 16c-.77 1.333.192 3 1.732 3z"/> </svg> </div> <div style="flex: 1; line-height: 1.6;"> <h3 style="margin: 0 0 6px 0; font-weight: 600;">注意:</h3> <p style="margin: 0; font-size: 0.95rem;">鉴权的时间戳有时效性,建议每次请求鉴权时都实时的获取最新时间戳,生成鉴权参数</p> </div> </div> <div id="功能接口"> </div> ## 3. 功能接口 ### 3.1. 资源注册 根据用户输入的音频进行声音复刻,返回资源id。1个SN最多同时绑定注册3个资源,删除已有资源后可继续注册。 - METHOD: POST - PATH: /v2/aiint/voice-clone/sgen/reg - Content-Type: multipart/form-data - HTTP 请求示例: ```java POST /v2/aiint/voice-clone/sgen/reg HTTP/1.1 Host: 127.0.0.1:9996 Content-Length: 412 Content-Type: multipart/form-data; boundary=----WebKitFormBoundary7MA4YWxkTrZu0gW ------WebKitFormBoundary7MA4YWxkTrZu0gW Content-Disposition: form-data; name="appid" 5c8b403a ------WebKitFormBoundary7MA4YWxkTrZu0gW Content-Disposition: form-data; name="sn" 12334454543dfsdfsf ------WebKitFormBoundary7MA4YWxkTrZu0gW Content-Disposition: form-data; name="data"; filename="/D:/文件/tts/2-正常音色文件-zzy.pcm" Content-Type: <Content-Type header here> (data) ------WebKitFormBoundary7MA4YWxkTrZu0gW-- ``` `表单参数`说明 | 参数名 | 类型 | 说明 | 必需 | 示例 | | ------ | ------ | ---------------------------------- | ---- | ------------------ | | appid | string | AIUI应用appid | 是 | 5c8b403a | | sn | string | 设备sn号,长度不超过32位 | 是 | 12334454543dfsdfsf | | data | file | 音频文件 | 是 | - | `注册音频文件格式要求`说明如下: > 时长: 建议20s~40s > 文件大小范围:[480KB, 3MB] > 采样率: 24000 > 通道数: 1 > 位深: 16 > 编码格式: pcm原始音频 `返回值`示例: ```json { "sid": "xxx", "code": 0, "msg": "success", "data": { "res_id": "fsdfwee234324" } } ``` `返回值参数字段`说明: | 参数名 | 类型 | 说明 | 必需 | 示例 | | ---------- | ----- | ------------- | ---- | ----------- | | sid | string | 请求标识 | 是 | - | | code | int | 状态码,0 成功,非0表示请求处理失败 | 是 | 0 | | msg | string | 描述 | 是 | - | | data | object | 返回数据 | 否 | - | | data.res_id | string | 资源id| 否 | fsdfwee234324 | ### 3.2 资源查询 根据指定的SN号,查询当前设备已注册资源id。 - METHOD: GET - PATH: /v2/aiint/voice-clone/sgen/res - Content-Type: application/json `参数字段`说明: | 参数名 | 类型 | 说明 | 必需 | 示例 | | ------ | ------ | ---------------------------------- | ---- | ------------------ | | appid | string | AIUI应用appid | 是 | 5c8b403a | | sn | string | 设备sn号,长度不超过32位 | 是 | 12334454543dfsdfsf | | res_id | string | 当前设备已注册资源id | 否 | ioixvtc9gps | `返回值`示例: ```json { "sid": "acm00940002@dx192d6d3ae917aa9992", "code": 0, "msg": "success", "data": [ { "id": 73, "appid": "5c8b403a", "sn": "12334454543dfsdfsf", "res_id": "ioixvtc9gps", "create_time": "2024-09-12 16:56:17" }, { "id": 3, "appid": "5c8b403a", "sn": "12334454543dfsdfsf", "res_id": "fsdfwee234324", "create_time": "2024-08-19 19:27:29" } ] } ``` ### 3.3. 资源删除 根据指定的SN号下注册存在的资源id,删除该资源id信息。 - METHOD: DELETE - PATH: /v2/aiint/voice-clone/sgen/del - Content-Type: application/json `参数字段`说明: | 参数名 | 类型 | 说明 | 必需 | 示例 | | ------ | ------ | ---------------------------------- | ---- | ------------------ | | appid | string | AIUI应用appid | 是 | 5c8b403a | | sn | string | 设备sn号,长度不超过32位 | 是 | 12334454543dfsdfsf | | res_id | string | 当前设备已注册资源id | 是 | ioixvtc9gps | `返回值`示例: ```json { "sid": "xxx", "code": 0, "msg": "success", "data": null } ```
admin
2025年9月15日 11:27
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
分享
链接
类型
密码
更新密码