五月天综合,亚洲午夜久久久精品影院,天天做天天爱天天综合网2021,无码人妻精品一区二区蜜桃网站

幫助與文檔 > 產品文檔 > 智能語音服務 > API文檔 > 長語音轉寫
長語音轉寫

長語音轉寫簡介

說明

Hi,您好,歡迎使用有道智云長語音轉寫接口服務。

本文檔主要針對需要集成HTTP API的技術開發(fā)工程師,詳細描述長語音轉寫能力相關的技術內容。

如果您有與我們商務合作的需求,可以通過以下方式聯系我們:

商務郵箱: AIcloud_Business@corp.youdao.com

如果您對文檔內容有任何疑問,可以通過以下幾種方式聯系我們:

客服QQ:1906538062

智云翻譯技術交流QQ 1群: 652880659

智云翻譯技術交流QQ 2群: 669384425

智云翻譯技術交流QQ 3群: 807539209

智云翻譯技術交流QQ 4群: 936752411

聯系郵箱: zhiyun@corp.youdao.com

溫馨提示:

  • 本文檔主要針對開發(fā)人員,接入測試前需要獲取應用ID和應用密鑰,并綁定實例;如果您還沒有,請按照 新手指南 獲取。
  • 平臺向每個賬戶贈送50元的體驗金,供用戶集成前測試所用。

接口說明

長語音轉寫服務,將一小時內的音頻數據轉換成文本數據,為信息處理和數據挖掘提供基礎。您只需要通過調用長語音轉寫 API就可以將音頻數據轉換成文本數據。

協(xié)議須知

調用方在集成長語音轉寫API時,請遵循以下規(guī)則。

規(guī)則描述
傳輸方式HTTPS
請求方式POST
字符編碼統(tǒng)一使用UTF-8 編碼
請求格式表單
響應格式JSON

接口調用參數

長語音轉寫線上調用地址:

http://openapi.youdao.com

音頻格式

格式支持:wav(不壓縮,pcm編碼,采樣率:推薦16k ,編碼:16bit位深的單聲道),aac,mp3

格式代碼
wavwav
mp3mp3
aacaac

支持的語種

語種名稱代碼支持的時長限制
中文zh-CHS4h
日文ja1h
英文en4h
韓文ko1h
粵語yue1h
西班牙語es1h
葡萄牙語pt1h
法語fr1h
德語de1h
俄語ru1h

文件上傳接口定義

預處理接口

  • 接口uri:/api/audio/prepare

接口參數:

參數名稱類型含義是否必填示例
salttextuuid(唯一通用識別碼)Trueuuid,唯一通用識別碼
typetext上傳類型, 僅支持base64上傳,請?zhí)顚懝潭ㄖ?True1
appKeytext應用IDTrue可在 應用管理 查看
sliceNumstring文件分片數目(建議分片大小為10M,若文件<10M,則slice_num=1True1
nametext文件名稱Truetest
fileSizetext文件大小,注意:文件大小限制為500M,取值范圍為:1024-589824000 byteTrue15234
curtimetext時間戳True秒數
langTypetext源語言True支持語言列表
signtext簽名Truesha256(應用ID+salt+curtime+應用密鑰)
signTypetext簽名版本Truev4
formattext語音文件的格式,wavTruemp3/wav/aac/m4a/amr
noitntext是否進行阿拉伯數字轉換,日期轉換的操作。如 "十點五分" 到 “10:05” 的轉換。傳1是漢字,傳0是阿拉伯數字。false0/1(不傳默認為0)
needSpeakerIdtext是否需要返回說話人id (1:是, 0:否)false0/1(默認為0)
speakerNumtext說話人人數(0 自動識別,范圍:[0-10])false(默認為0)
hotWordsString1、熱詞總長度:5000(總長度限制較大,實際到不了5000);2、單個熱詞內容:長度限制1 - 20 ;3、權重取值目前只能是1; 4、熱詞與熱詞之間 用 , (英文逗號)分隔false1、熱詞格式示例:熱詞/權重; 2、目前模型僅支持中文或單個英文字母生效,如果傳其他文本會導致熱詞不生效,但不會有錯誤信息;3、傳空字符串表示不使用熱詞,不會報錯;4、中文傳參為langType="zh-CHS2"
  • 響應結果
  •   {????
      "errorCode":?"0",?//錯誤碼???
      "msg":?"success",?//信息說明????
      "result":?"383e72a47557490aa05a344074117a9d"?//返回的任務ID
      }

文件分片上傳接口

  • 接口uri:/api/audio/upload
  • 接口說明:

預處理成功,調用文件上傳接口;按預處理設置的分片信息(sliceNum)依次上傳音頻切片(文件以二進制方式multipart讀取上傳),

直到全部切片上傳成功(如預處理時 sliceNum=2,則需將音頻切分成兩部分,sliceId=1和2,并按順序調用該接口);

上一切片成功上傳,才可進行下一切片的上傳操作。調用過程中若出現異常,可重試若干次。

  • 接口參數:
參數名稱類型含義是否必填示例
qtexttaskidTrue任務id
appKeytext應用IDTrue可在 應用管理 查看
salttextUUID(唯一識別通用碼)TrueUUID
curtimetext時間戳(秒)True
signtext簽名Truesha256(應用ID+salt+curtime+應用密鑰)
signTypetext簽名版本Truev4
sliceIdtext語音文件分片的IdTrue1
filetext文件Truemultipart的name為file
typetext上傳的類型false1
  • 響應結果
{????
    "errorCode":?"0",?//錯誤碼????
    "msg":?"success",?//信息說明????
    "result":?null?//返回的任務ID
}

合并文件

  • 接口uri:/api/audio/merge
  • 接口說明:

全部文件切片上傳成功后,調用該接口,通知服務端進行文件合并與轉寫操作。 該接口不會返回轉寫結果,而是通知服務端將任務列入轉寫計劃。轉寫的結果通過 getResult 接口獲取。

  • 接口參數:
參數名稱類型含義是否必填示例
qtexttaskidTrue任務id
appKeytext應用IDTrue可在 應用管理 查看
salttextUUID(唯一識別通用碼)TrueUUID
curtimetext時間戳(秒)True
signtext簽名Truesha256(應用ID+salt+curtime+應用密鑰)
signTypetext簽名版本Truev4
  • 響應結果
{
????"errorCode":?"0",?//錯誤碼
????"msg":?"success",?//信息說明
????"result":?null?//返回的任務ID
}

查詢轉寫進度

  • 接口uri:/api/audio/get_progress
  • 接口說明:

在調用方發(fā)出合并文件請求后,服務端已將任務列入計劃。在獲取結果前,調用方需輪詢該接口查詢任務當前狀態(tài)。 當且僅當任務狀態(tài)=(轉寫結果上傳完成),才可調用獲取結果接口獲取轉寫結果。 輪詢策略由調用方決定,建議每隔10分鐘輪詢一次。狀態(tài)碼說明見附錄。

  • 接口參數:
參數名稱類型含義是否必填示例
qtexttaskidTrue任務id
appKeytext應用IDTrue可在 應用管理 查看
salttextUUID(唯一識別通用碼)TrueUUID
curtimetext時間戳(秒)True
signtext簽名Truesha256(應用ID+salt+curtime+應用密鑰)
signTypetext簽名版本Truev4
  • 響應結果
{
????"errorCode":?"0",?//錯誤碼
????"msg":?"success",?//信息說明
????"result": [{"status":"9","taskId":"xxxx"}]//處理狀態(tài):processing;complete
}

查詢轉寫結果

  • 接口uri:/api/audio/get_result
  • 接口說明:

當任務處理進度狀態(tài)為完成時(見查詢處理進度接口),調用該接口獲取轉寫結果。這是轉寫流程的最后一步。 轉寫結果各字段的詳細說明見轉寫結果說明文檔。 服務端也支持主動回調,轉寫完成之后主動發(fā)送轉寫結果到用戶配置的回調地址

  • 接口參數:
參數名稱類型含義是否必填示例
qtexttaskidTrue任務id
appKeytext應用IDTrue可在 應用管理 查看
salttextUUID(唯一識別通用碼)TrueUUID
curtimetext時間戳(秒)True
signtext簽名Truesha256(應用ID+salt+curtime+應用密鑰)
signTypetext簽名版本Truev4
  • 響應結果
{
    "result": [{
        "sentence": "Have a good day.",
        "vad_id": 1,
        "word_timestamps": [70, 270, 390, 710],
        "word_timestamps_eds": [190, 390, 510, 830],
        "words": ["Have", "a", "good", "day."],
        "speaker": 1,
        "partial": false}],
    "errorCode": "0"
}

常用語言demo

java示例

長語音轉寫 python demo

python3 示例

長語音轉寫 python demo

go 示例

長語音轉寫 go demo

任務狀態(tài)碼

狀態(tài)ID狀態(tài)描述
0任務創(chuàng)建成功
1音頻上傳完成
2音頻合并完成
3音頻轉寫中
4轉寫結果處理中
5轉寫完成
6音頻轉寫失敗,需要重試
9轉寫結果上傳完成
12音頻轉碼失敗
13音頻時長超過限制
21包含不合時宜詞匯

狀態(tài)碼

狀態(tài)碼狀態(tài)碼含義
101缺少必填的參數,首先確保必填參數齊全,然后,確認參數書寫是否正確。
102不支持的語言類型
103翻譯文本過長
104不支持的API類型
105不支持的簽名類型
106不支持的響應類型
107不支持的傳輸加密類型
108應用ID無效,注冊賬號,登錄后臺創(chuàng)建應用和實例并完成綁定,可獲得應用ID和應用密鑰等信息
109batchLog格式不正確
110無相關服務的有效應用,應用沒有綁定服務。注:某些服務的結果發(fā)音需要tts服務,需要在控制臺創(chuàng)建語音合成實例綁定應用后方能使用。
111開發(fā)者賬號無效
112請求服務無效
113q不能為空
114不支持的圖片傳輸方式
201解密失敗,可能為DES,BASE64,URLDecode的錯誤
202簽名檢驗失敗,如果確認應用ID和應用密鑰的正確性,仍返回202,一般是編碼問題。請確保翻譯文本 q 為UTF-8編碼.
203訪問IP地址不在可訪問IP列表
205請求的接口與應用的平臺類型不一致,確保接入方式(Android SDK、IOS SDK、API)與創(chuàng)建的應用平臺類型一致。如有疑問請參考入門指南
206因為時間戳無效導致簽名校驗失敗
207重放請求
16001noitn參數錯誤
4000000q不正確
4000001文件大小不匹配
4000002文件為空
4000003文件名稱為空
4000004不支持的格式
4000005sliceNum不正確
4000006sliceId不正確
4000007不支持的文件大小
4000008不支持的語言
4000009任務不存在
4000010文件上傳失敗
4000011文件大小校驗錯誤
4000017熱詞非法
4035001轉寫結果下載失敗