五月天综合,亚洲午夜久久久精品影院,天天做天天爱天天综合网2021,无码人妻精品一区二区蜜桃网站

幫助與文檔 > 產(chǎn)品文檔 > 自然語言翻譯服務(wù) > API文檔 > 實時語音翻譯
實時語音翻譯

實時語音翻譯 API 簡介

概念解釋

實時語音翻譯:可實現(xiàn)對連續(xù)音頻流的實時翻譯和整句翻譯,轉(zhuǎn)換成識別后文本信息并返翻譯后文字流。

說明

Hi,您好,歡迎使用有道智云實時語音翻譯API接口服務(wù)。

如果您想快速體驗服務(wù),建議您前往實時語音翻譯體驗中心 或者在體驗中心右下側(cè)找到小程序二維碼,掃描進行體驗。

如果您有與我們商務(wù)合作的需求,可以通過以下方式聯(lián)系我們:

商務(wù)郵箱: AIcloud_Business@corp.youdao.com

如果您對文檔內(nèi)容有任何疑問,可以通過以下幾種方式聯(lián)系我們:

客服QQ:1906538062

智云翻譯技術(shù)交流QQ 1群: 652880659

智云翻譯技術(shù)交流QQ 2群: 669384425

智云翻譯技術(shù)交流QQ 3群: 807539209

智云翻譯技術(shù)交流QQ 4群: 936752411

聯(lián)系郵箱: zhiyun@corp.youdao.com

溫馨提示:

本文檔主要針對開發(fā)人員,接入測試前需要獲取應(yīng)用ID應(yīng)用密鑰;如果您還沒有,請按照新手指南操作。

平臺向每個賬戶贈送50元的體驗金,供用戶集成前測試所用,具體資費規(guī)則詳見 實時語音翻譯服務(wù)報價

接口說明

接口地址:

wss://openapi.youdao.com/stream_speech_trans?{請求參數(shù)}

協(xié)議須知

調(diào)用方在集成實時語音翻譯API時,請遵循以下規(guī)則。

規(guī)則描述
傳輸方式WSS
字符編碼統(tǒng)一使用UTF-8編碼
響應(yīng)格式JSON
語音格式wav(不壓縮、pcm編碼)
語音采樣率16k
語音編碼16bit位深的單聲道

接口調(diào)用參數(shù)

服務(wù)接口的調(diào)用分為認證、實時通信兩階段。

1 .認證階段

請求參數(shù)格式:
key1=value1&key2=value2&key3=value3&key4=value4

參數(shù)說明:

參數(shù)類型必填說明示例
appKeyString已申請的應(yīng)用ID應(yīng)用ID
saltStringUUIDuuid,唯一通用識別碼
curtimeString時間戳(秒)1522292849
signString簽名sha256(應(yīng)用ID + salt + curtime + 應(yīng)用密鑰)
signTypeString數(shù)字簽名類型v4
fromString源語言選擇參照下方語言表
toString目標語言選擇參照下方語言表
formatString音頻格式,支持wavwav
channelString聲道,支持單聲道,值為11
versionStringapi版本v1
rateString采樣率16000
transPatternString支持的翻譯模式:
實時語音識別(stream)
整句翻譯(sentence)
sentence
noitnString強制把阿拉伯數(shù)字轉(zhuǎn)為英文單詞 (0/1),默認值為0 表示不強制0
  • 注意:noitn參數(shù)只適用于以下語種:中文( zh-CHS ),粵語(yue ),英文( en ),英語(澳大利亞)( en-AUS ),英語(印度)(en-IND ),英語(英國)(en-GBR ),日文( ja ),韓文( ko ),西班牙語( es ),俄語(ru ),阿拉伯語(ar )

簽名生成方法如下:
sign=sha256(應(yīng)用ID+salt+curtime+應(yīng)用密鑰)。(僅API接入方式的應(yīng)用有應(yīng)用密鑰

2. 實時通信階段

認證成功之后,進入實時通信階段,此階段客戶端發(fā)送音頻流和結(jié)束標識,并接收轉(zhuǎn)寫結(jié)果。

2. 2. 1 發(fā)送音頻流

此階段客戶端通過 binary message 發(fā)送音頻流,內(nèi)容為音頻的二進制數(shù)據(jù),此過程的發(fā)送頻率將影響文字結(jié)果展示的實時性。

建議以 200ms 間隔發(fā)送音頻數(shù)據(jù),若間隔超時 15s 以上,服務(wù)端將停止識別。

2. 2. 2 發(fā)送結(jié)束標識

客戶端完成所有音頻數(shù)據(jù)的發(fā)送后,需發(fā)送一個特殊的 binary message 到服務(wù)端作為音頻流
發(fā)送結(jié)束的標識,內(nèi)容為:

{"end": "true"}

輸出結(jié)果

認證結(jié)果說明

服務(wù)端通過 text message 返回 json字符串的認證結(jié)果,參數(shù)示例:

參數(shù)類型說明
errorCodeString錯誤碼,詳見 錯誤代碼列表
actionString狀態(tài)標識,started:握手,recognition:識別,error:錯誤
resultString識別結(jié)果數(shù)據(jù)

成功:

{
    "result": {},
    "action": "started",
    "errorCode": "0"
}

失敗:

{
    "result": "{}",
    "action": "error",
    "errorCode": "202"
}

識別結(jié)果說明

交互過程中,服務(wù)端不斷通過 text message 返回實時識別結(jié)果到客戶端,響應(yīng)結(jié)果是以json形式輸出(為text message)。

識別結(jié)果 result 參數(shù)說明:

參數(shù)含義說明
bg分句開始時間單位毫秒/ms (僅簡體中文、通用英文、中英混合包括此字段)
ed分句結(jié)束時間單位毫秒/ms (僅簡體中文、通用英文、中英混合包括此字段)
partial是否是中間結(jié)果true:中間結(jié)果;false:完整句子
segId分句 id從 1 開始遞增
context識別結(jié)果
tranContent翻譯結(jié)果

識別結(jié)果示例:

{
    "result": {
        "transPattern": "stream",
        "segId": 0,
        "bg": 60,
        "context": "Have a good day.",
        "tranContent": "祝你今天愉快。",
        "partial": true,
        "ed": 840
    },
    "errorCode": "0",
    "action": "recognition"
}

支持的語言表

代碼語言
zh-CHS簡體中文
en通用英文
enzh中英混合
ar-IL阿拉伯語(以色列)
ar-JO阿拉伯語(約旦)
ar-AE阿拉伯語(阿拉伯聯(lián)合酋長國)
ar-BH阿拉伯語(巴林)
ar-DZ阿拉伯語(阿爾及利亞)
ar-SA阿拉伯語(沙特阿拉伯)
ar-IQ阿拉伯語(伊拉克)
ar-KW阿拉伯語(科威特)
ar-MA阿拉伯語(摩洛哥)
ar-TN阿拉伯語(突尼斯)
ar-OM阿拉伯語(阿曼)
ar-PS阿拉伯語(巴勒斯坦國)
ar-QA阿拉伯語(卡塔爾)
ar-LB阿拉伯語(黎巴嫩)
ar-EG阿拉伯語(埃及)
pl波蘭語(波蘭)
da丹麥語(丹麥)
de德語(德國)
ru俄語
fr法語(法國)
fr-CA法語(加拿大)
fi芬蘭語(芬蘭)
ko韓語(韓國)
nl荷蘭語(荷蘭)
cs捷克語(捷克共和國)
hr克羅地亞語(克羅地亞)
lv拉脫維亞語(拉脫維亞)
ro羅馬尼亞語(羅馬尼亞)
ms馬來語(馬來西亞)
pt-BRA葡萄牙語(巴西)
pt葡萄牙語(葡萄牙)
ja日語(日本)
sv瑞典語(瑞典)
te泰盧固語(印度)
ta泰米爾語(印度)
ta-SG泰米爾語(新加坡)
ta-LK泰米爾語(斯里蘭卡)
ta-MY泰米爾語(馬來西亞)
th泰語(泰國)
tr土耳其語(土耳其)
es西班牙語(西班牙)
es-AR西班牙語(阿根廷)
es-BO西班牙語(玻利維亞)
es-CL西班牙語(智利)
es-COL西班牙語(哥倫比亞)
es-CR西班牙語(哥斯達黎加)
es-EC西班牙語(厄瓜多爾)
es-SV西班牙語(薩爾瓦多)
es-US西班牙語(美國)
es-GT西班牙語(危地馬拉)
es-HN西班牙語(洪都拉斯)
es-MEX西班牙語(墨西哥)
es-NI西班牙語(尼加拉瓜)
es-PA西班牙語(巴拿馬)
es-PY西班牙語(巴拉圭)
es-PE西班牙語(秘魯)
es-PR西班牙語(波多黎各)
es-DO西班牙語(多米尼加共和國)
es-UY西班牙語(烏拉圭)
es-VE西班牙語(委內(nèi)瑞拉)
it意大利語(意大利)
hi印地語(印度)
en-AUS英語(澳大利亞)
en-CA英語(加拿大)
en-GH英語(加納)
en-GBR英語(英國)
en-IND英語(印度)
en-IE英語(愛爾蘭)
en-KE英語(肯尼亞)
en-NZ英語(新西蘭)
en-NG英語(尼日利亞)
en-PH英語(菲律賓)
en-SG英語(新加坡)
en-ZAF英語(南非)
en-TZ英語(坦桑尼亞)
en-US英語(美國)
vi越南語(越南)
zh-TWN臺灣普通話(中國臺灣)
lo老撾語(老撾)
bn孟加拉語(孟加拉)
bn-IN孟加拉語(印度)
tl菲律賓語
  • 注:目標語言不支持 “enzh 中英混合”

服務(wù)配置

支持格式免費用戶最大支持并發(fā)單次最大請求時長(s)支持語言
wav103600參考支持的語言列表

錯誤代碼列表

錯誤碼含義
101缺少必填的參數(shù),首先確保必填參數(shù)齊全,然后,確認參數(shù)書寫是否正確。
102不支持的語言類型
103翻譯文本過長
104不支持的API類型
105不支持的簽名類型
106不支持的響應(yīng)類型
107不支持的傳輸加密類型
108應(yīng)用ID無效,注冊賬號,登錄后臺創(chuàng)建應(yīng)用和實例并完成綁定,可獲得應(yīng)用ID和應(yīng)用密鑰等信息
109batchLog格式不正確
110無相關(guān)服務(wù)的有效實例,應(yīng)用沒有綁定服務(wù)實例,可以新建服務(wù)實例,綁定服務(wù)實例。注:某些服務(wù)的翻譯結(jié)果發(fā)音需要tts實例,需要在控制臺創(chuàng)建語音合成實例綁定應(yīng)用后方能使用。
111開發(fā)者賬號無效
112請求服務(wù)無效
113q不能為空
114不支持的圖片傳輸方式
201解密失敗,可能為DES,BASE64,URLDecode的錯誤
202簽名檢驗失敗
203訪問IP地址不在可訪問IP列表
205請求的接口與應(yīng)用的平臺類型不一致,確保接入方式(Android SDK、IOS SDK、API)與創(chuàng)建的應(yīng)用平臺類型一致。如有疑問請參考入門指南
206因為時間戳無效導(dǎo)致簽名校驗失敗
207重放請求
301辭典查詢失敗
302翻譯查詢失敗
303服務(wù)端的其它異常
304會話閑置太久超時
401賬戶已經(jīng)欠費停
402offlinesdk不可用
411訪問頻率受限,請稍后訪問
412長請求過于頻繁,請稍后訪問
1001無效的OCR類型
1002不支持的OCR image類型
1003不支持的OCR Language類型
1004識別圖片過大
1201圖片base64解密失敗
1301OCR段落識別失敗
1411訪問頻率受限
1412超過最大識別字節(jié)數(shù)
2003不支持的語言識別Language類型
2004合成字符過長
2005不支持的音頻文件類型
2006不支持的發(fā)音類型
2201解密失敗
2301服務(wù)的異常
2411訪問頻率受限,請稍后訪問
2412超過最大請求字符數(shù)
3001不支持的語音格式
3002不支持的語音采樣率
3003不支持的語音聲道
3004不支持的語音上傳類型
3005不支持的語言類型
3006不支持的識別類型
3007識別音頻文件過大
3008識別音頻時長過長
3009不支持的音頻文件類型
3010不支持的發(fā)音類型
3201解密失敗
3301語音識別失敗
3302語音翻譯失敗
3303服務(wù)的異常
3411訪問頻率受限,請稍后訪問
3412超過最大請求字符數(shù)
4001不支持的語音識別格式
4002不支持的語音識別采樣率
4003不支持的語音識別聲道
4004不支持的語音上傳類型
4005不支持的語言類型
4006識別音頻文件過大
4007識別音頻時長過長
4201解密失敗
4301語音識別失敗
4303服務(wù)的異常
4411訪問頻率受限,請稍后訪問
4412超過最大請求時長
5001無效的OCR類型
5002不支持的OCR image類型
5003不支持的語言類型
5004識別圖片過大
5005不支持的圖片類型
5006文件為空
5201解密錯誤,圖片base64解密失敗
5301OCR段落識別失敗
5411訪問頻率受限
5412超過最大識別流量
9001不支持的語音格式
9002不支持的語音采樣率
9003不支持的語音聲道
9004不支持的語音上傳類型
9005不支持的語音識別 Language類型
9301ASR識別失敗
9303服務(wù)器內(nèi)部錯誤
9411訪問頻率受限(超過最大調(diào)用次數(shù))
9412超過最大處理語音長度
10001無效的OCR類型
10002不支持的OCR image類型
10004識別圖片過大
10201圖片base64解密失敗
10301OCR段落識別失敗
10411訪問頻率受限
10412超過最大識別流量
11001不支持的語音識別格式
11002不支持的語音識別采樣率
11003不支持的語音識別聲道
11004不支持的語音上傳類型
11005不支持的語言類型
11006識別音頻文件過大
11007識別音頻時長過長,最大支持30s
11201解密失敗
11301語音識別失敗
11303服務(wù)的異常
11411訪問頻率受限,請稍后訪問
11412超過最大請求時長
12001圖片尺寸過大
12002圖片base64解密失敗
12003引擎服務(wù)器返回錯誤
12004圖片為空
12005不支持的識別圖片類型
12006圖片無匹配結(jié)果
13001不支持的角度類型
13002不支持的文件類型
13003表格識別圖片過大
13004文件為空
13301表格識別失敗
15001需要圖片
15002圖片過大(1M)
15003服務(wù)調(diào)用失敗
17001需要圖片
17002圖片過大(1M)
17003識別類型未找到
17004不支持的識別類型
17005服務(wù)調(diào)用失敗

版本更新記錄

上線日期版本號更新內(nèi)容
2019.07.09v1.0.0有道智云實時語音翻譯API上線
2019.08.20v1.1.0實時語音翻譯API所支持語種擴充至86個

常用語言Demo

Java 示例

實時語音翻譯 Java demo

Python3 示例

實時語音翻譯 python3 demo

C#示例

實時語音翻譯 c# demo

PHP 示例

實時語音翻譯 php demo

go 示例

實時語音翻譯 go demo

注:其他開發(fā)語言請參照 接口API文檔 進行開發(fā),也歡迎企業(yè)咨詢來提出你們需要的demo。