五月天综合,亚洲午夜久久久精品影院,天天做天天爱天天综合网2021,无码人妻精品一区二区蜜桃网站

幫助與文檔 > 產(chǎn)品文檔 > 視覺智能服務 > API文檔 > 通用OCR
通用OCR

通用文字識別 API 簡介

概念解釋

通用文字識別:將自然場景下圖片上的文字內(nèi)容,通過定位和檢測,智能識別為可編輯的文本信息。

說明

Hi,您好,歡迎使用有道智云通用文字識別 API接口服務。

如果您想快速體驗服務,建議您前往 體驗中心 或者在體驗中心右下側(cè)找到小程序二維碼,掃描進行體驗。

本文檔主要針對需要集成HTTP API的技術(shù)開發(fā)工程師,詳細描述OCR識別能力相關(guān)的技術(shù)內(nèi)容。

如果您有與我們商務合作的需求,可以通過以下方式聯(lián)系我們:

商務郵箱: AIcloud_Business@corp.youdao.com

如果您對文檔內(nèi)容有任何疑問,可以通過以下幾種方式聯(lián)系我們:

客服QQ:1906538062

智云OCR技術(shù)交流QQ 1群: 654064748

智云OCR技術(shù)交流QQ 2群: 471638046

聯(lián)系郵箱: zhiyun@corp.youdao.com

溫馨提示:

  • 本文檔主要針對開發(fā)人員,接入測試前需要獲取應用ID應用密鑰;如果您還沒有,請按照 新手指南 獲取。
  • 平臺向每個賬戶贈送50元的體驗金,供用戶集成前測試所用,具體資費規(guī)則詳見 通用文字識別服務報價

接口能力

有道智云OCR API接口提供有道的OCR文字識別服務,目前有道智云OCR支持八十種語言的文字識別。您只需要通過調(diào)用有道智云OCR API,傳入經(jīng)過Base64編碼的圖片,通過POST請求方式,就可以得到相應的文字識別結(jié)果。

有道智云OCR API HTTPS地址:

https://openapi.youdao.com/ocrapi

注:請求采用application/x-www-form-urlencoded,不用JSON。

協(xié)議須知

調(diào)用方在集成通用文字識別 API時,請遵循以下規(guī)則。

規(guī)則描述
傳輸方式HTTPS
請求方式POST
字符編碼統(tǒng)一使用UTF-8編碼
響應格式統(tǒng)一采用application/x-www-form-urlencoded格式

接口調(diào)用參數(shù)

調(diào)用API需要向接口發(fā)送以下字段來訪問服務。

字段名類型含義必填備注
imgtext要識別的圖片,需要Base64編碼True必須是Base64編碼
langTypetext要識別的語言類型True目前支持八十余種語言的識別,具體參見支持的語種列表
detectTypetext識別類型,按行識別true按行識別:10012
imageTypetext圖片類型,目前只支持Base64True目前只支持Base64:1,imageType的值為1
appKeytext應用IDTrue可在應用管理查看
salttext隨機字符串,最好是UUID,和curtime一起防請求重放Trueuuid,唯一通用識別碼
signtext簽名,sha256(appKey+input+salt+curtime+密鑰)TrueappKey+img+salt+curtime+應用密鑰
docTypetext服務器響應類型,目前只支持jsonTruejson
signTypetext簽名類型truev3
curtimetext當前UTC時間戳(秒)trueTimeStamp
angletext是否進行360角度識別false0:不識別,1:識別。默認不識別(0)
columntext是否按多列識別falseonecolumn:按單列識別;columns:按多列識別。默認按單列識別
rotatetext是否需要獲得文字旋轉(zhuǎn)角度falsedonot_rotate:不需要旋轉(zhuǎn),返回angle傾斜角度,可自行旋轉(zhuǎn);rotate:根據(jù)angle旋轉(zhuǎn),不返回angle傾斜角度。默認旋轉(zhuǎn)

簽名生成方法如下:
signType=v3;
sign=sha256(應用ID+input+salt+curtime+應用密鑰)。

其中,input的計算方式為:input=img前10個字符 + img長度 + img后十個字符(當img長度大于20)或 input=img字符串(當img長度小于等于20)。

不同語言獲取時間戳,請參看此鏈接

如果對簽名有疑問,可以參看文檔末尾各語言demo。

輸出結(jié)果

返回的結(jié)果是json格式,具體說明如下:

字段類型字段說明
errorCodetext錯誤碼,一定存在
Resulttext識別結(jié)果,查詢成功一定存在
+orientationtext圖片方向
+regionsjsonarray區(qū)域,查詢正確一定存在
++langtext該行文本的語言
++dirtext方向;h:行;v:列,豎排識別
++linesjsonarray行,查詢正確一定存在
+++wordsjsonarray字,查詢正確一定存在
++++wordtext識別的字的結(jié)果
+++texttext行識別結(jié)果
boundingBoxtext段落、行、字的區(qū)域位置信息

即識別結(jié)果主要在Result中,輸出結(jié)構(gòu)為:regions->lines->words.一個文檔可能有多個region,代表段落,一個段落有多行,一行有多個字。

每個段落、每行、每個字都有boundingBox,代表能夠框住段落、行、字的最大box的位置信息。

boundingBox共八個值:分別是左上角坐標(x,y),右上角坐標(x,y),右下角坐標(x,y),左下角(x,y)。

具體可參見下面的參考示例。

參考示例

識別的返回結(jié)果:

{
    "errorCode": "0",   //識別錯誤碼
    "Result": {         //識別結(jié)果
        "orientation": "UP",//圖像方向
        "regions": [        //段落
        {
            "boundingBox": "90,56,232,56,232,244,90,244",   //段落區(qū)域位置信息
        "dir": "h",    //按行識別
        "lang": "zh",    //語種
            "lines": [      //行
            {
            "boundingBox": "116,56,204,56,204,82,116,82",   //行區(qū)域位置信息
            "words": [  //字
                {
                    "boundingBox": "124,54,148,54,148,86,124,86",   //字區(qū)域位置信息
                    "word": "靜" //字識別結(jié)果
                },
                {
                "boundingBox": "156,54,172,53,172,85,156,86",
                "word": "夜"
                },
                {
                "boundingBox": "180,53,204,53,204,85,180,85",
                "word": "思"
                }
            ],
            "text": "靜夜思"   //行識別結(jié)果
        },
        ...
        ]
        }
        ]
    }
}

支持語言

語言代碼語言
sq阿爾巴尼亞語
az阿塞拜疆語
eu巴斯克語
be白俄羅斯語
bs波斯尼亞文(拉丁文)
bg保加利亞文
ca加泰羅尼亞文(加泰隆語)
ceb宿務語
ny齊切瓦語
zh-CHS中文
zh-CHT中文(繁體)
co科西嘉語
hr克羅地亞文
cs捷克文
da丹麥文
nl荷蘭文
en英文
eo世界語
et愛沙尼亞文
fi芬蘭文
fr法文
gd蘇格蘭蓋爾語
gl加利西亞語
de德文
ht海地文
ha豪薩語
haw夏威夷語
hi印地文
hu匈牙利文
is冰島語
ig伊博語
id印度尼西亞文
ga愛爾蘭語
it意大利文
ja日文
jw印尼爪哇語
ko韓文
ku庫爾德語
la拉丁語
lv拉脫維亞文
lt立陶宛文
lb盧森堡語
mk馬其頓語
mg馬爾加什語
ms馬來文
mt馬耳他文
mi毛利語
mr馬拉地語
mn蒙古語
ne尼泊爾語
no挪威文
pl波蘭文
pt葡萄牙文
ro羅馬尼亞文
ru俄文
sm薩摩亞語
sr-Latn塞爾維亞文(拉丁文)
sn修納語
sk斯洛伐克文
sl斯洛文尼亞文
so索馬里語
st塞索托語
es西班牙文
su印尼巽他語
sw斯瓦希里文
sv瑞典文
tl菲律賓語
tg塔吉克語
tr土耳其文
uk烏克蘭文
uz烏茲別克語
vi越南文
cy威爾士文
fy弗里斯蘭語
yo約魯巴語
zu南非祖魯語
hmn苗族語
xh班圖
af南非荷蘭
ar阿拉伯文
bg保加利亞語
bn孟加拉語
bs波斯尼亞語
el希臘
gu古吉拉特
he希伯來
ht海地克里奧爾
ka格魯吉亞
km高棉
kn卡納達
ky柯爾克孜語(吉爾吉斯語)
ml馬拉雅拉姆語
mww白苗語
my緬甸
otq克雷塔羅奧托米語
pa旁遮普語
prs達里語
ps普什圖語
rw盧旺達語
sr-Cyrl塞爾維亞語(西里爾文)
te泰盧固語
th泰語
tk土庫曼語
to湯加語
ur烏爾都語
yi意第緒語
yua尤卡坦瑪雅語
auto自動識別

auto支持所有語種的自動識別

服務配置

支持圖片格式每小時最大請求次數(shù)圖片大小圖片分辨率
jpg\png\bmp3600圖像編碼后大小必須小于2M,
建議不要超過1M;
(編碼后大于1M的圖像會被縮放,影響效果,
建議控制輸入圖像大?。?/td>
圖片的長和寬要求最短邊大于10px,
最長邊小于2048 px。

錯誤代碼列表

錯誤碼含義
101缺少必填的參數(shù),首先確保必填參數(shù)齊全,然后,確認參數(shù)書寫是否正確。
102不支持的語言類型
103翻譯文本過長
104不支持的API類型
105不支持的簽名類型
106不支持的響應類型
107不支持的傳輸加密類型
108應用ID無效,注冊賬號,登錄后臺創(chuàng)建應用并完成綁定,可獲得應用ID和應用密鑰等信息
109batchLog格式不正確
110無相關(guān)服務的有效應用,應用沒有綁定。注:某些服務的結(jié)果發(fā)音需要tts服務,需要在控制臺創(chuàng)建語音合成實例綁定應用后方能使用。
111開發(fā)者賬號無效
112請求服務無效
113q不能為空
114不支持的圖片傳輸方式
201解密失敗,可能為DES,BASE64,URLDecode的錯誤
202簽名檢驗失敗,如果確認應用ID和應用密鑰的正確性,仍返回202,一般是編碼問題。請確保 img 為 UTF-8 編碼.
203訪問IP地址不在可訪問IP列表
205請求的接口與應用的平臺類型不一致,確保接入方式(Android SDK、IOS SDK、API)與創(chuàng)建的應用平臺類型一致。如有疑問請參考入門指南
206因為時間戳無效導致簽名校驗失敗
207重放請求
301辭典查詢失敗
302翻譯查詢失敗
303服務端的其它異常
304會話閑置太久超時
401賬戶已經(jīng)欠費停
402offlinesdk不可用
411訪問頻率受限,請稍后訪問
412長請求過于頻繁,請稍后訪問
1001無效的OCR類型
1002不支持的OCR image類型
1003不支持的OCR Language類型
1004識別圖片過大,超過最大限制
1005angle參數(shù)錯誤
1006圖片不能為空
1007columns參數(shù)錯誤
1008rotate參數(shù)錯誤
1201圖片base64解密失敗
1301OCR段落識別失敗
1411訪問頻率受限

常用語言 Demo

Java 示例

通用ocr Java demo

Python3 示例

通用ocr python3 demo

C#示例

通用ocr c# demo

PHP 示例

通用ocr php demo

go 示例

通用ocr go demo