2019年7月3日早上,在百度AI開發(fā)者大會上,一個來自山西的青年,將一瓶礦泉水澆在了同樣來自山西的李彥宏身上。
可以回顧一下 https://b23.tv/av57665929/p1 ,著實讓人一驚,這么大的會議上既然讓人這么容易接近大佬。
(圖片來源網絡)
OCR識別準備工作
百度云真的是測試接口的天堂,免費接口很多,當然有量的限制,但個人使用是完全夠用的,什么人臉識別、MQTT服務器、語音識別等等,應有盡有吧
看看OCR識別免費的量
第一步:
創(chuàng)建一個文字識別的應用,也就是向百度云申請一個文字識別的用戶接口
第二步:
打開技術文檔,基本涵蓋了當今流行的編程語言
https://cloud.baidu.com/doc/OCR/s/ejwvxzls6/
第三步:
安裝OCR Python SDK,OCR Python SDK目錄結構
├── README.md
├── aip //SDK目錄
│ ├── __init__.py //導出類
│ ├── base.py //aip基類
│ ├── http.py //http請求
│ └── ocr.py //OCR
└── setup.py //setuptools安裝
支持Python版本:2.7.+ ,3.+
安裝命令:
在win10環(huán)境下通過cmd安裝后需要關掉當前cmd窗口,重新打開cmd窗口進行命令執(zhí)行python程序方可正確實現(xiàn)
pip install baidu-aip
測試代碼
通用文字識別
from aip import AipOcr # 更換為自己的注冊信息 APP_ID = ' --- ' API_KEY = ' --- ' SECRET_KEY = ' --- ' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 創(chuàng)建連接 fp=open( " tu2.png " , " rb " ).read() # 打開并讀取文件內容 res=client.basicGeneral(fp) # 普通 # print(res) # 將所有的文字都合并到一起 strx= "" for tex in res[ " words_result " ]: # 遍歷結果 strx+=tex[ " words " ]#每一行 print (strx) # 輸出內容
通用文字識別(高精度版)
from aip import AipOcr # 更換為自己的注冊信息 APP_ID = ' --- ' API_KEY = ' --- ' SECRET_KEY = ' --- ' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 創(chuàng)建連接 fp=open( " tu2.png " , " rb " ).read() # 打開并讀取文件內容 # res=client.basicGeneral(fp)#普通 res=client.basicAccurate(fp) # 高精度 # print(res) # 將所有的文字都合并到一起 strx= "" for tex in res[ " words_result " ]: # 遍歷結果 strx+=tex[ " words " ]#每一行 print (strx) # 輸出內容
?URL圖片地址方式
from aip import AipOcr # 更換為自己的注冊信息 APP_ID = ' ---- ' API_KEY = ' ---- ' SECRET_KEY = ' ----- ' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 創(chuàng)建連接 url = " https://img2018.cnblogs.com/blog/1485202/201907/1485202-20190705210445649-2093672772.png " res =client.basicGeneralUrl(url) # 普通 # print(res) # 將所有的文字都合并到一起 strx= "" for tex in res[ " words_result " ]: # 遍歷結果 strx+=tex[ " words " ] print (strx) # 輸出內容
注意
圖片格式(image):
圖像數(shù)據,base64編碼,要求base64編碼后大小不超過4M,最短邊至少15px,最長邊最大4096px,支持jpg/png/bmp格式
URL格式(url):
圖片完整URL,URL長度不超過1024字節(jié),URL對應的圖片base64編碼后大小不超過4M,最短邊至少15px,最長邊最大4096px,支持jpg/png/bmp格式,當image字段存在時url字段失效
語言設置(language_type)
識別語言類型,默認為CHN_ENG
可設置:- CHN_ENG:中英文混合;- ENG:英文;- POR:葡萄牙語;- FRE:法語;- GER:德語;-?ITA:意大利語;- SPA:西班牙語;- RUS:俄語;- JAP:日語;- KOR:韓語;
圖像倒置設置(detect_direction)
是否檢測圖像朝向,默認不檢測,即:false。朝向是指輸入圖像是正常方向、逆時針旋轉90/180/270度。可選值包括:- true:檢測朝向;- false:不檢測朝向
是否檢測語言(detect_language)
是否檢測語言,默認不檢測。當前支持(中文、英語、日語、韓語),值為flase或者true
是否返回識別結果中每一行的置信度(probability)
值為flase或者true
參數(shù)添加舉例
""" 如果有可選參數(shù) """ options = {} options[ " detect_direction " ] = " true " options[ " detect_language " ] = " true " """ 帶參數(shù)調用網絡圖片文字識別, 圖片參數(shù)為遠程url圖片 """ client.webImageUrl(url, options)
?更多參考:
https://cloud.baidu.com/doc/OCR/s/Rjwvxzm3n
更多文章、技術交流、商務合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
