資料介紹
軟件簡介
由 TensorFlow 2 和 PyTorch 提供支持,任何人都可以無縫訪問光學字符識別
獲取預訓練模型
使用兩階段方法在 docTR 中實現(xiàn)端到端 OCR:文本檢測(定位單詞),然后文本識別(識別單詞中的所有字符)。因此,可以從可用實現(xiàn)列表中選擇用于文本檢測的架構(gòu)和用于文本識別的架構(gòu)。
from doctr.models import ocr_predictor model = ocr_predictor(det_arch='db_resnet50', reco_arch='crnn_vgg16_bn', pretrained=True)
讀取文件
可以從 PDF 或圖像解釋文檔:
from doctr.io import DocumentFile # PDF pdf_doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Image single_img_doc = DocumentFile.from_images("path/to/your/img.jpg") # Webpage webpage_doc = DocumentFile.from_url("https://www.yoursite.com").as_images() # Multiple page images multi_img_doc = DocumentFile.from_images(["path/to/page1.jpg", "path/to/page2.jpg"])
以默認的預訓練模型為例:
from doctr.io import DocumentFile from doctr.models import ocr_predictor model = ocr_predictor(pretrained=True) # PDF doc = DocumentFile.from_pdf("path/to/your/doc.pdf").as_images() # Analyze result = model(doc)
安裝
安裝 docTR 需要 Python 3.6(或更高版本)和?pip。
由于使用了?weasyprint,如果沒有運行在 Linux 系統(tǒng)之上,將需要額外的依賴項。
對于 macOS 用戶,可以按如下方式安裝它們:
brew install cairo pango gdk-pixbuf libffi
對于 Windows 用戶,這些依賴項包含在 GTK 中。
最新版本
pip install python-doctr
- 樹洞OCR文字識別跨平臺的OCR小工具
- 基于LSTM的表示學習-文本分類模型 18次下載
- 基于主題分布優(yōu)化的模糊文本分類方法 5次下載
- 基于殘差連接的改進端到端文本識別網(wǎng)絡結(jié)構(gòu) 6次下載
- 基于LSTM的流式文檔結(jié)構(gòu)識別方法 7次下載
- 膠囊網(wǎng)絡在短文本多種意圖識別的應用及研究 10次下載
- 基于BP神經(jīng)網(wǎng)絡分類器的垃圾文本過濾模型 43次下載
- 基于神經(jīng)網(wǎng)絡的中文文本蘊含識別模型 7次下載
- 新型中文旅游文本命名實體識別設計方案 24次下載
- 使用數(shù)字識別和AI實現(xiàn)OCR的資料合集 20次下載
- OCR文字識別視覺檢測系統(tǒng)應用程序免費下載 24次下載
- API-Shop-OCR-營業(yè)執(zhí)照識別API接口Python調(diào)用示例代碼說明 6次下載
- 基于文本分類計數(shù)識別平臺設計(JAVA實現(xiàn)) 11次下載
- 串口屏技術(shù)文檔—文本限值提示如何修改為英文 14次下載
- 免費版文字識別系統(tǒng) TH-OCR SDK11.0 0次下載
- 光學識別字符是自動識別技術(shù)嗎 111次閱讀
- 光學識別的過程包含哪些 94次閱讀
- 基于OpenVINO+OpenCV的OCR處理流程化實現(xiàn) 590次閱讀
- 可以提取圖像文本的5大Python庫 2186次閱讀
- Tesseract的進階用法和最佳實踐 1058次閱讀
- OCR實戰(zhàn)教程 859次閱讀
- 如何將PP-OCRv3英文識別模型部署在Corstone-300虛擬硬件平臺上 2214次閱讀
- OCR算法能較好識別水平排布的常規(guī)文本 1248次閱讀
- 如何使用Python開發(fā)截圖識別OCR的小工具 3404次閱讀
- 如何實現(xiàn)自動識別并提取圖片中的文本內(nèi)容 1.5w次閱讀
- ocr技術(shù)是什么?新能源充電樁應用車牌識別ocr技術(shù) 2557次閱讀
- Facebook研究人員提出了一個大規(guī)模圖像文本提取和識別系統(tǒng)——Rosetta 3255次閱讀
- 如何使用EAST文本檢測器在自然場景下檢測文本 1.1w次閱讀
- 服務器端發(fā)票識別api接口 2625次閱讀
- 基于FPGA異構(gòu)加速的OCR識別技術(shù)解析 2857次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關(guān)電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅(qū)動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多