PaddleOCR - 百度AI开源的OCR工具库

2021-01-15 代码工坊皮蛋优质项目

简介

　　PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

　　注意

　　PaddleOCR同时支持动态图与静态图两种编程范式

　　动态图版本：dygraph分支(默认)，需将paddle版本升级至2.0rc1+(快速安装)

　　静态图版本：develop分支

　　2021.1.11FAQ新增5个高频问题，总数147个，每周一都会更新，欢迎大家持续关注。

　　2020.12.15 更新数据合成工具Style-Text，可以批量合成大量与目标场景类似的图像，在多个场景验证，效果明显提升。

　　2020.11.25 更新半自动标注工具PPOCRLabel，辅助开发者高效完成标注任务，输出格式与PP-OCR训练任务完美衔接。

　　2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941

　　PPOCR系列高质量预训练模型，准确的识别效果

　　超轻量ppocr_mobile移动端系列：检测(3.0M)+方向分类器(1.4M)+ 识别(5.0M)= 9.4M

　　通用ppocr_server系列：检测(47.1M)+方向分类器(1.4M)+ 识别(94.9M)= 143.4M

　　支持中英文数字组合识别、竖排文本识别、长文本识别

　　支持多语言识别：韩语、日语、德语、法语

　　丰富易用的OCR相关工具组件

　　半自动数据标注工具PPOCRLabel：支持快速高效的数据标注

　　数据合成工具Style-Text：批量合成大量与目标场景类似的图像

　　支持用户自定义训练，提供丰富的预测推理部署方案

　　支持PIP快速安装使用

　　可运行于Linux、Windows、MacOS等多种系统

官方网站：https://www.paddlepaddle.org.cn/hub/scene/ocr
官方GitHub：https://github.com/PaddlePaddle/PaddleOCR

分享到：