Posted in

【回顾】支持 90+ 语言的文档 OCR 工具包_AI阅读总结 — 包阅AI

包阅导读总结

1. 文档 OCR 工具包、多语言、Surya、文本识别、表格识别

2. 本文介绍了一个名为 Surya 的多语言文档 OCR 工具包,在 GitHub 有超 3.5k Star。它能精准检测和识别多种语言的文本,包括复杂布局,对比中表现优于 Tesseract。使用需 python 3.9+ 和 PyTorch,模型首次运行自动下载。虽处初期但有优势,开源地址等信息在文中给出。

3.

– 背景介绍

– 处理多语种文档需求增加,主流 OCR 工具对其他语种识别能力薄弱,真实文档布局复杂增加识别难度。

– 项目介绍

– 名为 Surya 的多语言文档 OCR 工具包,有精确行级文本检测等功能,对多种文档和语言优化,适用多种场景。

– 与 Tesseract 性能对比。

– 使用方法

– 需 python 3.9+ 和 PyTorch,用 `pip install surya-ocr` 安装,模型首次运行自动下载,可通过环境变量更改设置,提供检测文本行代码示例和更多语言代码示例。

– 项目推介

– 虽初期但精准度和效率超其他工具,将开发更多功能,给出 Star 趋势图、开源地址等。

思维导图:

文章地址:https://mp.weixin.qq.com/s/cKXrnyI-P6FZ0kQVT5Dqtw

文章来源:mp.weixin.qq.com

作者:精选君

发布时间:2024/7/22 0:59

语言:中文

总字数:829字

预计阅读时间:4分钟

评分:90分

标签:OCR 工具,多语言支持,文本识别,表格识别,GitHub 开源项目


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

大家好,又见面了,我是 GitHub 精选君!

背景介绍

随着科技的发展和全球化的进程,我们经常遇到需要处理多语种文档的情况,例如商业合同、学术论文等。然而,当前主流的 OCR(Optical Character Recognition 光学字符识别)工具或许可以精准地识别英文文本,但对其他语种的文本识别能力却略显薄弱。此外,真实世界的文档常常包含表格、图表等复杂布局,充斥着线性、非线性排列的文本,这也增加了文本识别的难度。因此,我们急需一个精确度高、支持多语种、能智能识别文本和表格的 OCR 工具。

今天要给大家推荐一个 GitHub 开源项目 VikParuchuri/surya,该项目在 GitHub 有超过 3.5k Star,一句话介绍该项目:Accurate line-level text detection and recognition (OCR) in any language.

项目介绍

Surya 一个多语言文档 OCR 工具包。其功能不仅包括精确的行级文本检测,还将解决更为复杂的文本识别和表格/图表识别问题。该项目对多种文档和语言作了优化,可应用于新闻、科学论文、扫描文件等众多场景。

以下是 Surya 与 Tesseract 的性能对比:

如何使用

你需要有 python 3.9+ 版本和 PyTorch,然后你可以用命令pip install surya-ocr来安装。模型将在你第一次运行 surya 时自动下载。在运行程序时,可以通过环境变量来更改surya/settings.py中的设置。您还可以用以下代码检测文本行:

fromPILimportImage
fromsurya.detectionimportbatch_detection
fromsurya.model.segformerimportload_model,load_processor

image=Image.open(IMAGE_PATH)
model,processor=load_model(),load_processor()

#predictionsisalistofdicts,oneperimage
predictions=batch_detection([image],model,processor)

更多语言的代码示例项目也提供了:

项目推介

尽管 Surya 仍处于初期阶段,其精准度和效率在一定程度上已经超过了如 Tesseract 等其他 OCR 工具,且将逐渐开发出对文本识别和表格/图表识别的功能。

以下是该项目 Star 趋势图(代表项目的活跃程度):

更多项目详情请查看如下链接。

开源项目地址:https://github.com/VikParuchuri/surya

开源项目作者:VikParuchuri

开源协议:GNU General Public License v3.0

关注我们,一起探索有意思的开源项目。

点击如下卡片后台回复:加群与技术极客们一起交流人工智能、开源项目,一起成长。如果你正在寻求开源项目推广、DevOps、AIGC 大模型、软件开发等领域的付费服务,可参考推文了解详情。