最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
Tesseract OCR图像识别类库 v5.5.1
时间:2026-06-05 09:26:00 编辑:袖梨 来源:一聚教程网
Tesseract OCR 包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。
Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。
Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。
安装Tesseract:
您可以通过预建的二进制软件包安装正方体 或从源代码编译它。
支持的编译器是:
GCC 4.8及以上
lang 3.4及以上
MSVC 2015、2017、2019年
其他编译器可能可以工作,但未得到官方支持。
相关文章
- 英伟达app官网怎么下载?2026年最新方法 06-05
- 手机降温软件推荐 2026热门免费降温工具合集 06-05
- 动画制作软件推荐:专业级动画制作App排行榜 06-05
- 2026热门实用去水印工具合集 免费一键去水印APP推荐 06-05
- 2026阅读APP下载排行榜 热门好用的看书软件推荐 06-05
- 智驾车专属商业险来了,5个常见误区要避开 06-05