Tesseract OCR(图像识别类库)官方版 v4.0.0.20181030
软件大小:56M
软件语言:简体中文
软件授权:官方版
软件类别:办公软件
更新时间:2020-10-30 09:32:44
官方网站:https://github.com/tesseract-ocr
应用平台:Windows操作系统
软件等级:
50%
50%
- 软件介绍
- 软件截图
- 热门词库
Tesseract OCR是一款十分技术专业的图像识别软件,它可以将图象转换成一个命令行工具,转化成文字信息,功能齐全,有需要的小伙伴快来下载吧!
软件特色
1、去持多语言
当前3.02 版本支持包括英文,简体中文,繁体中文,支持Windows,Linux,Mac OSX 多平台。使用中Tesseract 的识别率非常高。
2、Tesseract安装
这里使用的版本为Tesseract3.02。直接点击上面的链接,下载windows下的安装文件tesseract-ocr-setup-3.02.02.exe。安装tesseract-ocr-setup-3.02.02.exe。安装成功后会在相应磁盘上生成一个Tesseract-OCR目录。如图我是安装到了如下位置安装完成打开命令行,输入tesseract,展现如下图说明已经安装成功。
3、命令行测试使用
接下来就可以使用tesseract进行图片识别了。准备一副待识别的图像,这里用画图工具随便写了一段字,然后定义成1.jpg,在命令行中定位到图片路径然后输入命令:tesseract 1.jpg result -l eng,其中result表示输出结果文件txt名称,eng表示用以识别的语言文件为英文。会发现图片当前目录下生成了1个result.txt文件里面结果为
4、增加中文语言库
安装目录下的tessdata目录存放的是语言识别包,如果想增加中文识别功能,可以将中文的语言库放到此目录下,下载后将解压出的chi_sim.traineddata放到此目录下。然后调用的时候指明语言库即可,例如:tesseract xxx.jpg result -l chi_sim照样。
Tesseract OCR(图像识别类库)官方版 v4.0.0.20181030软件截图
- 本类周排行
- 本类总排行