全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+
当前位置:首页  >  技术干货

Python技巧-只用一行代码轻松实现图片文本识别

发布时间:2021-08-10 09:14:00
发布人:小千

      生活中我们可能会遇到需要从图片上获取文本内容的情况,人工去核对的话非常头疼,今天小千就来教大家使用Python一行代码就能实现文本识别,下面来看看吧。

Python培训

      Python图片文本识别

      这里我们需要用到两个库:pytesseract和PIL,同时我们还需要安装识别引擎tesseract-ocr

      安装这两个包可以借助pip

      pip install PIL

      pip install pytesseract

      然后我们还需要安装识别引擎tesseract-ocr和中文语言包,默认是不支持中文识别的,所以需要同学们额外安装一个中文语言包,网络上下载安装即可。

      安装完成tesseract-ocr后,我们还需要做一下配置关联到Python中:

      在你安装Python的文件夹中C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py文件,打开之后在里面添加下面的操作。

      CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

      #tesseract_cmd = 'tesseract'

      tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

      可以看到里面有一个路径就是你安装Tesseract-OCR的路径,注意不要填错了。

      配置完成之后就可以使用它们了,代码如下,其中denggao.jpeg为图片,同学们替换成自己想要的图片即可。

Python培训文本识别

Python培训文本识别2

      好了同学们赶紧去自己试试吧,最后欢迎大家来到千锋了解一下我们的Python培训课程,涵盖了Python爬虫、Python web、Python人工智能等领域,欢迎同学们前来试听学习。

相关文章

几千张表的SQL数据库怎么设计持久层?

几千张表的SQL数据库怎么设计持久层?

2023-10-14
Mysql一次读取数据的最小单位是什么?

Mysql一次读取数据的最小单位是什么?

2023-10-14
如何进行安卓应用上传?

如何进行安卓应用上传?

2023-10-14
前端html5框架有哪些?

前端html5框架有哪些?

2023-10-14

最新文章

常见网络安全面试题:Windows常用的命令有哪些?

常见网络安全面试题:Windows常用的命令有哪些?

2023-10-09
常见网络安全面试题:根据设备告警如何展开排查?

常见网络安全面试题:根据设备告警如何展开排查?

2023-10-09
常见网络安全面试题:mysql加固呢?(数据库加固)

常见网络安全面试题:mysql加固呢?(数据库加固)

2023-10-09
常见网络安全面试题:windows和linux加固?(操作系统加固)

常见网络安全面试题:windows和linux加固?(操作系统加固)

2023-10-09
在线咨询 免费试学 教程领取