APP下载

基于Python语言的图文识别方法分析

2019-09-10邹懿雯

科学导报·学术 2019年43期
关键词:Python语言

邹懿雯

摘  要:在我们周边的生活中,我们会发现书籍和文件中一些中英文和公式是以一种图片的方式向我们呈现的。其实这只是一种图文识别的方法,利用了PIL库、pytesser库和OpenCV库来实现了中英文文字识别与图片识别之间的转换。在图文识别的过程中,是先打开OpenCV库进行图片的处理,然后再利用pytesser进行图片中文字的识别,最终成为Python语言。在近几年的时间里,Python语言的语言利用范围越来越广泛。本文是为了介绍一种图文识别方法——Python语言的图文识别,未来将为人们进行文本编辑提供了捷径。

关键词:Python语言;图文识别;中英文文字;文本编辑

随着互联网发展速度十分迅速,它为我们的日常生活提供了许多的便利,也提供了愈来愈多的网络资源。OCR(optical character recognition)文字识别是指电子设备检查纸上打印的文字,然后用图文识别方法将图片翻译成计算机文字的过程。用户可以通过手机的拍照或者选择手机相册图片进行智能识别,识别出来的文字可以智能根据图片文字段落进行排版,从而将图片上的某些文字信息翻译成计算机文字的过程。这个图文识别的功能就是利用 Python 语言的资源库,通过代码的操作,就能够达到图文识别的功能[1]。我们也能在未来的生活中看到它的广泛应用。

一、Python语言

于 1990 年Python 语言的设计发起人吉多·范罗苏姆发布了 Python 的初始版。1989年的圣诞节期间,吉多他只是想为了打发圣诞节的无聊时间,想开发一个新型编程语言,为继承ABC语言做铺垫。Python作为该编程语言的名字,主要是取自英国20世纪70年代首播的电视喜剧《蒙提.派森的飞行马戏团》。作为一种计算机程序设计动态类型的语言,设计初期是用于编写自动化脚本,随着版本的不断更新换代,越来越多的语言功能被用于大型项目的开发中。Python是一种编程脚本语言,可以应用于以下领域:Web 和 Internet开发,科学计算和统计,人工智能,教育,桌面界面开发,软件开发,后端开发[2]。自从20世纪90年代初这种计算机程序语言Python语言被开发出来,它已大范围地应用于系统管理任务的处理和Web编程。Python语言的单一性、易阅读和可延伸性,使得国内外一些知名大学已经开展了Python语言的相关程序设计课程。Python语言成为一门阅读人群范围越来越广泛,并且成为最受欢迎的程序设计语言之一,那是因为Python语言在某些方面呈现出来的是明确简单的形象。这个计算机程序语言的设计哲学是“优美”、“明确”、“简单”。让代码看起来有阅读的兴趣并且不复杂是发明者设计时最初的想法。在用户无论是使用何种语言的字符号,能够使编程代码看起来简洁。

二、Python語言的特点

(一)优点:

简单性:Python是一种代表思维简单、操作性强的语言。都是给程序员留有足够的想象空间的。

易操作:Python有十分简单的说明,所以这个编程语言不难以理解。

执行速度快:Python的标准库和第三方库都是用 C语言编写的,执行速度快。

免费、开源:Python是FLOSS(开放源码软件)之一。相当于说用户可以没有任何限制进行代码的复制且发布。还可以阅读源代码,甚至将一些代码进行篡改利用到新程序当中都是可以的。

高级计算机程序语言:在Python语言编写程序的时候省了一步考虑最后考虑的问题

解释性:在程序员在开发新的编程代码时往往不会去使用C或C++写的程序去编程,而选择Python语言去进行编程工作。C或C++编程的这个过程在运行程序上就已经变得繁琐起来,且功能还不足以与Python语言相抗衡。因为Python语言在编写程序上不需要去使用二进制的代码,直接从原始代码运行程序就可以了。Python语言在速度上和解释性上就比其他程序语言胜出一筹了。在本质上,Python语言就是字节编译的计算机编程语言[3]。这正是它相较于其它者的有点。

可大幅度延伸:希望在操作速度上得到提升,可以不多延深Python语言的可能性。

可融性:为了程序员的编程工作,可以将Python与 C/C++相互结合在一起,从而向程序用户提供脚本功能。

庞大的词库:Python标准库加上第三方库可以帮助处理各种与系统有关的操作工作。

(二)缺点:

限制输出问题:Python语言在大部分时间程序无法连成一行,须在编写程序时写入一个.py文件。

局限性语法:在一定程度上,区分语句之间关系有着局限性。

速度慢:与其他编程语言相比,Python语言的运行速度会很慢。

三、Python语言的应用

在硬盘目录下所保存等待扫描的文件,有文件名为图1“数学.png”、图2“英文.png”、图3“符号.png”、图4“诗词.png”[4]。

通过Python语言的图文识别结果如下:

结语

随着网络技术越来越强大,计算机的图文识别功能已上线。Python 语言拥有强大的第三方脚本语言词库,Python有着极高的识别准确率在大部分时间里减少了图文识别的错误率,用户在文本编辑节约了大量时间。回顾这些过往,Python语言对于我们还是有着相当的益处。未来生活的互联网与科技的相互结合,会为程序员的编写程序生活上提供更加有利的方法。Python语言的不断更新换代会使代码具备更加完美的功能。相信不久将来,Python语言应用范围会越来越广泛。

参考文献

[1]  温珍,基于Python语言的中文文本处理研究[J],南昌工程学院学报,2018,134(03):74-79

[2]  李泽,古超,龙政,基于Python的文本分析方法研究[J],电脑编程技巧与维护,2018,394(04):27-28+53

[3]  裘锴.Python语言编程在计算机理论教学上的应用探索[J].纳税,2017(21):188.

[4]  张毅宁,基于Python语言的模式识别应用[J],鞍山师范学院学报,2016,96,(02):79-81+95

猜你喜欢

Python语言
关于面向非计算机专业开设Python语言的几点思考
计算思维培养视域下《Python程序设计》课程的教学改革实践
在高中信息技术课中培养学生计算思维的有效方法探讨
基于KNN算法的手写数字识别
Python语言教学中问题解决能力和创新能力的培养实践
Python语言程序设计教学体系建设
面向计算生态的Python语言入门课程教学方案
基于Python语言和支持向量机的字符验证码识别
论Python程序设计语言
基于Python语言的面向对象课程实践教学探讨