它是一种光学字符识别(OCR)工具。
安装
用于深度使用 GPU 和 CPU。 ( )
它是一个基于 Torch 的开源机器学习库,适用于自然语言处理等应用。 ( )。
官方网站:
网页(#-)详细介绍了安装的前提条件、方法以及相关注意事项。截图如下:
一个比较有趣、好用、强大的功能是上图中的表格,它可以根据不同的选择生成相应的安装命令。我选择的是Pip,CPU(CUDA不适用),对应的安装命令是:pip3 torch.
在Win10命令行窗口中,执行上述命令(前提是已经安装了pip)。结果如下所示:
对了,使用命令“.exe -m pip -- pip”来更新pip。
使用网页“”部分引入的代码(#-)来验证安装的正确性。
火炬
x = 火炬.rand(5, 3)
打印(x)
执行结果如下图所示:
安装应该成功。
安装
网页
安装方法介绍(网页Pre部分第一句的意思是“对于,你可能需要手动安装”,3.10.4会自动下载安装吗?有时间可以试试),使用 pip 安装命令为:pip
在win10命令行窗口中执行上述命令的结果如下图(需要较长时间;如果长时间没有反应,可以按回车键查看是否安装完成) :
由于内容较多,正文部分附在最后。
安装完成后,“D:\\\\”目录下会多出几个exe文件。
使用网站识别图像中文本的示例
替换网页中的图片“ ”
下载并保存为文件“d:\temp\.jpg”,依次执行以下命令(代码):
= .(['', 'en'])
= .(r'd:\temp\.jpg')
当执行代码“= .(['', 'en'])”时,程序自动通过互联网下载检测模型和识别模型。提示信息及翻译如下:
CUDA 不是 - CPU。注意:这对于 GPU 来说就很重要了。
(没有 CUDA - 默认使用 CPU。注意:该模块在 GPU 上运行效率更高)
模型,等等。这可能会影响您的。
(正在下载检测模型,请稍候,所需时间取决于您的网络)
模型,等等。这可能会影响您的。
(正在下载识别模型,请稍候,所需时间取决于您的网络)
找不到CUDA是因为我在安装时没有选择安装CUDA。
使用检测模型来匹配图片中的文字,即找到图片中的文字;找到后,使用识别模型来识别文本。
其中,''和'en'是语言标识符,''表示古汉语,'en'表示英语。支持的语言列在“ ”页面上。
下载的模型文件保存在“C:\Users\zhang\.\model”(其中zhang为用户名,不同电脑用户不同)目录下,如下图:
代码“ = .(r'd:\temp\.jpg')”的结果显示信息过于详细。可以用“ = .(r'd:\temp\.jpg', = 0)”或“ = .( r'd:\temp\.jpg', = 0, =True)”代替,执行结果如下图:
执行结果与网页“ ”一致。
车牌识别(有识别错误)
文件名为“D:\temp\.png”,图片内容如下:
由于车牌包含简体中文、英文和数字,因此使用以下命令:
= .(['', 'en'])
= .(r'd:\temp\.png', = 0, =True)
执行结果如下图所示:
当执行代码“= .(['', 'en'])”时,会下载识别模型文件“.pth”并保存在目录“C:\Users\zhang\.\model”中。
识别结果是“京”,但实际上是“京Q TA209”。 Q被错误识别为0,A被错误识别为4,即存在识别错误。而且路上的汉字也认不出来。
我这里测试了一下,似乎无法处理文件名(路径)中的中文字符。
公益广告牌汉字识别(有识别错误)
文件名为“D:\temp\.png”,图片内容如下:
仅限汉字,使用以下命令:
= .([''])
= .(r'd:\temp\.png', = 0, =True)
执行结果如下图所示:
识别结果是:公益广告,人人平等,月亮受尊重,月亮强。
真实文字是:公益广告众生平等自尊自强
误将“命”误为“辰虎”,误将“子”误误为“月”。也存在一定的识别错误。
扫描电子书图像中的文本识别(精度更高)
文件名为“D:\temp\shu.png”,图片内容如下:
仅限汉字,使用以下命令:
= .([''])
= .(r'd:\temp\shu.png', = 0, =True)
执行结果如下图所示:
识别结果为: 排除字符组是表达所有未列出字符组的一种简单方便的方式。
真实的文字是: 独占字符组是表示所有未列出字符的字符组的便捷方法
识别25个单词,有错误。
概括
安装介绍并用于识别一些图片中的文字。结果表明,具有从图片中检测并识别文本的功能,但存在一定的识别错误率。
相关参考页面
(Gitee快速下载/)
(pip3的使用)
解释如何安装的网页
pip命令执行结果
-1.4.2-py3-none-any.whl (70.8 MB)
---------------------------------------------------- 70.8/70.8 MB 3.2 MB/秒 eta 0 :00:00
: >=0.5 in d:\\\\lib\site- (来自 ) (0.12.0)
: d:\\\\lib\site- 中的 numpy(来自 )(1.22.4)
scipy
scipy-1.8.1-cp310-cp310-.whl (36.9 MB)
---------------------------------------------------- 36.9/36.9 MB 3.7 MB/秒 eta 0 :00:00
--=0.5->) (4.2.0)
: 在 d:\\\\lib\site- (来自 >=0.5->) (2.27.1)
六
六-1.16.0-py2.py3-none-any.whl (11 kB)
>=2.4.1
-2.19.2-py3-none-any.whl (3.4 MB)
---------------------------------------------------- 3.4/3.4 MB 4.4 MB/秒 eta 0 :00:00
>=1.1.1
-1.3.0-cp310-cp310-.whl (4.2 MB)
---------------------------------------------------- 4.2/4.2 MB 4.0 MB/秒 eta 0 :00:00
>=2019.7.26
-2022.5.4-py3-none-any.whl (195 kB)
---------------------------------------------------- 195.6/195.6 kB 3.9 MB/秒 eta 0 :00:00
: >=20.0 in d:\\\\lib\site- (来自 -image->) (21.3)
>=2.2
-2.8.2-py3-none-any.whl (2.0 MB)
---------------------------------------------------- 2.0/2.0 MB 3.9 MB/秒 eta 0 :00:00
: !=3.0.5,>=2.0.2 in d:\\\lib\site- (来自 >=20.0->-image->) (3.0.9)
: >=2017.4.17 in d:\\\\lib\site- (来自 ->>=0.5->) (2022.5.18.1)
: =1.21.1 in d:\\\\lib\site- (来自 ->>=0.5->) (1.26.9)
: -~=2.0.0 in d:\\\\lib\site- (来自 ->>=0.5->) (2.0.12)
: d:\\\\lib\site- 中的 idna=2.5 (来自 ->>=0.5->) (3.3)
:、六、scipy、、、--、、、-image、-bidi、
-1.3.0 -6.0 -1.4.2 -2.19.2 -2.8.2 ---4.5.4.60 -bidi-0.4.2 -image-0.19.2 scipy-1.8.1 六-1.16.0 -2022.5.4
:是一个小波分析库(小波变换)。
扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。