7种使用OCR将图像转换为文本的方法
在这个数字时代,从图像中提取文本以便进行编辑的需求并不罕见。这尤其是由于我们对只能通过OCR软件帮助来进行数字编辑的纸质文件的依赖。
Optical character recognition(OCR)是一种基于模式识别的人工智能技术,用于识别图像中的文本并将其转换为可编辑的数字文档。如果您需要将像发票、账单或银行对账单这样的数字数据转换为可编辑的图像格式,那么OCR软件可以帮助您。
幸运的是,有许多工具可以使用OCR技术从图像中提取文本。无论您想在PC、手机还是在线上将图像转换为文本,都有相应的工具。
本文将列出多个OCR工具,可帮助您在不同设备上从图像中提取文本。根据您的需求,其中一个工具应该适合您。
#1. 在线将图像转换为文本
有许多在线OCR工具可让您从任何设备上的图像中提取文本。您只需要一个浏览器和互联网连接即可开始使用此工具(在PC和移动设备上均可)。我尝试过许多在线OCR工具,其中的 New OCR 为我使用的所有图像提供了最好的结果。该服务完全免费且非常易于使用。
只需点击选择文件并上传您的图像。
之后,点击预览,然后点击OCR以处理图像。
提取的文本将显示在可编辑的文本框下方,您可以复制它或将其下载为TXT、Doc或PDF文件。
根据我的经验,该工具在提取文本时没有错误,并完美地复制了格式和间距。但是,它不识别字体和文本大小,所以所有文本都是纯文本。
该工具还支持122种语言的文本提取,并且您可以从JPG、PMG、PGM、GIF、BMP、TFF、PDF和DjVu中提取文本。
#2. 使用Google Docs从图像中提取文本
如果您已经使用Google Docs进行文档创建,您无需其他工具即可从图像中提取文本。在Google Docs的桌面版中,您可以上传图像并使用内置的OCR技术来提取文本。
操作步骤如下:
打开 Google Drive 并登录。
点击新建,然后从菜单中选择文件上传来上传您的图像。
上传后,右键点击图像,然后从打开方式选项中选择Google Docs。
就是这样,图像将在Google Docs中打开,并在图像下方显示提取的文本。
有趣的是,Google Docs尝试检测每个单词的字体大小、类型甚至颜色。它还保留了格式和间距。
尽管对我测试的大多数图像都很好用,正确提取了文本并做出了一些格式上的小错误,但是它在其中一张收据图像上出现了严重错误。字体大小和颜色与图像完全不同,使其看起来非常丑陋。幸运的是,这种错误可以通过选择所有文本并选择默认字体来轻松修复。
在我测试的所有OCR工具中,Google Docs在提取文本方面表现最好,与图像非常相似。
#3. 在Windows上将图像转换为文本
如果您更喜欢在Windows PC上转换图像,那么有许多OCR工具可供选择。 Easy Screen OCR 是一款出色的Windows OCR软件,可以准确提取文本。它是一个只有7MB的小工具,可以从系统托盘中运行。您可以选择新的截图来提取文本,也可以上传图像文件。
要使用它,右键点击系统托盘中的图标,然后选择图像OCR。
会打开一个小窗口,您可以在其中拖放图像,它会自动处理。提取的文本将显示在新的区域中,您可以复制它。
这个工具在提取文本方面绝对非常准确,但它不遵守格式或字体。您将只得到默认大小和间距的纯文本。您无法将文本导出到文档;有一个复制按钮可以复制提取的所有文本。
不幸的是,Easy Screen OCR的免费版本只有有限的免费扫描次数;您将需要获取无限使用的 pro subscription。如果您正在寻找一款完全免费的Windows OCR工具,那么 FreeOCR 值得一试。它相当不错,但我注意到它在提取文本时出现了一些小错误。不过,它也可以离线工作,所以它可能正是您所需要的。
#4. 从Android图片中提取文本
Android有很多应用程序可以让您将图像转换为文本。不仅如此,由于所有Android手机都有内置摄像头,您还可以随时扫描文本。我最喜欢的Android OCR应用程序是 Text Scanner,它可以让您离线提取图片中的文本。它还提供免费的无限扫描,支持多种语言。
唯一的显著缺点是免费版广告可能会非常烦人,但您可以在离线情况下使用它来避免广告,因为它可以离线工作。您还可以升级到专业版以去除广告并获得更快的处理速度。
应用程序的右上角有一个按钮,可以从图库中选择图像,底部右侧还有一个按钮,可以使用摄像头拍摄文本照片。使用任何这些选项上传照片,应用程序将自动处理并显示提取的文本。您可以使用底部的按钮在文本和图像之间切换以进行比较。
Text Scanner从我尝试的所有图像中完美地提取了文本,没有任何错误。然而,它使用了默认字体,并没有像大多数其他OCR工具那样尝试复制格式。您还无法将提取的文本导出为特定的文档格式,只能复制或分享文本。
#5. 使用OCR Chrome扩展
如果您特别想从Web上的图像中提取文本,那么Chrome扩展可以帮助您。我喜欢两个用于此目的的扩展,Copyfish 和 Project Naptha。在这两个中,Project Naptha是我最喜欢的,因为它会自动使Web上的所有图像内的文本可选择。
您不需要做任何事情,只需安装扩展,它会使您在Web上找到的每个图像都可选择。当您找到一个带有文本的图像时,按住左键进行选择和复制。当然,它在提取方面并不完美,但对于我使用的图像来说效果还不错。它甚至提供了翻译所选文本的选项。
如果您想要按需扫描和转换图像,那么Copyfish是一个更好的选择。安装Copyfish后,您可以点击扩展按钮打开一个工具,以选择要提取的文本的位置。一旦选择了区域,Copyfish将在其界面中复制高亮区域的图片,然后使用OCR提取文本。
提取的文本可以使用专用按钮复制。您甚至可以使用一个按钮将文本直接在Google翻译中打开进行翻译。为了获得最佳效果,请确保图像以最高可能的分辨率打开,因为Copyfish只是对图像进行了屏幕截图,因此更好的图像质量将提供更准确的提取。
#6. 在Mac上将图像转换为文本
老实说,macOS上没有太多好用的OCR工具。如果您想要在macOS上使用好的OCR软件,您将不得不购买付费软件。 TextSnipper 是macOS最强大的OCR工具之一。您可以从图像、PDF、演示文稿、视频、屏幕录制等中提取文本。
TextSnipper还具有内置的剪切功能。
另一个是Readiris – 它不仅仅是OCR软件。它是一个完整的PDF创建和编辑工具,具有许多高级功能,可从PDF和图像中提取文本。
该工具配有一个试用版本,可以免费使用所有功能10天。如果您喜欢这个工具,您可以根据您的需求购买其中一个专业版本。您可以使用Readiris从计算机上保存的图像/PDF中提取文本,或者从任何图像中提取文本。
除了提取,您还可以annotate PDFs,添加语音评论,拆分/合并PDF,添加水印,在线保存扫描件,将文本转换为音频等等。如果您需要OCR工具和PDF管理器,则Readiris是值得投资的。
如果您想要一款更便宜的Mac OCR工具,那么Picatext也值得一试。仅需3.99美元,您就可以从保存的图像或新截图中提取文本。提取的文本会自动复制到剪贴板,方便随处粘贴,并且您甚至可以选择默认字体。
#7. 在iOS上使用OCR应用程序
Scanner Pro是iOS上最好的OCR和文档扫描应用程序之一。大部分应用程序的功能都是免费的,但遗憾的是,如果要使用图像转文本功能,您将需要购买每年19.99美元的Plus订阅。
该应用程序的主要功能是扫描纸质文档并以完美格式保存为PDF文件。其专业订阅功能可让您从这些扫描中提取文本。免费版本可扫描文件,但会带有水印。
另一个有趣的功能是其文本搜索功能,可让您使用图像内的文本搜索图像。这包括与您共享的所有扫描和PDF文件。
如果您想要一个更简单和免费的iOS OCR应用程序,那么English OCR值得一试。它允许您拍摄需要处理的文件的照片,或者您可以从存储中上传照片。所有应用程序功能都是免费的,但您可以获取不含广告的专业版本。
总结
个人而言,我不经常从图像中提取文本,但每当我需要时,我总是使用在线OCR工具。因为它们可以从任何设备使用,而且无需下载,所以非常适合偶尔使用。我还建议使用Google Docs的OCR工具,如果您的图像具有不同的格式和字体,那么Google Docs的效果最好,可以准确复制文本的原始形式。