7种使用OCR将图像转换为文本的方法

By姚伟斌 November 10, 2023September 11, 2023

在这个数字时代，从图像中提取文本以便进行编辑的需求并不罕见。这尤其是由于我们对只能通过OCR软件帮助来进行数字编辑的纸质文件的依赖。

Optical character recognition（OCR）是一种基于模式识别的人工智能技术，用于识别图像中的文本并将其转换为可编辑的数字文档。如果您需要将像发票、账单或银行对账单这样的数字数据转换为可编辑的图像格式，那么OCR软件可以帮助您。

幸运的是，有许多工具可以使用OCR技术从图像中提取文本。无论您想在PC、手机还是在线上将图像转换为文本，都有相应的工具。

本文将列出多个OCR工具，可帮助您在不同设备上从图像中提取文本。根据您的需求，其中一个工具应该适合您。

#1. 在线将图像转换为文本

有许多在线OCR工具可让您从任何设备上的图像中提取文本。您只需要一个浏览器和互联网连接即可开始使用此工具（在PC和移动设备上均可）。我尝试过许多在线OCR工具，其中的 New OCR 为我使用的所有图像提供了最好的结果。该服务完全免费且非常易于使用。

只需点击选择文件并上传您的图像。

之后，点击预览，然后点击OCR以处理图像。

提取的文本将显示在可编辑的文本框下方，您可以复制它或将其下载为TXT、Doc或PDF文件。

根据我的经验，该工具在提取文本时没有错误，并完美地复制了格式和间距。但是，它不识别字体和文本大小，所以所有文本都是纯文本。

该工具还支持122种语言的文本提取，并且您可以从JPG、PMG、PGM、GIF、BMP、TFF、PDF和DjVu中提取文本。

#2. 使用Google Docs从图像中提取文本

如果您已经使用Google Docs进行文档创建，您无需其他工具即可从图像中提取文本。在Google Docs的桌面版中，您可以上传图像并使用内置的OCR技术来提取文本。

操作步骤如下：

打开 Google Drive 并登录。

点击新建，然后从菜单中选择文件上传来上传您的图像。

上传后，右键点击图像，然后从打开方式选项中选择Google Docs。

就是这样，图像将在Google Docs中打开，并在图像下方显示提取的文本。

有趣的是，Google Docs尝试检测每个单词的字体大小、类型甚至颜色。它还保留了格式和间距。

尽管对我测试的大多数图像都很好用，正确提取了文本并做出了一些格式上的小错误，但是它在其中一张收据图像上出现了严重错误。字体大小和颜色与图像完全不同，使其看起来非常丑陋。幸运的是，这种错误可以通过选择所有文本并选择默认字体来轻松修复。

在我测试的所有OCR工具中，Google Docs在提取文本方面表现最好，与图像非常相似。

#3. 在Windows上将图像转换为文本

如果您更喜欢在Windows PC上转换图像，那么有许多OCR工具可供选择。 Easy Screen OCR 是一款出色的Windows OCR软件，可以准确提取文本。它是一个只有7MB的小工具，可以从系统托盘中运行。您可以选择新的截图来提取文本，也可以上传图像文件。

要使用它，右键点击系统托盘中的图标，然后选择图像OCR。

会打开一个小窗口，您可以在其中拖放图像，它会自动处理。提取的文本将显示在新的区域中，您可以复制它。

这个工具在提取文本方面绝对非常准确，但它不遵守格式或字体。您将只得到默认大小和间距的纯文本。您无法将文本导出到文档；有一个复制按钮可以复制提取的所有文本。

不幸的是，Easy Screen OCR的免费版本只有有限的免费扫描次数；您将需要获取无限使用的 pro subscription。如果您正在寻找一款完全免费的Windows OCR工具，那么 FreeOCR 值得一试。它相当不错，但我注意到它在提取文本时出现了一些小错误。不过，它也可以离线工作，所以它可能正是您所需要的。

#4. 从Android图片中提取文本

Android有很多应用程序可以让您将图像转换为文本。不仅如此，由于所有Android手机都有内置摄像头，您还可以随时扫描文本。我最喜欢的Android OCR应用程序是 Text Scanner，它可以让您离线提取图片中的文本。它还提供免费的无限扫描，支持多种语言。

唯一的显著缺点是免费版广告可能会非常烦人，但您可以在离线情况下使用它来避免广告，因为它可以离线工作。您还可以升级到专业版以去除广告并获得更快的处理速度。

应用程序的右上角有一个按钮，可以从图库中选择图像，底部右侧还有一个按钮，可以使用摄像头拍摄文本照片。使用任何这些选项上传照片，应用程序将自动处理并显示提取的文本。您可以使用底部的按钮在文本和图像之间切换以进行比较。

Text Scanner从我尝试的所有图像中完美地提取了文本，没有任何错误。然而，它使用了默认字体，并没有像大多数其他OCR工具那样尝试复制格式。您还无法将提取的文本导出为特定的文档格式，只能复制或分享文本。

#5. 使用OCR Chrome扩展

如果您特别想从Web上的图像中提取文本，那么Chrome扩展可以帮助您。我喜欢两个用于此目的的扩展，Copyfish 和 Project Naptha。在这两个中，Project Naptha是我最喜欢的，因为它会自动使Web上的所有图像内的文本可选择。

您不需要做任何事情，只需安装扩展，它会使您在Web上找到的每个图像都可选择。当您找到一个带有文本的图像时，按住左键进行选择和复制。当然，它在提取方面并不完美，但对于我使用的图像来说效果还不错。它甚至提供了翻译所选文本的选项。

如果您想要按需扫描和转换图像，那么Copyfish是一个更好的选择。安装Copyfish后，您可以点击扩展按钮打开一个工具，以选择要提取的文本的位置。一旦选择了区域，Copyfish将在其界面中复制高亮区域的图片，然后使用OCR提取文本。

提取的文本可以使用专用按钮复制。您甚至可以使用一个按钮将文本直接在Google翻译中打开进行翻译。为了获得最佳效果，请确保图像以最高可能的分辨率打开，因为Copyfish只是对图像进行了屏幕截图，因此更好的图像质量将提供更准确的提取。

#6. 在Mac上将图像转换为文本

老实说，macOS上没有太多好用的OCR工具。如果您想要在macOS上使用好的OCR软件，您将不得不购买付费软件。 TextSnipper 是macOS最强大的OCR工具之一。您可以从图像、PDF、演示文稿、视频、屏幕录制等中提取文本。

TextSnipper还具有内置的剪切功能。

另一个是Readiris – 它不仅仅是OCR软件。它是一个完整的PDF创建和编辑工具，具有许多高级功能，可从PDF和图像中提取文本。

该工具配有一个试用版本，可以免费使用所有功能10天。如果您喜欢这个工具，您可以根据您的需求购买其中一个专业版本。您可以使用Readiris从计算机上保存的图像/PDF中提取文本，或者从任何图像中提取文本。

除了提取，您还可以annotate PDFs，添加语音评论，拆分/合并PDF，添加水印，在线保存扫描件，将文本转换为音频等等。如果您需要OCR工具和PDF管理器，则Readiris是值得投资的。

如果您想要一款更便宜的Mac OCR工具，那么Picatext也值得一试。仅需3.99美元，您就可以从保存的图像或新截图中提取文本。提取的文本会自动复制到剪贴板，方便随处粘贴，并且您甚至可以选择默认字体。

#7. 在iOS上使用OCR应用程序

Scanner Pro是iOS上最好的OCR和文档扫描应用程序之一。大部分应用程序的功能都是免费的，但遗憾的是，如果要使用图像转文本功能，您将需要购买每年19.99美元的Plus订阅。

该应用程序的主要功能是扫描纸质文档并以完美格式保存为PDF文件。其专业订阅功能可让您从这些扫描中提取文本。免费版本可扫描文件，但会带有水印。

另一个有趣的功能是其文本搜索功能，可让您使用图像内的文本搜索图像。这包括与您共享的所有扫描和PDF文件。

如果您想要一个更简单和免费的iOS OCR应用程序，那么English OCR值得一试。它允许您拍摄需要处理的文件的照片，或者您可以从存储中上传照片。所有应用程序功能都是免费的，但您可以获取不含广告的专业版本。

总结

个人而言，我不经常从图像中提取文本，但每当我需要时，我总是使用在线OCR工具。因为它们可以从任何设备使用，而且无需下载，所以非常适合偶尔使用。我还建议使用Google Docs的OCR工具，如果您的图像具有不同的格式和字体，那么Google Docs的效果最好，可以准确复制文本的原始形式。

姚伟斌

程序猿

我是姚伟斌，也被称为文景。我的专业领域涵盖了开放源代码的深度探索、网络编程和网络建站。我热衷于分享我的编程和建站实践经验，尤其擅长于Nginx和Proxy服务器的管理。此外，我还对Python和NodeJS这两种编程语言有着深刻的理解和独到的见解。

最近，我致力于爬虫技术的研究，探索如何通过高效的数据抓取为项目增添价值。我的目标是通过持续的学习和创新，为开放源代码社区贡献我的力量，并帮助那些对网络编程和网站建设感兴趣的人士。

工具

如何在Linux上安装Steam并玩你最喜欢的游戏 [2023]

By姚伟斌 November 14, 2023September 11, 2023

在Linux上安装Steam很简单，体验与Windows相似。在Linux上进行游戏有点困难，限制了玩家只能玩开源游戏、虚拟机和模拟器。然而，Steam for Linux的发布改变了玩家的方式。如果您使用Steam，您可以轻松地将保存的游戏文件存储在Steam云中，以便您可以从离开的地方继续游戏。那么，您是Linux和游戏爱好者，想知道如何在Linux计算机上安装Steam吗？如果是的话，让我们讨论如何在Linux上安装Steam并顺利玩游戏。什么是Steam？ Steam是一个数字商店和分发服务，为video games提供支持。该平台由Valve公司于2003年设计和开发。 Steam客户端允许用户在购买后直接安装游戏到他们的云端。此外，Steam用户可以自由发表评论、购买DLC、上传自制内容等。 Steam客户端还具有许多功能，如访问好友列表、自动更新、游戏语音聊天和与好友共享游戏。简而言之，Steam是一个在线视频游戏平台，旨在修复发布的游戏更新。它添加补丁以防止由于过多的在线玩家同时进行游戏而导致崩溃。Steam目前仍处于测试阶段。 Steam的用户友好界面使您可以搜索可用游戏的优惠，包括冒险、动作、第三人称射击和独立游戏。您将有机会在社区内训练或赠送收藏品。 Steam可以在Windows、电视、手机、Linux和MacBook设备上运行。要使用它，您只需要宽带连接以实现高速互联网连接，并且需要一台现代化的系统以无缝播放游戏。Gaming…

工具

在2025年，您可以在您的Android手机上玩10款有趣的街机游戏

By姚伟斌 November 27, 2023September 13, 2023

在PlayStation和任天堂Switch游戏机之前的时代，街机游戏是视频游戏娱乐的主要来源。与今天不同，现在可以在家中舒适地玩游戏，曾经需要你到实体场所使用街机机器进行游戏。过去的经典街机游戏经过了多年的竞争。移动技术的进步使得在智能手机上玩这些游戏变得很容易。通过优化触摸屏的控制，开发人员使得街机游戏可以放在你的手心。 Android街机游戏从街机机器建立的代码和惯例中汲取灵感。Google Play商店上有许多受实际街机机器和80年代和90年代初期的家用游戏机启发的街机游戏。虽然这些游戏的质量各不相同，但最受欢迎的游戏已成为Android上最好的游戏之一。由于选择如此之多，选择一个街机游戏可能会让人感到不知所措。在今天的汇总中，我们展示了一些Android上街机游戏的绝佳选择。 PAC-MAN 作为街机游戏中的经典之作，PAC-MAN是一个不容忽视的游戏。现在你可以在Google Play商店上的多个版本中享受这个永恒的经典游戏。在迷宫中穿行，吞食所有的水果和Pac-Dots，但要小心潜伏在每个角落的鬼魂。 PAC-MAN已通过新模式、迷宫、强化道具等功能进行了更新，吸引了数百万的粉丝。如果您正在寻找极致的PAC-MAN体验，不妨下载这个免费应用。通过免费下载，重温黄金时代的PAC-MAN经典。 Pinball Deluxe – Reloaded Pinball…

工具

12个强大的加密货币扫描器供交易者使用

By姚伟斌 November 24, 2023September 11, 2023

加密扫描仪是一种在线工具，有助于跟踪各种加密资产的动向。大多数交易者使用扫描仪来买卖和监控加密货币。根据2022 statistics，目前有近10,000种加密货币。因此，如果你是一个交易者，想通过浏览每种加密资产找到交易机会，那将会很累人和耗费时间。别担心；扫描仪会帮助您找到潜在的交易机会，而不会感到沮丧。加密扫描仪提供实时价格、市场交易量、市场总市值和其他有价值的信息。交易者还可以设置特定值的警报来执行交易。例如，您可以设置警报，当加密货币突破其历史最高价或交易高于任何技术指标时。加密扫描仪是交易者的最佳工具，有助于构建高效的交易策略和风格。此外，加密扫描仪还有助于减少大量时间和精力投入到加密研究和分析中。让我们直接进入最佳加密扫描仪。 Cryptolume Cryptolume通过提供正确的信息简化交易过程。这个先进的扫描仪提供实时加密市场的最新动态。借助Cryptolume，您可以访问超过2,000种加密货币的数据。这个先进的扫描仪会定期更新实时加密货币价值。此外，交易者会及时收到加密货币的警报。您还可以使用绿色蜡烛扫描、价格或交易量变化、MACD交叉、RSI超卖或超买等方法跟踪加密货币的动向。此外，您还可以跟踪即使为5分钟的交易数据。除了技术分析，Cryptolume还提供币种筛选和基本分析。不幸的是，Cryptolume没有提供免费试用。因此，您可以在两个付费订阅计划之间进行选择。计划从每月19美元起。 Tradytics Tradytics是另一个有用的加密扫描仪，提供关于加密市场动态的清晰结构化信息。这个扫描仪允许交易者发现最大的涨幅、热门加密货币、新上市的币种和历史统计数据。 Tradytics还列出了各类加密货币中价格变动最大的币种。例如，如果中心化交易所显示出高需求，交易者可以查看与中心化交易所相关的加密交易机会。除了最大的价格变动，Tradytics还允许交易者检查整体加密市场情绪、最大市值类别、最大涨幅等。Tradytics的订阅费用从每月69美元起。 Altrady…

工具

如何在Linux系统启动时自动启动服务？

By姚伟斌 November 25, 2023August 31, 2023

系统管理员必须了解的一个重要事项是如何在启动时配置服务，这样当服务器重新启动时，它们会自动启动。

工具

9个最佳MLOps平台来构建和部署你的机器学习模型

By姚伟斌 November 12, 2023September 12, 2023

构建一个机器学习模型相对容易。创建数百个或数千个模型并迭代现有模型则很困难。在混乱中很容易迷失方向。当你作为一个团队工作时，这种混乱会变得更糟，因为你现在必须跟踪每个人的工作。为了将混乱变为有序，整个团队都需要遵循一个流程并记录他们的活动。这就是MLOps的本质。 MLOps是什么？来源：ml-ops.org 根据MLOps.org，机器学习运营试图构建一个端到端的机器学习开发流程，以设计、构建和管理可重复、可测试和可进化的ML驱动软件。本质上，MLOps是将DevOps原则应用于机器学习。与DevOps类似，MLOps的关键思想是通过自动化减少手动步骤并提高效率。此外，与DevOps类似，MLOps包括持续集成（CI）和持续交付（CD）。除了这两个方面，它还包括持续训练（CT）。CT的附加方面涉及使用新数据重新训练模型并重新部署它们。因此，MLOps是一种工程文化，促进了对机器学习开发方法的有条不紊的方法以及对该方法中各个步骤的自动化。该过程主要涉及数据提取、分析、准备、模型训练、评估、模型服务和监控。 MLOps的优势总的来说，应用MLOps原则的优势与拥有标准作业程序的优势相同。优势如下：一个明确定义的流程提供了模型开发中所有关键步骤的路线图。这确保不会错过关键步骤。可以识别并自动化可以自动化的流程步骤。这减少了重复性工作量，增加了开发速度。它还消除了人为错误，同时减少了要完成的工作量。通过了解模型在流水线的哪个阶段，可以更容易评估模型开发的进展。团队之间更容易沟通，因为有一套共享的开发步骤词汇。该流程可以反复应用于开发许多模型，提供了管理混乱的方法。因此，MLOps在机器学习中的作用是提供一种有条不紊的模型开发方法，尽可能地自动化。构建流水线的平台…

工具

如何在Python中检查有效的括号

By姚伟斌 December 15, 2023September 11, 2023

学习如何在Python中检查有效的括号。使用Python列表来模拟堆栈，并使用Python字典来验证括号字符串。