如何将扫描的文档转换为 Word - 快乐的 Android

如果您需要将一本书以文本格式数字化,您可能会有几个问题。可以吗?质量怎么样,好不好?不仅可以做到,而且还有多种方法可以将扫描的文档转换为 Word。让我们来看看:

  • 扫描 PDF 格式的文档并进行编辑 稍后使用 Adob​​e Acrobat XI Pro 将其保存为 Word 格式。 Acrobat 专业版是付费的,但您可以购买 30 天免费试用许可证。
  • 来自 OnlineOCR.net 网站.此 Web 应用程序允许您将 PDF、JPG、TIFF 和 GIF 格式的文档转换为 Word、Excel 和文本。在免费版本中,我们每小时最多可以转换 15 页和不超过一页的文档。
  • 以 (OCR) 格式扫描文档 并将其保存为文本。然后我们可以打开 Word 并编辑或保存为 .doc 格式。
  • 使用一些光学字符识别程序:
    •  扫描仪 (适用于 Windows、Mac OS X 和 Linux)
    • 库卡(适用于 Linux)
    • 办公镜头(用于 安卓ios)
    • CamScanner(用于 安卓ios)

我们所能说的最有效的方法是通过 Adob​​e Acrobat Pro,但前提是扫描非常非常干净且质量很高。光学字符识别应用已经取得了长足的进步,但它们仍然存在一些漏洞,例如粗体或斜体,并且根据原始文档的字体类型转录某些单词可能是错误的。

尝试扫描此文档并将其传递给 Word 以查看会发生什么

从扫描仪本身

某些扫描仪在其自身的扫描程序中包含光学识别 (OCR) 功能。要将文档扫描成文本,您只需要设置数字化格式并查看涉及 OCR 或类似格式的格式(这取决于扫描仪的品牌/型号)。

使用 Adob​​e Acrobat XI Pro 从 PDF 转换为 Word

一旦 Adob​​e Acrobat XI Pro (这里 您有 30 天的免费试用版)转到“工具 -> 文本识别 -> 在此文件中”.

在“窗口识别文字“点击”编辑”并选择文本语言、输出样式和分辨率。

结束,回到“工具 -> 内容编辑 -> 编辑文本和图像”如果您需要更正单词,请修改文本。完成,点击“文件 -> 另存为”并保存为Word格式。

在线OCR

OnlineOCR 是一个将图像或 pdf 文件传输到 Word 的网络应用程序,它非常易于使用。我解释它是如何工作的:输入 //www.onlineocr.net/ 并点击“选择文件”。选择扫描的文档,然后从屏幕中央的 2 个下拉菜单中选择语言和输出格式。

要完成单击“转变”。在它的正下方将出现一个纯文本预览,如果您需要更正任何单词,您可以对其进行编辑。最后点击“下载输出文件”您可以下载Word格式的文件。以下是使用 OnlineOCR 将 PDF 转换为 Word 的示例:

  • 原始PDF:

  • 转换后的文件:

如果此 Web 应用程序不满足您,您可以尝试其他类似的替代方案,例如 自由OCR 或者 免费在线OCR.

光学字符识别 (OCR) 程序

如果您不想在线修改文档并且需要桌面应用程序,您可以使用诸如 扫描仪 (除了无处不在的 Windows 之外,它也可用于 Mac 和 Linux)。

另一种可能性是使用您的 Android 或 iOS 设备扫描文档并将其直接转换为文本。有这样的应用 办公镜头 (为了 安卓ios) 或者 摄像头扫描仪 (为了 安卓ios) 从同一个应用程序执行整个过程。在这些情况下,建议在将图像转换为文本之前清理图像。如果您想了解有关此方法的更多信息,请查看 这个帖子.

在我看来,光学字符识别技术虽然近年来有了很大的进步,但离成为完美的技术还有光年之遥。很多细节,很多用错误的字母和符号“翻译”的单词,乱七八糟的文字。 他仍然缺乏额外的智慧 这让你看到«t &! $ olog1a»不能是文本中任何单词的有效翻译。我仍然没有看到阅读理解,而是对构成单词的单个字母的简单视觉识别,而不将它们与文本的其余部分整合。然而,我相信,我们实现最后一次飞跃的时刻一天比一天接近。

你有 电报 安装了吗?收到每天最好的帖子 我们的频道.或者,如果您愿意,请从我们的 脸书专页.

最近的帖子

$config[zx-auto] not found$config[zx-overlay] not found