我们在研究中经常遇到一个问题,迫使我们求助于旧档案或书籍。但对这些信息的访问通常受到限制或受到严格的付费墙的限制。但即使您可以访问旧书和图书馆,问题是所有文本都是打印的。
然而,在这个时代,一切都是数字化的,这意味着曾经通过 荷兰费者电子邮件列表 印刷小册子和时事通讯传播的知识现在已经过时了。那么解决办法是什么呢?这正是今天帖子的主题。我们将教您如何从旧书中提取文本,将所有内容数字化,并让您充满创意。让我们开始吧。
如何从书中提取文本?
您必须遵循一系列步骤来创建旧书的数字版本。下面提到了它们。
单击相应的图像
首先单击书中相应的图像。如果您通过智能手机进行点击,请尽量避免页面区域出现过多的亮点。但是,如果您已经拥有该书的数字副本,则可以完全跳过此步骤。
要拍摄快照,我们建议使用 iOS 或 Android 上的扫描全能应用程序来轻松扫描旧书。该工具会自动锐化图像的对比度和颜色,以便文本轻松突出(这对于下一步至关重要)。
下面是我们将在本文中使用的一本旧书的屏幕截图。虽然图像是从一个微小的角度拍摄的,但足以为我们的过程产生准确的结果。
从旧书中提取文本
获取作业文本提取工具
完成扫描并拍摄合适的书籍图像后,就可以开始该过程的下一阶段,即使用功能强大的工具来完成任务,将图像转换为可编辑和可更新的格式。
在这种情况下,有几种方法可以进行。其中