开始使用 Azure 认知服务从图像中读取文本

时间：2023-11-29 本站点击：1

计算机视觉帮助我们阅读文本，然后使用 NLP 来理解识别出的文本。在本文中，我将专门讨论文本提取部分

在本文中，我们将学习如何从图像中读取或提取文本，无论它是手写的还是打印的。

为了阅读文本，图片中有两件事。第一个是计算机视觉，第二个是NLP，它是 Natural Language Processing 的缩写。计算机视觉帮助我们阅读文本，然后使用 NLP 来理解识别出的文本。在本文中，我将专门讨论文本提取部分。

计算机视觉如何执行文本提取

为了执行这个文本提取任务，计算机视觉为我们提供了 2 个 API：

OCR API。

读取 API。

OCR API适用于多种语言，非常适合相对较小的文本，但如果您在任何图像中都有大量文本或说文本主导图像，那么Read API是您的选择。

OCR API以区域、线条和单词的形式提供信息。给定图像中的区域是包含文本的区域。

因此，输出层次结构将是 - 区域、每个区域中的文本行，然后是每行中的单词。

Read API，非常适用于图像，文本高度加载。

以文本为主的图像的最佳示例是任何扫描或打印的文档。

这里的输出层次结构是页面、行和字的形式。

由于此 API 处理大量行和单词，因此它是异步工作的。

因此，在读取整个文档之前不要阻塞我们的应用程序，而OCR API以同步方式工作。

这是描述何时使用什么的表格：

文字识别API

读取API

适用于相对较小的文本。

适用于以文本为主的图像，即扫描文档。

输出层次结构为 Regions >> Lines >> Words。

输出层次结构将是页面 >> 行 >> 单词。

以同步方式工作。

以异步方式工作。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：/AI/957.html