该API是一个OCR(光学字符识别)工具。您传递给它的任何图片将被检查并提取其中的每一个单词。
您需要传递您选择的图像URL。您将获得该图像中的文本内容。这是一个非常直观的API,您会对结果感到惊讶。
该API非常适合那些存储了大量图像并希望提取其包含文本的公司。这将帮助您识别您的品牌是否在网上的图像中未经授权使用。
此外,该API将帮助您对带有文本的图像进行分类。通过字符识别,您将获得完整的单词,并能够仅通过阅读其文本来检测该图像的类别。
除了每月的API调用限制外,所有计划的工作方式是相同的!
通过此端点,您将收到您传递给它的图像中的文本
仅通过图像URL,您将能够以JSON格式提取所有文本
图像必须是常规的JPEG或PNG图像(有或没有透明度)。通常,此类图像的扩展名为: .jpg .jpeg .png。该服务通过MIME类型检查输入文件,并接受以下类型:
image/jpegimage/png图像文件的大小必须小于 16Mb
图像分析 - 端点功能
| 对象 | 描述 |
|---|---|
url |
[必需] The URL of the image you want to extract the text from. Remember that only JPG, JPEG and PNG are supported. |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://file.io/GiqYoEWsoy9i","md5":"d4438cf64b5544dc22854b6585d8c398","width":2160,"height":3840,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.11990740740740741,0.019010416666666665,0.8467592592592592,0.89453125],"entities":[{"kind":"text","name":"text","text":"تحديات تؤثر على خدمة الذكاء الاصطناعى للغة العربية - التشكيل\nC\n00\nه استخدام القرآن الكريم\nيعتبر القرآن الكريم أكبر\nمصدر للغة العربية ولكن\nيصعب في بعض الأحيان\nاستخدامه في تدريب نماذج\nالذكاء الاصطناعي لتجنب\nتحريف المعنى. هناك بعض\nالنماذج التي تم تدريبها\nعلى القرآن الكريم، ولكن لم\nتزل هناك حاجة للمزيد من\nالجهود في هذا المجال.\nقه الكتابة من اليمين إلى اليسار\nتكتب اللغة العربية من اليمين إلى اليسار، وهذا يشكل تحديا في تطوير\nنماذج الذكاء الاصطناعي القادرة على الفهم والتعامل مع هذا النوع\nمن اللغات، مع أن هناك بعض النماذج التى تم تدريبها على الكتابة\nمن اليمين إلى اليسار، ولكن لم تزل هناك تحسينات مطلوبة لجعلها\nأكثر قبولاً وفعالية.\nوم الأرقام العربية\n09\nولّدت الأرقام العربية على أنها أرقام إنجليزية، فالرقم . (صفر) من\nالصعب توليده في الذكاء الاصطناعي، إذ يعتقد أنه عبارة عن نقطة."}]}]}]}]}
curl --location --request POST 'https://zylalabs.com/api/37/optical+character+recognition+api/108/image+analysis?url=https://storage.googleapis.com/api4ai-static/samples/ocr-1.png' --header 'Authorization: Bearer YOUR_API_KEY'
要使用此端点,图像必须是普通的JPEG或PNG图像(有或没有透明度)。这些图像通常具有扩展名:.jpg,.jpeg,.png。该服务通过MIME类型检查输入文件并接受以下类型:
image/jpeg
image/png
图像文件的大小必须小于16 Mb。
图像分析与文件 - 端点功能
| 对象 | 描述 |
|---|---|
请求体 |
[必需] 文件二进制 |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://gopostr.s3.amazonaws.com/binary_file_test_1679/tEMRXL7fQiIgoCXMcQ7UUWHcyqtYa4IeTb1NoAyt.jpg","md5":"f556d7e2b92037ea8b6af4d731597f1d","width":464,"height":479,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.4547413793103448,0.6868475991649269,0.44396551724137934,0.16075156576200417],"entities":[{"kind":"text","name":"text","text":"10\nAFA\nSAVE THE\nPLONET"}]}]}]}]}
curl --location 'https://zylalabs.com/api/37/optical+character+recognition+api/1679/image+analysis+with+file' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--form 'image=@"FILE_PATH"'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
每个端点以JSON格式返回从提供的图像中提取的文本。响应包括请求状态、图像URL、尺寸以及识别的文本及其边界框坐标的详细信息
响应中的关键字段包括“状态”(表示成功或失败)“名称”(图像 URL)“宽度”和“高度”(尺寸)以及“实体”(包含识别的文本及其在图像中的位置)
响应数据被结构化为一个包含“results”数组的JSON对象 每个结果包含有关图像的元数据和一个“entities”数组 该数组详细说明了识别的文本及其边界框坐标
每个端点提供了关于从图像中提取的文本的信息,包括识别的单词、它们的位置和图像的整体尺寸。这对于文本分析和分类非常有用
典型的用例包括数字化印刷文档、监测品牌在图像中的使用以及根据图像所包含的文本对其进行分类 企业可以利用这些数据进行内容管理和合规性
用户可以通过解析 JSON 响应来提取识别的文本及其坐标,以利用返回的数据。这些信息可用于进一步分析、索引或集成到应用程序中以增强功能
端点接受一个参数:图像 URL 或图像文件本身。图像必须为 JPEG 或 PNG 格式且大小小于 16 MB。确保 MIME 类型与接受的格式匹配以便成功处理
数据准确性通过使用先进的OCR算法来维护,这些算法分析图像内容。此API旨在处理各种文本样式和布局,确保从不同的图像来源中可靠地提取文本
服务级别:
100%
响应时间:
584ms
服务级别:
80%
响应时间:
573ms
服务级别:
100%
响应时间:
595ms
服务级别:
100%
响应时间:
633ms
服务级别:
100%
响应时间:
103ms
服务级别:
100%
响应时间:
189ms
服务级别:
100%
响应时间:
1,446ms
服务级别:
100%
响应时间:
311ms
服务级别:
100%
响应时间:
7,797ms
服务级别:
100%
响应时间:
1,209ms