中文OCR数据集

包含PPT文档问答、中文表格、混贴票据及手写公式等多种OCR任务的高质量图像集。

20.6万 条数据

数据集简介

本数据集共205,709张图像,覆盖PPT文档问答、中文表格OCR、通用中文OCR、中文混贴票据、多角度文档布局、手写公式OCR以及中文手写清单等多种复杂场景。数据来源于真实文档与手写材料,标注精细,可用于训练通用型OCR模型,适用于金融、教育、办公自动化等领域的文字识别任务。

数据质量

需要定制更适合业务场景的数据集?

我们支持公开数据浏览、关键词筛选与企业级定制交付,帮助你更快完成模型训练与数据分析落地。