中文OCR数据集
包含PPT文档问答、中文表格、混贴票据及手写公式等多种OCR任务的高质量图像集。
20.6万 条数据
数据集简介
本数据集共205,709张图像,覆盖PPT文档问答、中文表格OCR、通用中文OCR、中文混贴票据、多角度文档布局、手写公式OCR以及中文手写清单等多种复杂场景。数据来源于真实文档与手写材料,标注精细,可用于训练通用型OCR模型,适用于金融、教育、办公自动化等领域的文字识别任务。
数据质量
需要定制更适合业务场景的数据集?
我们支持公开数据浏览、关键词筛选与企业级定制交付,帮助你更快完成模型训练与数据分析落地。