K12题库数据集

全面覆盖K12各学科的标准化试题库,含10余个试题属性维度,支持学科、题型、难度系数等多维度检索。

2000.0万 条数据更新时间 2026-05-11

数据集简介

本K12题库数据集覆盖学校层次包括小学、初中、高中,学科范围涵盖小学数学、小学语文、小学英语、小学科学、小学数学拓展、初中物理/化学/生物/地理/英语/语文/历史/道德与法治/科学/信息技术,以及高中化学/生物/地理/英语/语文/通用技术/信息技术等全学科。题型覆盖选择题(含单选题、多选题、双选题)、作图题、填空题、解答题、判断题、改错题、问答题、探究题、简答题、书写题、实验探究题、单项选择题、多项选择题、阅读理解题、完形填空、短文改错、书面表达题、选词填空、完成句子、补全对话、翻译题、材料解析题、句型转换、语言表达、信息匹配、辨析题、现代文/古诗文阅读、名著阅读、论述题、读图说史题、综合探究题、综合性学习、修改病句、字词书写、单空题、名句默写等近30个题型大类。试题属性方面,包含学科、章节、知识点、题型、难度系数、来源地区、能力维度、分值、详细解析等十余个维度;试卷属性方面,包含试卷类型(单元测试、期中/期末考试、模拟考试、真题等)、试卷来源、总分值、难度系数、考试时间、命题人等十余个维度所有学科考点。适用于AI智能组卷系统、智慧题库平台、学情诊断分析、教学质量评估及K12教育大模型训练等场景。

数据质量

记录完整性
93.04%
记录时效性
按需更新
记录结构化
NDJSON、JSON、CSV、XLSX、Parquet,支持定制化
记录云交付
Amazon S3、Snowflake、Alibaba Cloud OSS、Google Cloud Storage、Google Drive
记录标准化
为保证数据的一致性与可用性,数据集在构建过程中对原始记录进行了标准化处理,包括:(1)单位标准化:统一价格、重量、尺寸等字段的计量单位;(2)格式标准化:统一日期、时间、数值字段的表示格式;(3)文本清洗:去除 HTML 标签、多余空格及异常字符;(4)字段规范化:统一字段命名、数据类型与缺失值表示方式。该过程确保数据在不同来源和不同采集批次之间保持结构一致性,便于后续分析与建模。
记录代表性
数据覆盖全量业务场景,样本均衡,具备行业代表性

需要定制更适合业务场景的数据集?

我们支持公开数据浏览、关键词筛选与企业级定制交付,帮助你更快完成模型训练与数据分析落地。