医疗出版物
约36,690册正版医疗与健康类学术出版物,授权合规合法,涉及基础医学和临床医学的各专业方向课程及科普通识读本。
3.7万 条数据更新时间 2026-05-11
数据集简介
本数据集收集大规模正版医疗健康领域的专业学术著作和医学科普通识出版物,总计约36,690册。内容种类包括医学院校本专科教材(解剖学、生理学病理学及临床诊断技术)、职业医师资格考试辅导书籍(内科学、外科学、儿科四大系统)、执业护士考试同步指南,临床实践与护理技术手册,国家级临床疾病诊疗指南专辑,药学与处方专业知识读本,公共卫生健康与医疗素质科普类图书。所有书籍按照专业分类体系进行标签深化,数据内容来自拥有版权的出版社交付和镜像合作库。适用于创建医学数字知识库、医学大模型全生命周期预训练与医学教育的高质量中文学术书籍数据资源。
数据质量
记录完整性
97.36%
记录时效性
按需更新
记录结构化
NDJSON、JSON、CSV、XLSX、Parquet,支持定制化
记录云交付
Amazon S3、Snowflake、Alibaba Cloud OSS、Google Cloud Storage、Google Drive
记录标准化
为保证数据的一致性与可用性,数据集在构建过程中对原始记录进行了标准化处理,包括:(1)单位标准化:统一价格、重量、尺寸等字段的计量单位;(2)格式标准化:统一日期、时间、数值字段的表示格式;(3)文本清洗:去除 HTML 标签、多余空格及异常字符;(4)字段规范化:统一字段命名、数据类型与缺失值表示方式。该过程确保数据在不同来源和不同采集批次之间保持结构一致性,便于后续分析与建模。
记录代表性
数据覆盖全量业务场景,样本均衡,具备行业代表性
需要定制更适合业务场景的数据集?
我们支持公开数据浏览、关键词筛选与企业级定制交付,帮助你更快完成模型训练与数据分析落地。