通用语义分割数据库
15万张语义分割标注图像,覆盖植物、花卉、车辆、食物、人物、宠物、建筑、山景、水面与天空等11个通用语义类别,每个类具备唯一RGB色值标识。
15.1万 条数据更新时间 2026-05-11
数据集简介
本数据库包含语义分割类标注图像66,938张和图片分类标注图像16,732张,总计150,608张。语义分割标注覆盖11个通用类别:植物(含各类草本、木本植物)、花卉(各类开花植物与花朵)、车辆(含小汽车、公交车、卡车、自行车、摩托车等)、食物(各类菜品、水果、烘焙食品等)、人物(人体全身/半身及人群)、猫狗(家养宠物、流浪宠物,含不同品种与毛色)、建筑(各类建筑物室内外场景)、山景(山脉、山峦、山峰等)、水面(河流、湖泊、海洋、池塘等水面区域)和天空(不同天气条件下的天空区域)。每个类别都对应且仅有唯一的RGB色值标识,便于模型输入与结果判定。此外还包含图片分类标注图像16,732张,共分建筑、花卉、植物和水面四大类别。适用于自动驾驶语义分割模型训练、智能监控场景感知、无人机航拍图像分析及智能图像编辑与分割等多类计算机视觉任务。
数据质量
记录完整性
91.39%
记录时效性
按需更新
记录结构化
NDJSON、JSON、CSV、XLSX、Parquet,支持定制化
记录云交付
Amazon S3、Snowflake、Alibaba Cloud OSS、Google Cloud Storage、Google Drive
记录标准化
为保证数据的一致性与可用性,数据集在构建过程中对原始记录进行了标准化处理,包括:(1)单位标准化:统一价格、重量、尺寸等字段的计量单位;(2)格式标准化:统一日期、时间、数值字段的表示格式;(3)文本清洗:去除 HTML 标签、多余空格及异常字符;(4)字段规范化:统一字段命名、数据类型与缺失值表示方式。该过程确保数据在不同来源和不同采集批次之间保持结构一致性,便于后续分析与建模。
记录代表性
数据覆盖全量业务场景,样本均衡,具备行业代表性
需要定制更适合业务场景的数据集?
我们支持公开数据浏览、关键词筛选与企业级定制交付,帮助你更快完成模型训练与数据分析落地。