{
    "created": "2025-11-05 18:47:51",
    "updated": "2026-05-09 17:34:16",
    "id": "a711d881-7b52-40ac-b671-864178fb99f8",
    "version": 2,
    "ds_topic": null,
    "title_cn": "新疆10m水体悬浮物数据集（2024年4-10月）",
    "title_en": "",
    "ds_abstract": "<p>本数据采用2024年哨兵2号光学卫星数据为数据源，采样随机森林回归（RFR）方法构建新疆湖泊水体悬浮物浓度遥感估算模型。数据为CGCS2000坐标系阿伯斯投影，精度为10米。数值系数为0.001，即数据像素值乘以0.001可得实际水体悬浮物浓度（mg/L）。</p>",
    "ds_source": "<p>采用2024年哨兵2号光学卫星数据L1C级别数据，数据可从欧空局哥白尼数据开放中心获取（https://dataspace.copernicus.eu/browser/）。</p>",
    "ds_process_way": "<p>使用具有较好辐射性能的Sentinel 2 A/B MSI。Sentinel 2 A/B MSI拥有13个光谱波段，空间分辨率分别是10 m、20 m和60 m，重访周期为10天，双星组网后为5天，在内陆水体表现了较好的性能。从欧空局哥白尼数据开放中心获取L1C数据。\n采用POLYMER算法进行大气校正。随后需要进一步去除天空光、太阳耀斑和残余气溶胶散射的影响：\nR_rs (λ)=(R(λ)-min⁡(R(865),R(2202)))/π\n式中，Rrs为水体遥感反射率，R为POLYMER校正获取的地表反射率。\n采样随机森林回归（RFR）方法构建水质参数模型。随机森林是一种基本单元为决策树的集成学习方法，在训练过程中构建大量相互独立的决策树形成“随机森林”，最后综合这些决策树结果提高模型精度（例如输出平均值）。RFR算法的“随机性”主要体现在两个方面：构建每颗决策树时通过Bagging方法（即自助采样法，每次采样后将样本放回）从原始训练数据集中随机抽样生成训练数据子集；在节点分裂时不使用所有的特征变量参与比较，而是从特征变量中随机选择一个子集参与节点分裂。两个“随机性”使得RFR算法不容易过拟合，并且对异常值和噪声具有很好的容忍度。\nRFR算法在训练过程中最重要的几个超参数是：（1）决策树的数量（n_estimators）。n_estimators越大，模型效果通常越好，但计算时间也越长；在达到一定数据量，模型趋于稳定。（2）节点分裂时的最大特征数量（max_features），决策树在节点分裂时从随机选择的max_features个特征中寻找最佳分裂特征。（3）决策树的最大深度（max_depth），如果不设置（即None），则决策树会最大限度的生长直到满足分割终止条件。RFR通过Python scikit-learn软件包实现。\n通过调整输入算法的最佳输入变量，各算法最优超参数通过格网化搜索方法获得。基于RFR算法精度较高：不确定性为（ϵ）为21.92%，偏差（β）为4.29%，斜率为0.64，均方根对数误差为0.235。\n</p>",
    "ds_quality": "<p>采样随机森林回归（RFR）方法构建水质参数模型。随机森林是一种基本单元为决策树的集成学习方法，在训练过程中构建大量相互独立的决策树形成“随机森林”，最后综合这些决策树结果提高模型精度（例如输出平均值）。通过调整输入确定各水质参数算法的最佳输入变量，各算法最优超参数通过格网化搜索方法获得。利用大量野外调查和星地同步数据进行模型研究，结果表明RFR悬浮物浓度算法精度较高，不确定性为（ϵ）为21.92%，偏差（β）为4.29%，斜率为0.64，均方根对数误差为0.235。</p>",
    "ds_acq_start_time": null,
    "ds_acq_end_time": null,
    "ds_acq_place": "",
    "ds_acq_lon_east": 96.44417,
    "ds_acq_lat_south": 34.2925,
    "ds_acq_lon_west": 73.299446,
    "ds_acq_lat_north": 50.203056,
    "ds_acq_alt_low": null,
    "ds_acq_alt_high": null,
    "ds_share_type": "在线下载",
    "ds_total_size": 1853293155,
    "ds_files_count": 20,
    "ds_format": "TIF格式",
    "ds_space_res": "10米",
    "ds_time_res": "月",
    "ds_coordinate": "CGCS2000",
    "ds_projection": "Albers投影",
    "ds_thumbnail": "a711d881-7b52-40ac-b671-864178fb99f8.png",
    "ds_thumb_from": 0,
    "ds_ref_way": "",
    "paper_ref_way": "",
    "ds_ref_instruction": "数据来源引用：新疆10m水体悬浮物数据集（2024年4-10月）来源于第三次新疆综合科学考察专项 \"空天地网一体化综合科考监测体系建设(2021xjkk1400)\"",
    "ds_from_station": null,
    "organization_id": "a5877b42-96ea-4f13-af7e-246f355413d6",
    "doi_value": "",
    "subject_codes": [
        "170.45"
    ],
    "quality_level": 1,
    "publish_time": "2025-12-04 19:11:26",
    "first_publish_time": null,
    "last_updated": "2025-12-04 19:11:26",
    "protected": false,
    "protected_to": null,
    "lang": "zh",
    "cstr": "33110.11.ariddc.01343",
    "license": null,
    "extra": null,
    "files_shape": [
        {
            "name": "2021xjkk1400-134-2024120801",
            "size": null,
            "is_dir": true
        }
    ],
    "features": null,
    "data_level": 0,
    "ds_topic_tags": [
        "水体悬浮物浓度"
    ],
    "ds_subject_tags": [
        "地理学"
    ],
    "ds_class_tags": [],
    "ds_locus_tags": [
        "新疆"
    ],
    "ds_time_tags": [
        2024
    ],
    "ds_contributors": [
        "刘铁",
        "段洪涛"
    ],
    "ds_meta_authors": [
        "段洪涛"
    ],
    "ds_managers": [
        "李锦"
    ],
    "category": "哨兵"
}