SaniDepanshu ; MahatoSandeep ; SainiSourabh ; AgarwalHarsh Kumar ; DevshaliCharu Chandra ; AnandSaket ; AroraGaurav ; JayaramanThiagarajan

摘要
高质量的数据集对于机器学习(ML)模型的成功至关重要。尽管在农业领域中地球观测数据的获取变得更加容易,但经过整理和标注的数据集仍然稀缺,这限制了其在农业遥感(RS)中训练机器学习模型的潜力。为此,我们推出了一种名为SICKLE的开创性数据集,该数据集包含来自三颗不同卫星(Landsat-8、Sentinel-1 和 Sentinel-2)的多分辨率时间序列影像。我们的数据集涵盖了2018年1月至2021年3月期间的多光谱、热红外和微波传感器数据。我们根据印度泰米尔纳德邦卡维里三角洲地区主要从事水稻种植的农民所遵循的耕作实践构建每个时间序列,并对相应影像进行多分辨率(即3米、10米和30米)的关键作物参数标注。该数据集包括来自388个独特地块的2,370个季节性样本,平均地块面积为0.38英亩,用于分类三角洲内四个区县的21种作物类型,总计约209,000张卫星图像。在这2,370个样本中,有351个水稻样本来自145个地块,这些样本被标注了多个作物参数,如水稻品种、生长季节以及每英亩产量等生产力指标。我们的研究也是首批将与作物物候学相关的生长季节活动(包括播种、移栽和收获日期)作为感兴趣参数的研究之一。我们在三个任务上对SICKLE进行了基准测试:作物类型识别、作物物候学(播种、移栽、收获)预测以及产量预测。
代码仓库
Depanshu-Sani/SICKLE
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| crop-yield-prediction-on-sickle | U-TAE | MAPE (%): 49.63 |