我有一个大的CSV文件,格式如下:月、年、纬度、经度、降雨量
如何逐年对一段时间进行分类和汇总?另外,不同的问题是,我如何将数据分为不同流域的三个降雨量箱?
如果你能发布一个数据帧的例子会更好,但这样的东西可能会起作用:
# read into data frame
df = pd.read_csv('your_csv_path')
# groupby year and get sum
df.groupby('year')['rainfall'].sum().reset_index(name='rainfall_sum)
对于分组到盆地,我假设您需要首先绘制散点图,您可能需要一个聚类算法。看看sklearn中的各种算法:https://scikit-learn.org/stable/modules/clustering.html