通过geopandas.sjoin()函数按多边形范围分割点

最近有一批点和多变型的数据,需要将点按照多边形的区域进行分割。

经过若干尝试,终于通过geopandas的sjoin函数得以实现。

这里首先感谢博主“张da统帅”的分享,使得本人获得该实现方法的灵感,原帖见:https://beiyuan.me/geospatial-analysis-with-python-4/

以下是实现步骤及代码:

1. 如果点文件为带有坐标的文本文件,则先将其写入GeoDataFrame类对象,若为shpfile文件,则直接用geopandas进行读取。

# 载入geopandas库
import geopandas as gpd
# 用geopandas读取点shpfile文件
point = gpd.read_file(point_path)

2. 用geopandas读取多边形shp文件

# 读取多边形shpfile文件
polygon = gpd.read_file(polygon_path)

3. 通过sjoin()函数获取点与多边形相交的系列,组成新的GeoDataFrame类对象

new_gdf = gpd.sjoin(point, polygon, op='intersects')

这里new_gdf包含了所有point和polygon相交元素的信息。

new_gpd的geometry列值为点的坐标,两个对象的其他列都合并在了new_gdf中(可以通过how关键字参数选择只包含point/polygon的列值,具体见:http://geopandas.org/reference/geopandas.sjoin.html

op关键字参数有 {‘intersects’, ‘contains’, ‘within’}三种可选,由于geopandas给出的文本链接不可用(可能是因为某种神秘力量吧),所以三种参数对应方法暂不明了。

4. 按照polygon的范围对point进行分割

# new——gdf中的每一行代表一个点,每个点中都包含了其所在多边形的所有列(geometry列除外)
# 由于index属性是每个DataFrame对象都有的,因此利用index值判断点属于哪个多边形
# polygon的index值在new_gdf中默认为index_rigth, 具体见:http://geopandas.org/reference/geopandas.sjoin.html

# 获取每个点对应的polygon的index值
indexs = new_gdf.index_right.values
# 去掉s中重复的index值(由于有多个点在一个多边形中的情况)
s = list(set(indexs))
# 从new_gdf中拣出在index值对应多边形中的点,存入point_split列表(也可用point_split.to_file()方法直接写入shpfile文件)
point_split = []
for index in indexs:
  point_split.append(new_gdf.loc[gdf['index_right'] == index, ['想要保存的列名0', ‘想要保存的列名1’, ...]]

5. 完成~

原文地址:https://www.cnblogs.com/keeptg/p/10637880.html