PySpark DataFrame选择某几行

1、collect():

print(dataframe.collect()[index])

2、dataframe.first()

3、dataframe.head(num_rows)、dataframe.tail(num_rows),head、tail配合使用可以取得中间指定位置的行

4、dataframe.select([columns]).collect()[index]

5、dataframe.take(num_rows),同head()方法

转自:https://www.geeksforgeeks.org/get-specific-row-from-pyspark-dataframe/

原文地址:https://www.cnblogs.com/aaronhoo/p/15476496.html