1.20学习总结:DataFrame保存及常用操作

一、学习视频

https://www.bilibili.com/video/BV1oE411s7h7?p=46

二、保存方式

df.write.txt("文件目录")   保存为txt文件

df.write.json()  保存为json文件

df.write.parquet()  保存为parquet文件

df.write.formate("txt").save("文件目录")

三、常用操作

3.1   df.printSchema()   打印df的模式信息

3.2   df.select(df["列名"]).show   选取列值并展示

3.3   df.filter(过滤条件)     将符合条件的信息过滤出来

3.4   df.groupBy("列名").count().show   分组后统计该列的数据并展示

3.5   df.sort(df["列名"].desc()).show()     按照列名的降序进行排序,升序是asc()

原文地址:https://www.cnblogs.com/wangzhaojun1670/p/14368389.html