sparkR操作HDFS上面的CSV文件

./bin/sparkR --packages com.databricks:spark-csv_2.10:1.3.0 --master yarn

hdfs://master:9000/tmp/demo.cvs 替换你的hdfs路径
>sc = sparkR.init(master = "yarn″, appName="SparkR")
>sqlContext = sparkRSQL.init(sc)
>demo = read.df(sqlContext,'hdfs://master:9000/tmp/demo.cvs',source ='com.databricks.spark.csv')
>head(demo)

【推广】免费学中医，健康全家人

原文地址：https://www.cnblogs.com/gaoxing/p/5230853.html

推荐文章
Netty中数据包的拆分粘包处理方案，以及对protobuf协议中的拆包粘包方案自定义重写
有用的.NET库
P/Invoke继续谈
有意思的案例：的问题
dnSpy
dnSpy调试IIS（w3wp进程）
Xilium.CefGlue与SingleProcess
rocketmq-client-cpp（2.0.1）编译指南
RocketMQ .NET客户端的那些坑
P/Invoke今日谈
.NET编译问题汇总
动态的世界
Cocos Creator—最佳构建部署实践
Cocos Creator—定制H5游戏首页loading界面
Cocos Creator—优化首页打开速度
Cocos Creator—如何给资源打MD5版本号
微信小程序新单位rpx与自适应布局
JedisException: Could not get a resource from the pool
MySQL导入的sql脚本文件过大解决方案
linux系统通过官方源安装mysql8
windows环境下安装mysql5.7.20
一次完成对多个子节点的全部父级节点查询
更新数据库中值为拼接字符串的字段
根据父节点编号查询子节点名称，孙节点个数
Java文件流下载并提示文件不存在
Nginx 反向代理Tomcat服务器获取真实IP问题
Tomcat启动堆栈异常
转一些思想代码大全的
一些方案
UML建模工具