2020寒假学习笔记08

  几天无奈之下只能暂时放弃第五个实验的第2题,开始做第三题,经过踉踉跄跄以后,对源程序进行打包时出错。

  第三题实验内容:  

3. 编程实现利用 DataFrame 读写 MySQL 的数据
(1)在 MySQL 数据库中新建数据库 sparktest,再创建表 employee,包含下面两行数据。
(2)配置 Spark 通过 JDBC 连接数据库 MySQL,编程实现利用 DataFrame 插入如表 6-3 所
示的两行数据到 MySQL 中,最后打印出 age 的最大值和 age 的总和。
 
源代码:
(1)启动并登陆Mysql后执行如下命令:
1 create database sparktest;
2 use sparktest;
3 create table employee(id int(4),name char(20),gender char(4),age int(4));
4 insert into employee values(1,'Alice','F',22);
5 insert into employee values(2,'John','M',25);
View Code

(2)

 1 import java.util.Properties
 2 import org.apache.spark.sql.types._
 3 import org.apache.spark.sql.Row
 4 object TestMySQL
 5 {
 6     def main(args:Array[String])
 7     {
 8         val employeeRDD=spark.sparkContext.parallelize(Array("3 Mary F 26","4 Tom M 23")).map(_.split(" "))
 9         val schema=StructType(List(StructField("id",IntegerType,true),StructField("name",StringType,true),StructField("gender",StringType,true),StructField("age",IntegerType,true)))
10         val rowRDD=employeeRDD.map(p=>Row(p(0).toInt,p(1).trim,p(2).trim,p(3).toInt))
11         val employeeDF=spark.createDataFrame(rowRDD,schema)
12         val prop=new Properties()
13         prop.put("user","root")
14         prop.put("password","yr123456")
15         prop.put("driver","com.mysql.jdbc.Driver")
16         employeeDF.write.mode("append").jdbc("jdbc:mysql://localhost:3306/sparktest","sparktest.employee",prop)
17         val jdbcDF=spark.read.format("jdbc").option("driver","com.mysql.jdbc.Driver").option("dbtable","employee").option("user","root").option("password","yr123456").load()
18         jdbcDF.agg("age"->"max","age"->"sum")
19     }
20 }
View Code

目前第二问仍然出错并且目前还没有办法解决,错误如下:

 
原文地址:https://www.cnblogs.com/qianmo123/p/12255689.html