目录 scala 1、win7 scala安装及idea中scala配置 2、基础 2.1 百钱百鸡和for99 3、数组和集合 4、map 和 tuple 5、构造 6、trait特质、包别名、文件、private[this] 7、中置、一元、赋值、结合、apply和update、unapply提取器 8、高阶函数 9-1 Array 9-2 String 10-1 集合之Map 10-2 集合之List 10-3 集合之Set 10-4 集合之应用 11-1 模式匹配 spark 1.1 安装及配置 1.2 集群管理 1.3 集群资源管理 2、最高气温和wordcount 命令行下 3.1、spark集群运行应用 3.2、spark集群运行应用之第三方jar的处理方式 4.1 核心组件之RDD 4、2 核心组件 4.3 调度核心组件 4.3 高效的算子、分区算子 5、1 部署 5.2 nc + JMX查看分布式程序数据 6、task,线程和executor间的关系 7. spark使用中的优化 sparksql 1、spark-sql配置 2.1、spark shell中使用hive 2.2、idea 中写spark sql 推荐系统 1、前奏之评测指标 2、前奏之基于用户的协同过滤算法:UserCF 3、前奏之基于物品的协同过滤算法:ItemsCF 4、userCF和itemCF对比,冷启动