Flink wordCount

import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import org.apache.flink.streaming.api.scala._

object WordCount {
def main(args: Array[String]): Unit = {
//设置环境
val env: StreamExecutionEnvironment = StreamExecutionEnvironment.createLocalEnvironment()
//设置数据源
val context: DataStream[String] = env.socketTextStream("node01", 9999)
//计算逻辑
val process: DataStream[(String, Int)] = context
.flatMap(_.split(" "))
.map((_, 1))
.keyBy(_._1)
.reduce((x, y) => {
val key: String = x._1
val value = x._2 + y._2
(key, value)
})
//输出结果
process.addSink(x => {
print(x)
})
//提交任务
env.execute("word count")
}
}
个人网站:shuoyizui.com 公众号:写个框架玩 近期在公众号会发布一系列文章,主要是想完成一个简化的MapReduce框架的编写。实现Mapreduce编程模型、任务远程提交、任务分配、任务执行等功能。设计到了动态代理、反射、网络通信、序列化、消息队列、netty、自定义类加载器、多线程、shell等技术点。
原文地址:https://www.cnblogs.com/maoxiangyi/p/10830273.html