内心希望是个 deep dive(虽然也不够资格),但是实际可能是个入门的简单介绍。

什么是 Flink - Overview

Stateful Computations over Data Streams

"Apache Flink is a framework and distributed processing engine for stateful computations over unbounded and bounded data streams. Flink has been designed to run in all common cluster environments, perform computations at in-memory speed and at any scale." - 摘自 Flink 官网首页

数据流之上的有状态计算
“Apache Flink 是一个框架和分布式处理引擎,用于在无界和有界数据流上进行有状态计算。Flink 设计用于在所有常见的集群环境中运行,以内存速度和任何规模执行计算。” - 翻译 DeepL 完成

架构 - 高阶视角

基于 Flink snapshot version,非 stable version。

Flink Cluster - high level architecture

Flink 集群剖析

Flink 程序剖析

关键概念

Event Time 与 Processing Time

Notions of Time: Event Time and Processing Time

Event Time 与 Watermarks

Event Time and Watermarks

Parallelism

深入话题

任务和调度

Job/Task

计算

一些坑(也就是实现要注意的地方)

参考

标签: none

评论已关闭