1. Flink内部仅实现exactly once问题所在:

如上图,当sink A已经往Kafka写入了数据,而sink B fail.

根据Flink的exactly once保证,系统会回滚到最近的checkpoint,

但是sink A已经把数据写入到kafka了.

Flink无法回滚kafka的state.因此,kafka将在之后再次接收到一份同样的来自sink A的数据,

这样的message delivery便成为了at least once

2. 解决方案-Two phase commit

Flink采用Two phase commit来解决这个问题.

Phase 1: Pre-commit
1. Flink的JobManager向source注入checkpoint barrier以开启这次snapshot.
2. barrier从source流向sink.
3. 每个进行snapshot的算子成功snapshot后,都会向JobManager发送ACK.
4. 当sink完成snapshot后, 向JobManager发送ACK的同时向kafka进行pre-commit.
Phase 2: Commit
1. 当JobManager接收到所有算子的ACK后,就会通知所有的算子这次checkpoint已经完成.
2. Sink接收到这个通知后, 就向kafka进行commit,正式把数据写入到kafka

不同阶段Fail over的recovery举措:

抽象类TwoPhaseCommitSinkFunction

TwoPhaseCommitSinkFunction有4个方法: