Kafka 每天凌晨会出现生产者发送消息失败的情况, 重启后又能正常使用
springboot版本是2.0.1,
kafka-clients版本是1.0.1,
kafka server的版本是0.11
生产者配置只有 enable.idempotence: true 为特殊配置, 为了确保消息不会出现重复发送, 其余均为默认.
目前的情况是服务在每天凌晨的时候有一个topic会出现生产者阻塞的情况, 具体异常为:
Failed to send; nested exception is org.apache.kafka.common.errors.TimeoutException:
Expiring 2 record(s) for myTopic-3: 59349 ms has passed since last append
并且其他所有生产者都发送不了, 其他生产者也会出现异常:
org.apache.kafka.common.errors.TimeoutException: Failed to update metadata after 60000 ms.
但是只有这一个服务会出现这种情况, 其他20多个涉及kafka的服务均能正常消费和生产, 这个服务重启以后也能正常工作, 但是一到凌晨5-6点左右又会出现上述情况又需要重启.
目前查看了服务器网络, 内存, I/O,CPU等, 凌晨的消耗是很小的, 数据量也不大;
这个topic一天大概会有150w左右的数据量, 基本都在白天, 晚上大概会有不到10w的数据量.
现在就是搞不明白为何凌晨会出现这个问题.