Hudi DeltaStreamer使用总结
总结如何利用Hudi DeltaStreamer工具从外部数据源读取数据并写入新的Hudi表,是hudi-utilities-bundle的一部分,按照Apache Hudi 入门学习总结,将hudi-spark-bundle包拷贝至$SPARK_HOME/jars目录下即可。提供了从DFS或Kafka等不同来源进行摄取的方式,并具有以下功能。命令行选项更详细地描述了这些功能:最新版本应该支持了更多参数,可以查阅官网:https://hudi.apache.org/cn/docs/hoodie_delta