大数据数据湖架构Hudi涵盖HDFS+Spark+Flink+Hive等

9123

为了更好管理数据,出现数据湖DataLake:用来存储大量的原始数据。


当下最流行数据湖框架Apache Hudi,使用HDFS存储数据,集成Spark、Flink、Hive等分析数据,逐步在大中型公司中使用,构建湖仓一体化架构。


为了让大家更好学习使用Hudi,基于0.9.0版本,推出本套课程,从数据湖概念,到集成Spark和Flink,最后整合实际需求案例,由0到1深入浅出剖析Hudi使用。

声音122评价0