大数据部分--知识点

大数据中的一些名词总结

1. 算子

将输入转换为输出的”函数“,这个“函数”可以将上游的数据经过计算后,发送给下游,类似于 X ==> Y

2. 幂等性

重复的操作,只会产生一种结果,或者多条相同的数据,插入后只会生成一条数据

3. hudi 数据合并常见的两种方式
  • COW: copy on write 写时复制 读写分离

  • MOR: merge on read 读时合并

hive 的 sql 语法
  1. 列的操作:https://blog.csdn.net/helloxiaozhe/article/details/80749094

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!