大数据部分--知识点
大数据中的一些名词总结
1. 算子
将输入转换为输出的”函数“,这个“函数”可以将上游的数据经过计算后,发送给下游,类似于 X ==> Y
- https://www.cnblogs.com/guorongtao/p/14131493.html
- https://blog.csdn.net/qq_40695642/article/details/101173604
2. 幂等性
重复的操作,只会产生一种结果,或者多条相同的数据,插入后只会生成一条数据
3. hudi 数据合并常见的两种方式
COW: copy on write 写时复制 读写分离
MOR: merge on read 读时合并
hive 的 sql 语法
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!