网站Logo Data·Stack
首页
门类
默认分类大数据JAVAPYTHON晋级之路-数据结构·算法千变工作-BILangChain大模型埃利斯-踏足社会
咻咻
抖音热榜
舔狗弹幕
关于
登录
数据ETL-Apache Flume详解

数据ETL-Apache Flume详解

官方网站:http://flume.apache.org/ 用户文档:http://flume.apache.org/FlumeUserGuide.html 开发文档:

2025-03-16
145
0
ETL
数据ETL-Apache Flume详解

Kafka副本同步策略(ISR)

2024-01-18
390
0
Kafka
Kafka副本同步策略(ISR)
Kafka副本同步策略(ISR)
Hadoop和Spark的联系

Hadoop和Spark的联系

2023-12-29
116
0
Spark
Scala
Hadoop和Spark的联系

Flink中的多事件Join

流式计算中的 2 个问题: 流式数据到达计算引擎的时间不一定:比如 A 流的数据先到了,A 流不知道 B 流对应同 key 的数据什么时候到,没法关联(数据质量问题) 流式数据不知何时、下发怎样的数据: A 流的数据到达后,如果 B 流的数据永远不到,那么 A 流的数据在什么时候以及是否要填充一个

2023-12-28
217
0
Flink
Flink中的多事件Join
Flink中的多事件Join
Hive-数据模型

Hive-数据模型

2023-10-11
190
0
Hive
Hive-数据模型

hive基础-知识必备

2023-10-11
201
0
Hive
数据仓库
hive基础-知识必备
hive基础-知识必备
Spark基础-基础必备

Spark基础-基础必备

1、Spark宽窄依赖 窄依赖(Narrow Dependency): 指父RDD的每个分区只被子RDD的一个分区所使用。例如map、filter等这些算子的一个RDD,对它的父RDD只有简单的一对一的关系,RDD的每个partition仅仅依赖于父RDD 中的一个partition,父RDD和子R

2023-10-09
125
0
Spark
Spark基础-基础必备

Hadoop基础-知识必备

2023-10-06
145
0
Hadoop
Hadoop基础-知识必备
Hadoop基础-知识必备
数据仓库体系内容梳理

数据仓库体系内容梳理

2023-10-04
481
0
数据仓库
Hive
数据仓库体系内容梳理