博主履历
个人简历 个人信息 姓名:尹开英 性别:男 出生:1991.5 学历:统招本科
一、BI的演变 在探讨这个问题前,我们想一想,在计算机普及前后、互联网产品丰富化前后,不管是个体还是企业,都在急剧的在向数字化发展,对于运营的业务,更想能够更精细和更美观的在web上整体展现出来。 早期的BI算是人为更新,也就是记录在册的纸质统计,计算机时代,数据开始电子化,可利用表格或其他工具进行
Kafka对于Producer生产的消息怎么保证可靠性?简单说就是每个Partation都分配给副本,做数据同步,保证数据不丢失。 副本同步策略(ISR): kafka不是完全同步,也不是完全异步,是一种ISR机制,先来了解下完全同步的优势劣势 完全同步的优点:同样为了容忍N台节点的故障,
一、Hadoop 到 Spark 的变化 Spark 运算比 Hadoop 的 MapReduce 框架快的原因是因为 Hadoop 在一次 MapReduce 运算之后,会将数据的运算结果从内存写入到磁盘中,第二次 Mapredue 运算时在从磁盘中读取数据,所以其瓶颈在2次运算间的多余 IO 消
流式计算中的 2 个问题: 流式数据到达计算引擎的时间不一定:比如 A 流的数据先到了,A 流不知道 B 流对应同 key 的数据什么时候到,没法关联(数据质量问题) 流式数据不知何时、下发怎样的数据: A 流的数据到达后,如果 B 流的数据永远不到,那么 A 流的数据在什么时候以及是否要填充一个
需求:编写一个函数来查找字符串数组中的最长公共前缀。如果不存在公共前缀,返回空字符串。 示例 1: 输入: ["flower","flow","flight"] 输出: "fl" 示例 2: 输入: ["dog","racecar","car"] 输出: "" 一、实现思路 获取第一个index的字
需求:现在输入一个链表,1->2->3->4,对其相邻两个节点进行交换后得到新链表:2->1->4->3,请给出具体的实现。 一、实现思路 创建一个辅助的头节点,这样可以统一处理头节点和其他节点的交换逻辑。 使用两个指针,一个指向当前要交换的两个节点的前一个节点(prev),另一个指向当前要交换的第
1.[Hive]统计用户月访问量 统计每个用户 [月总访问次数],和 [从1月累计到当前月的总访问次数] uid,date,vcnt u01,2023-01-01,5 u02,2023-01-02,6 u02,2023-01-03,7 u02,2023-02-04,8 u03,2023-0
树的遍历是树的一种重要的运算。所谓遍历是指对树中所有结点的信息的访问,即依次对树中每个结点访问一次且仅访问一次,我们把这种对所有节点的访问称为遍历(traversal)。那么树的两种重要的遍历模式是深度优先遍历和广度优先遍历,深度优先一般用递归,广度优先一般用队列。一般情况下能用递归实现的算法大部分