大数据面试题：经典面试题答疑集合-千锋教育

校区

首页课程师资教程资讯关于

校区精品课程

互联网前瞻热门课程从入门到成神

鸿蒙生态开发 HTML5培训 Java培训 Python培训云计算培训软件测试培训网络安全培训大数据培训物联网培训 Unity培训全媒体营销培训影视剪辑培训游戏原画培训区块链培训商业插画培训产品经理培训

全国旗舰校区

不同学习城市同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口 +

培训课程
师资团队
关于千锋

培训机构
面试题
就业前景

零基础学IT

当前位置：首页 > 技术干货

大数据面试题：经典面试题答疑集合

发布时间:2022-06-29 16:34:48

发布人:syq

　　1.kafka高吞吐量

　　答案：

　　1)消息顺序写到磁盘

　　2)分区

　　3)零拷贝：跳过“用户缓冲区”的拷贝，消费者直接通过offset位置，批量拉取消息

　　4)生产者，通过缓存批量发送消息

　　2.kafka优缺点

　　答案：

　　1)只能支持统一分区内消息有序，无法实现全局消息有序

　　2)会丢失数据和重复消费数据

　　3.kafka分区数过多引发的弊端

　　答案：

　　1)分区数过多，客户端内存会有小幅度增加;当分区数远大于消费端，线程频繁切换，影响性能;

　　2)文件句柄开销

　　3)broker主机down恢复问题，如果分区数过多，单一broker就会承载很多分区，在down过程涉及到的leader重选举和恢复过程中的在均衡时间消耗就比较长。

　　4.flink的开发中用了哪些算子？

　　答案：

wpsySvVbn

　　max/min 操作会根据用户指定的字段取最小值(而字段外的其他值并不能保证正确) 而maxBy/minBy 指的是自己本身的这条数据。

wpsWiyVWC

　　在reduce和aggregate中，都有一个可以把增量函数和全量函数结合使用的方法，就是上面图中标红色五角星的。

　　对于一个窗口来说，Flink先增量计算，窗口关闭前，将增量计算结果发送给ProcessWindowFunction作为输入再进行处理。

　　reduce和aggregate区别：aggregate是增强版的reduce，都是增量函数，都有中间结果产生，但是aggregate处理方法更全。

wpsugBEw8

　　更多关于大数据培训的问题，欢迎咨询千锋教育在线名师。千锋教育拥有多年IT培训服务经验，采用全程面授高品质、高体验培养模式，拥有国内一体化教学管理及学员服务，助力更多学员实现高薪梦想。

上一篇Linux云计算可以学会吗?

下一篇云计算面试题01

相关文章

互联网公司的敏捷开发流程是怎么样?

互联网公司的敏捷开发流程是怎么样?

max和maya有什么区别?

max和maya有什么区别?

IT系统为什么需要可观测性?

IT系统为什么需要可观测性?

C语言中的初始化是什么意思?

C语言中的初始化是什么意思?

最新文章

常见网络安全面试题:Windows常用的命令有哪些？

常见网络安全面试题:Windows常用的命令有哪些？

常见网络安全面试题:根据设备告警如何展开排查？

常见网络安全面试题:根据设备告警如何展开排查？

常见网络安全面试题:mysql加固呢？（数据库加固）

常见网络安全面试题:mysql加固呢？（数据库加固）

常见网络安全面试题:windows和linux加固？（操作系统加固）

常见网络安全面试题:windows和linux加固？（操作系统加固）

热门频道

IT培训机构

培训费用、培训周期你关心的都有

就业前景

学会能干什么，IT培训就业前景介绍

零基础学习

零基础学习IT，大神也是零基础起步

面试题

常见经典面试题及答案解析

千锋问问

搜集常见技术关键点，高效答疑

网站地图

明晰网站布局，快速定位学习内容

在线咨询免费试学教程领取