大数据开发面试题分享，千锋培训老师教你搞定面试官

当前位置：首页 > 关于学院 > 行业动态 > 正文

大数据开发面试题分享，千锋培训老师教你搞定面试官

时间：2018-02-01 13:24:37 　来源：千锋教育　作者：千锋

　　面试——走进企业的主要途径，无论是知名企业还是一般的小企业，都是要经过面试官层层把控的，尤其是对于大数据技术人才的招聘，更是要好几轮，要面对不同级别的面试官。

　　想要从众多的应聘者中脱颖而出还是有一定的难度的。那话又说回来，怎么才能赢得面试官的青睐?怎么样才能拿下心仪的工作?不怕，千锋大数据培训班的老师来帮忙，千锋独家秘制的大数据开发面试题免费分享，让你笑傲江湖。

<a href=http://www.mobiletrain.org/big_data/ target=_blank class=infotextkey>千锋大数据</a>面试官.jpg

　　1.hadoop运行原理

　　包括HDFS和Mapreduce两部分。

　　1)HDFS自动保存多个副本，移动计算。缺点是小文件存取占用namenode内存，写入只支持追加，不能随机修改。

　　它存储的逻辑空间称为block，文件的权限类似linux。整体架构分三种节点，NN,SNN,DN

　　NN 负责读写操作保存metadata(Ownership Permission blockinfo)

　　SNN 负责辅助NN合并fsimage和edits，减少nn启动时间

　　DN 负责存数据，每个数据(文件)分割成若干block，每个block默认3个副本。启动后像NN发送心跳保持联系

　　NN保存的metadata在hdfs启动后加载到计算机内存，除block位置信息的metadata保存在OS文件系统中的fsimage文件中，对metadata的操作日志保存在OS文件系统中的edits文件中。block位置信息是hdfs启动后由DN上报NN再加载到内存的。

　　HDFS的安全模式：直到NN完全加载完metadata之前的这段时间。期间不能写入文件，DN检查各个block完整性，并修复。

　　2)MapReduce

　　离线计算框架，过程分为split map shuffle reduce四个过程

　　架构节点有：Jobtracker TaskTracker

　　Split将文件分割，传输到mapper，mapper接收KV形式的数据，经过处理，再传到shuffle过程。

　　Shuffle先进行HashPartition或者自定义的partition，会有数据倾斜和reduce的负载均衡问题;再进行排序，默认按字典排序;为减少mapper输出数据，再根据key进行合并，相同key的数据value会被合并;末后分组形成(key,value{})形式的数据，输出到下一阶段

　　Reduce输入的数据就变成了，key+迭代器形式的数据，再进行处理

　　2.MapReduce原理

　　逻辑上：

　　1、split

　　2、map

　　3、shuffle

　　4、reduce

　　四个过程

　　物理上：

　　JobTracker节点：JobTracker创建每一个Task(即MapTask和ReduceTask)

　　并将它们分发到各个TaskTracker服务中去执行。负责调度Job的每一个子任务task运行于TaskTracker上。

　　TaskTracker节点：运行在多个节点上的slaver服务。TaskTracker主动与JobTracker通信，接收作业，并负责直接执行每一个任务。TaskTracker都需要运行在HDFS的DataNode上

　　3.hdfs存储机制

　　1) client端发送写文件请求，namenode检查文件是否存在，如果已存在，直接返回错误信息，否则，发送给client一些可用namenode节点

　　2) client将文件分块，并行存储到不同节点上datanode上，发送完成后，client同时发送信息给namenode和datanode

　　3) namenode收到的client信息后，发送确信信息给datanode

　　4) datanode同时收到namenode和datanode的确认信息后，提交写操作。

　　4.用mr设计一个分组排重计数算法

　　输入文件格式:二级域名,一级频道,二级频道,访问ip地址,访问者id

　　需求:按照二级域名,一级频道,二级频道分组,计算pageview数,计算独立ip数和独立访问者id数。

　　大数据产业已进入发展的“快车道”，急需大量优秀的大数据人才作为后盾。能够在大数据行业崛起的初期进入到这个行业当中来，才有机会成为时代的弄潮儿。技术在手，天下任我走;面试题我有，打遍天下无敌手!千锋大数据开发面试题免费分享，快去寻找自己心仪的工作吧!

大数据开发工程师这些技能你需要掌握

大数据开发培训机构哪里好?高端课程实力打造

大数据开发培训就业前景好吗

十种大数据开发学习中常用的分析工具介绍

上一篇：云计算培训哪家好?想要月薪过万就报名千锋培训班
下一篇：VR工程师培训班选哪家，高质量授课让你高薪就业

学员感言MORE >>

千锋HTML5培训让我达到理想高度

常见问题MORE >>

·选择千锋JavaEE培训的理由?·怎样知道自己是不是适合学Java？·千锋PHP和java的联系与区别是什么？·来千锋学习java后能够做网站后台吗 ·来千锋学完PHP可以做什么？·为什么选择千锋的全栈python培训？

北京深圳上海郑州广州大连武汉成都西安杭州青岛重庆长沙哈尔滨南京

北京天丰利校区（总部）地址：北京市海淀区宝盛北里西区28号天丰利商城4层
北京沙河校区：北京市昌平区沙阳路18号北京科技职业技术学院广场服务楼2、3层
咨询电话：400-811-9990
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训、好程序员
深圳西部硅谷校区地址：深圳市宝安区宝安大道5010号深圳西部硅谷B座A区605-619
深圳大学城校区地址：深圳市南山区留仙大道1201号大学城创客小镇16栋3楼
咨询电话： 0755-23015275/23015546-801（硅谷） 0755-86660670-801（大学城）
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训、好程序员
上海校区地址：上海市宝山区同济支路199号智慧七立方3号楼2-4层
咨询电话：400-811-9990 021-65233829-609
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训、好程序员
郑州校区地址：郑州市二七区航海中路60号海为科技园C区10层、12层
咨询电话：0371-55191750
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
广州校区地址：广州市天河区元岗路310号智汇park创意园E座5层
咨询电话：020-22119207
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
大连校区地址：辽宁省大连市高新园区爱贤街10号大连设计城A座901
咨询电话：400-811-9990
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
武汉金融港校区地址：武汉市东湖高新技术开发区光谷大道77号金融港B18栋3楼
武汉智慧园校区地址：武汉市东湖高新技术开发区光谷大道61号智慧园21栋2楼
咨询电话：027-59313371
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
成都校区地址：成都市武侯区科华北路62号力宝大厦N（北楼）18楼
咨询电话：400-811-9990 028-83178771
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
西安校区地址：西安市雁塔区高新六路52号立人科技C座西区4楼
咨询电话：029-85363390
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
杭州校区地址：浙江省杭州市江干区九堡旺田书画城A座4层
咨询电话：400-811-9990 0571-86893632
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
青岛校区地址：青岛市市北区龙城路卓越世纪中心3号楼8层801
咨询电话：0532-80911190
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
重庆校区地址：重庆市高新区科园一路2号大西洋国际12-1
咨询电话：400-811-9990 023-68883009
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
长沙校区地址：湖南省长沙市岳麓区麓谷企业广场A2栋三单元306号
咨询电话：0731-85513210
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
哈尔滨校区地址：哈尔滨市松北区创新一路699号科技创新城19号楼B座五楼
咨询电话：400-811-9990/0451-87173191
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训
南京校区地址：南京市建邺区应天大街780号应天智汇产业园弘辉园1幢2楼
咨询电话：400-811-9990
面授课程：HTML5大前端培训、全链路UI/UE设计培训、PHP全栈+服务器集群培训、JavaEE+分布式开发培训、大数据+人工智能培训、 Unity游戏开发培训、Python培训、云计算+信息安全培训、全栈软件测试培训、智能物联网+嵌入式培训

了解千锋动态
关注千锋教育服务号
扫一扫快速进入
千锋移动端页面
扫码匿名提建议
直达CEO信箱