全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+

当前位置:首页 > 长沙

写数据流程

1. 客户端发出请求hdfs dfs -put /etc/profile /qf/data。2. namenode查看维护的目录结构,检查/qf/data是否存在,如不存在直接报错”no such file or directory“,如存在返回给客户端同意上传文件请求,将操作写入日志文件

2022-09-02

Spark Streaming的窗口大小,每个窗口处理的数据量大小。

该问题一定要根据业务需求来确定,比如要实现的需求为:统计每分钟的前一个小时的在线人数。上面需求的窗口大小(窗口长度)为1小时,然后再统计每个窗口需要处理的数据量。

2022-09-02

SparkStreaming的批次间隔,处理完的的数据存在哪里

批次间隔为SparkStreaming处理实时需求的时间间隔,需要根据业务需求来确定批次间隔。实时需求的处理结果一般是保存在能快速读取的数据库中来提高效率,比如Redis、MongoDB、HBase。

2022-09-02

MapReduce的原理(重点)

MapperTask 使用逻辑切片的方式划分block,调用InputFormat中的算法进行划分,TextInputFormat默认按照128M进行划分(默认一个block至少有一片),每个分片以行首开头,以行尾结尾。

2022-09-02

多线程的用处

这样可以为不同的任务步骤建立线程。网络程序设计为提高网络的利用效率,我们可能使用多线程,对每个连接用一个线程去处理。数据共享 同一个进程中的不同线程共享进程的数据空间,方便不同线程间的数据共享。

2022-09-01

热问标签

热门频道

在线咨询 免费试学 教程领取