全国旗舰校区

不同学习城市 同样授课品质

北京

深圳

上海

广州

郑州

大连

武汉

成都

西安

杭州

青岛

重庆

长沙

哈尔滨

南京

太原

沈阳

合肥

贵阳

济南

下一个校区
就在你家门口
+

当前位置:首页 > 沈阳

Flink维表Join方式?

热存储关联:利用Flink的RichAsyncFunction读取外部存储的数据到缓存中,我们在关联维度表时先去查询缓存,如果缓存中不存在这条数据,就利用客户端去查询外部存储,然后插入到缓存中, 可以使用 Guava 库提供的 CacheBuilder 来创建缓存。

2022-09-02

Flink实时去重方案(UV计算)怎么做?

业务计算中,我们经常会遇到使用Flink实时计算UV的问题,比如计算一天的实时UV,或者每个小时的UV。应为UV是需要去重的,再大数据量的情况下,如何使用Flink进行高效的UV统计呢#比如计算一天实时UV

2022-09-02

Flink Spark on Yarn分布式日志收集问题

对于Flink,Spark在Yarn上提交的LongTime Job(比如一个批处理作业要运行几个小时或者本身就是实时作业),其作业的运行日志我们不能等到作业结束后,通过Yarn日志聚合后查看,我们希望作业提交后就能够马上看到运行日志( 这里注意,你的作业被调度到集群的各个计算节点中,比如你的集群有100个节点,你的作业可能被调度到几十个个节点中),如何能够实时方面的查看所有节点产生的日志呢?

2022-09-02

高可用的集群中namenode宕机了,怎么恢复?

高可用的集群中namenode宕机了,怎么恢复的?数据如何转移?首先进入安全模式: hdfs dfsadmin -safemode enter然后刷一下active节点的log到image hdfs dfsadmin -saveNamespace然后将active节点的image文件全部拷贝到故障节点的相应目录下

2022-09-02

数据存储在hdfs格式,使用的什么压缩方式?压缩比多少

目前在Hadoop中用得比较多的有lzo,gzip,snappy,bzip2这4种压缩格式,笔者根据实践经验介绍一下这4种压缩格式的优缺点和应用场景,以便大家在实践中根据实际情况选择不同的压缩格式。

2022-09-02

热问标签

热门频道

在线咨询 免费试学 教程领取