大数据面试题：hbase布隆过滤器

发布时间:2022-06-21 17:35:00

发布人:syq

　　不存在的一定不存在，存在的不一定存在；

　　1. 布隆过滤器的存储在哪？

　　对于hbase而言，当我们选择采用布隆过滤器之后，HBase会在生成StoreFile(HFile)时包含一份布隆过滤器结构的数据，称其为MetaBlock;MetaBlock与DataBlock(真实的KeyValue数据)一起由LRUBlockCache维护。

　　cell较小的不适用布隆过滤器;

　　按行读，更新数据量大，范围广(多列)，用row;

　　2. 协处理器

　　observe：通过钩子函数，做一些预处理和后处理;类似于 RDBMS 中的触发器，主要在服务端工作，主要有三种

　　regionObserve：处理数据修改数据;如：创建二级索引

　　maserObserve：管理DDL类型操作

　　WALObserve：提供针对WAL的钩子函数

　　endpoint：类似于 RDBMS 中的存储过程，主要在服务端工作，可以实现 min、max、avg、sum、distinct、group by 等功能

　　更多关于大数据培训的问题，欢迎咨询千锋教育在线名师。千锋教育拥有多年IT培训服务经验，采用全程面授高品质、高体验培养模式，拥有国内一体化教学管理及学员服务，助力更多学员实现高薪梦想。

上一篇大数据面试题：hbase基础

下一篇大数据面试题：kafka

大数据kafka常见面试题——如何搭建kafka？

2023-08-07

大数据kafka常见面试题——kafka中如何避免重复消费

2023-08-04

大数据面试题之多种方法创建dataframe

2023-08-02

大数据Hadoop面试题——Hadoop干什么用的？

2023-08-01

大数据行业2年工作经验的面试题有哪些？

2023-07-28

大数据kafka面试题——kafka和flume的区别是什么？

2023-07-27

校区精品课程

互联网前瞻热门课程从入门到成神

全国旗舰校区