大数据面试题:hbase布隆过滤器
发布时间:2022-06-21 17:35:00
发布人:syq
不存在的一定不存在,存在的不一定存在;
1. 布隆过滤器的存储在哪?
对于hbase而言,当我们选择采用布隆过滤器之后,HBase会在生成StoreFile(HFile)时包含一份布隆过滤器结构的数据,称其为MetaBlock;MetaBlock与DataBlock(真实的KeyValue数据)一起由LRUBlockCache维护。
cell较小的不适用布隆过滤器;
按行读,更新数据量大,范围广(多列),用row;
2. 协处理器
observe:通过钩子函数,做一些预处理和后处理;类似于 RDBMS 中的触发器,主要在服务端工作,主要有三种
regionObserve:处理数据修改数据;如:创建二级索引
maserObserve:管理DDL类型操作
WALObserve:提供针对WAL的钩子函数
endpoint:类似于 RDBMS 中的存储过程,主要在服务端工作,可以实现 min、max、avg、sum、distinct、group by 等功能
更多关于大数据培训的问题,欢迎咨询千锋教育在线名师。千锋教育拥有多年IT培训服务经验,采用全程面授高品质、高体验培养模式,拥有国内一体化教学管理及学员服务,助力更多学员实现高薪梦想。
下一篇大数据面试题:kafka