HBase Region分裂流程是什么?
发布时间:2022-08-25 17:44:00
发布人:qyf
Region 切分是一个事务过程,分成三个阶段
Prepare 阶段:
在内存中初始化两个子 Region,具体是生成两个 HRegionInfo 对象,包含TableName、RegionName、startkey、endkey 等信息。同时会生成一个用来记录 Split 进展的对象。
Execute 阶段:
* 首先更改当前 Region 在 Zookeeper 中的状态为 SPLITING。master 也会同步这个状态。 * 生成两个子文件,只存储切分点 splitkey 和一个 Boolen 类型变量(用来标记这个文件是上半部分还是下半部分)。 * 为避免数据的频繁读写,只有在子Region执行 Major Compact 后才会将父Region中属于该子Region的所有数据读出来并写入数据文件中。
Rollback 阶段:
如果 execute 阶段出现异常,则执行 rollback 操作。为了实现回滚,整个切分过程被分为很多子阶段,回滚程序会根据当前进展到哪个子阶段来清理对应的垃圾数据,根据切分进展来做不同的回滚操作
更多关于“大数据培训”的问题,欢迎咨询千锋教育在线名师。千锋教育多年办学,课程大纲紧跟企业需求,更科学更严谨,每年培养泛IT人才近2万人。不论你是零基础还是想提升,都可以找到适合的班型,千锋教育随时欢迎你来试听。