合并数据
min compact文件数量达到一定阀值会触发min compact将多个storefile合并成一个,只是简单的合并,不会有数据的删除major compact默认7天执行一次将多个storefile合并,会将过期的,超出版本数量的、标记为删除的数据都进行删除(一般要在系统空闲的时候去做,因为需要大量的磁盘IO),一般会设置手动执行
Hbase 原理1.1 meta表和root表
meta表的rowKey由表名、起始key、时间戳组成,如果起始key为空,则表示第一个region,按照起始key排序使得行键不需要终止key就能表示范围。 值则是终止Key、列族、列值,该RegionServer的地址等等。meta表由于数据量过大可能被分割由多个RS存储,因此又设置了root表存放meta表中所有的region,以及该region所属的meta表的位置。
交易表结构为user_id(用户ID),order_id(订单ID),pay_time(付款时间),order_amount(金额)
写sql查询昨天每个用户最后付款的订单ID及金额select date_format(pay_time,'%Y-%m-%d') days , count(distinct user_id) from table where pay_time>=date_sub(now(),interval 1 month) #过去一个月 group by date_format(pay_time,'%Y-%m-%d') order by count(distinct user_id) desc limit
sort by 和order by的区别(重点)
sort by的数据只能保证在同一个reduce中的数据可以按指定字段排序。使用sort by你可以指定执行的reduce个数(通过set mapred.reduce.tasks=n来指定),对输出的数据再执行归并排序sort by的数据只能保证在同一个reduce中的数据可以按指定字段排序。
知道nextTick的作用吗,谈谈对它的理解,是什么,怎么用页面跳转传参
当你设置 vm.message = 'new message',该组件不会立即重新渲染。当刷新队列时,组件会在下一个事件循环“tick”中更新。多数情况我们不需要关心这个过程,但是如果你想基于更新后的 DOM 状态来做点什么,这就可能会有些棘手。