ClickHouse实现了向量执行引擎(Vectorized execution engine),对内存中的列式数据,一个batch调用一次SIMD指令(而非每一行调用一次),不仅减少了函数调用次数、降低了cache miss,而且可以充分发挥SIMD指令的并行能力,大幅缩短了计算耗时。向量执行引擎,通常能够带来数倍的性能提升。
宽表:列多行少,高表:列少行多,一般我们在HBase中会讨论宽表和高表的设计,在clikchouse中一般不这么讨论
不支持真正的delete/update操作,不支持transactions(事物)* OLAP引擎一般都不支持事物,ClickHouse的定位也是分析性数据库,而不是严格的关系型数据库,加入对于事物的支持,必然会有锁,同时分布式事物的支持,会带来更复杂的实现,...
即如果某个节点上的RDD partition,因为节点故障,导致数据丢了,那么RDD会自动通过自己的数据来源重新计算该partition。RDD的lineage特性。5、RDD的数据默认情况下存放在内存中的,但是在内存资源不足时,Spark会自动将RDD数据写入磁盘。
加参数启动mysql:/usr/bin/mysqld_safe --skip-grant-tables & 然后就可以无任何限制的访问mysql了,注意:在开启mysql前,首先执行/usr/bin/mysqld_safe --skip-grant-tables & ,可以将root的权限全部打开。执行这个脚本,跟着设置即可 (注意:删除匿名用户,允许用户远程连接)