2009年3月12日 星期四

Cassandra的数据模型

1,每一row都由一个唯一的key标实,key是个string类型
2,每个Cassandra实例含有一个table,这个table由一个或者多个column families组成
3,column families的数量和名称在这个集群启动的时候必须是固定的了,虽然对于column families的数量没有限制,但是最好不要太多
4,每个column families可以包含supercolumns 和 columns这两个架构中的任何一个。它们都是动态建立的,并且对于每个column families中,他们的数量是没有限制的。
5,columns是由一个名字,一个值和一个用户自定义的timestamp,columns的数量可以很大
6,supercolumns是由一个名字和无数个columns组成的。

Distribution, Replication and Fault Tolerance
1,数据是分布放在集群上的,使用的是Consistent Hashing和Order Preserving Hashing Function。使用Order Preserving Hash function使得我们可以在今后对某个区域的数据进行扫描,从而进行分析
2,集群中的每个membership都说通过Gossip方式的membership算法来维护的。这个集群中的每个节点如果fail了,那么就会有一个叫做Accrual Style Failure Detector的东东监控它
3...

沒有留言:

張貼留言