Apache Cassandra 是一个开源的分布式 NoSQL 数据库,它被构建用于在多个数据中心处理大量数据。Cassandra 的数据模型在多个文档和论文中是讨论的话题,常常导致混淆或矛盾的信息。这是因为 Cassandra 能够分别存储和访问列族,这导致它被错误地分类为列式而不是列族。
在本教程中,我们将查看数据模型之间的差异,并确定 Cassandra 分区行存储数据模型的性质。
2. 数据库数据模型
Apache Cassandra git 仓库上的 README 说明如下:
Cassandra 是一个分区行存储。行被组织成带有必需主键的表。
分区意味着 Cassandra 可以在应用透明的条件下跨多台机器分布您的数据。Cassandra 将自动重新分区,当集群中添加或移除机器时。
行存储意味着像关系数据库一样,Cassandra 按行和列组织数据。
大约 6 分钟