什么是Apache Cassandra?
Apache Cassandra是一个开源的NoSQL分布式数据库,受到数千家公司的信任,在不影响性能的情况下实现可扩展性和高可用性。商用硬件或云基础架构上的线性可扩展性和经过验证的容错能力使其成为任务关键型数据的完美平台。
混合
无主架构和低延迟意味着Cassandra将承受整个数据中心的中断,而不会丢失数据 - 跨公共云或私有云以及本地。
容错
Cassandra 对跨多个数据中心进行复制的支持是同类最佳的,可为您的用户提供更低的延迟,并且知道您可以在区域性中断中幸存下来,让您高枕无忧。故障节点可以在不停机的情况下进行替换。
注重质量
为了确保可靠性和稳定性,Cassandra 在多达 1,000 个节点的集群上进行了测试,并测试了数百个真实世界的用例和模式,并进行了重放、模糊、基于属性、故障注入和性能测试。
一切尽在掌控之中
为每个更新选择同步或异步复制。高度可用的异步操作已通过提示切换和读取修复等功能进行了优化。
安全性和可观察性
操作员的审核日志记录功能可跟踪 DML、DDL 和 DCL 活动,对正常工作负载性能的影响最小,而 fqltool 允许捕获和重放生产工作负载以进行分析。
分散式
Cassandra 适用于无法承受数据丢失能力的应用程序,即使整个数据中心出现故障也是如此。没有单点故障。没有网络瓶颈。群集中的每个节点都是相同的。
可 伸缩
随着新计算机的添加,读取和写入吞吐量都会线性增加,而不会对应用程序造成停机或中断。
弹性的
Cassandra 在扩展操作期间(例如在高峰流量时间添加新节点或数据中心)期间在节点之间流式传输数据。零拷贝流在没有vnode的情况下使这一速度提高了5倍,从而实现了更具弹性的架构,特别是在云和Kubernetes环境中。
卡桑德拉用户
Cassandra被成千上万的公司使用,这些公司拥有大型活动数据集。
"自2016年以来,彭博的应用工程师转向Cassandra,因为它易于使用,易于扩展且始终可用。我们每天在 1,700 多个 Cassandra 节点组成的近 1 PB 数据集上提供超过 200 亿个请求。
– Isaac Reath,彭博公司NoSQL基础设施软件工程团队负责人
社区聚焦
以下是Cassandra社区为推进世界上首屈一指的开源NoSQL数据库所做的工作。
阿帕奇卡桑德拉4.0概述
Apache Cassandra 4.0是该项目历史上最稳定的版本,也是向12个月发布周期转变的开始,支持三年期发布。最新版本经过了密集测试,为分布式数据库设定了新的高基准,并包括以下新功能:
-
提高速度和可扩展性
-
提高一致性
-
新的配置设置
-
最小化延迟
-
增强的安全性和可观察性
-
更好的压缩

Apache Cassandra Changelog #9
Jon Meredith加入了PMC,Apache Cassandra 4.0获得了许多积极的新闻报道。同时,建议 Apache Cassandra 3.0.23、3.0.24、3.11.9 和 3.11.10 的用户进行升级,因为在架构更改期间可能会出现数据损坏。Changelog #9还包括Kubernetes SIG对cass-operator的更新以及K8ssandra对Cassandra 4.0的支持。同时,提醒开发人员,更改代码库的功能需要Cassandra增强提案。

Cassandra on Kubernetes: A Beginner's Guide
从高层次了解 Kubernetes 和数据层的挑战 - 了解社区如何构建 cass-operator 来降低复杂性。操作员在 Kubernetes 需要维护的内容和数据库的实际实现之间提供了一个转换层。该指南还介绍了使用单个Helm图表和开源K8ssandra在Kubernetes上部署Cassandra,K8ssandra是在Kubernetes上运行的Apache Cassandra的发行版,它提供了一套工具来简化和自动化操作任务。
