https://www.gravatar.com/avatar/932f1b40c8d0202ce03a0df412bfb0ff?s=240&d=mp

chaomai's Odyssey

6.824 2018 Lecture 6 Fault Tolerance Raft

Readings - In Search of an Understandable Consensus Algorithm (Extended Version) (Section 6 to end)论文

集群成员变更

实际应用中,常常会有配置变更的需求,即:成员变更。手动的方式有下面两种,

  • 把集群整体下线,配置修改完毕以后再上线是可行的,但会造成服务不可用。
  • 新server可以通过获取其ip来替换集群成员,需要保证被替换的server不会再加入集群。

但这两个方式都有明显的弊端,且任何手动的步骤都有引起错误的可能。

6.824 2018 Lecture 5 Fault Tolerance Raft

Readings - In Search of an Understandable Consensus Algorithm (Extended Version) (to end of Section 5)论文

Introduction

共识算法(Consensus algorithms)允许一组机器作为一个一致的组工作,这个组可以在某些成员失败的情况下存活。Paxos是过去10多年最常被讨论的共识算法,但是难以理解且不便于实现。提出Raft的主要目标是可理解性。通过解耦leader选举、log复制和安全,以及减少状态空间,来增加可理解性。

6.824 2018 Lecture 3 GFS

Readings - The Google File System论文

介绍

GFS是由Google设计和实现的,以满足Google对数据处理快速正常的需求。GFS和先前的分布式文件系统有很多相似的目标,例如:性能、可扩展性、可靠性和可用性。然而,GFS的设计是由Google对应用负载和技术环境的关键(当前和预期的)观察驱动的,这反映了与早期文件系统设计假设的显著不同。Google重新审视传统的选择,并探索在设计领域探索了彻底不同的观点。