什么是分布式系统?

什么是分布式系统?

马草原 967 2020-12-06

什么是分布式系统?

分布式系统是基于网络进行通信、为完成同一个目标而互相协作的一组节点集群

为什么要引入分布式系统?

单机系统的计算性能、存储容量达到了瓶颈,具体分为四点:

  • 性能和容量:已经触达单机的计算瓶颈、存储容量瓶颈
  • 投入产出比:升级单机硬件的成本太高,已经大于它带来的性能或容量的提升效果
  • 开发效率:随着系统越来越复杂,参与维护的人越来越多,单体系统的维护效率触发瓶颈
  • 运维要求:单机系统一挂全挂的特点,不满足互联网服务7×24小时可用的要求

在上面这些问题的挑战下,分布式系统的思想应用而生,分布式系统的核心思想是使用大量普通规格的普通机器,互相协调,实现和单机系统同样的业务目标。主要的吸引力在于:

  • 扩展性:随着机器的线性增加,分布式系统的存储和计算性能也可以线性增加
  • 灵活性:基于普通机器的集群,可以根据业务流量,灵活扩容或缩容,提高资金的利用率
  • 可用性:单个模块挂掉,不会影响其他模块

分布式系统又带来了哪些问题?

世界上没有十全十美的程序,要享受分布式系统的扩展性、弹性运维的好处,就得承受它带来的成本,从开发过程的视角来,最大的挑战是复杂度。
要妥善处理好多个节点之间的协同问题、数据分区、数据一致性等问题,难度很大。还将系统拆到不同的计算机节点上,运维难度也变高。测试和排查问题的难度提高。

如何建设优秀的分布式系统?

运行视角

引入分布式系统也是有成本的,需要妥善处理好多个节点之间的协调的问题,对于计算机系统来说,主要就是存储和计算两个主题,那么对应到分布式系统中也依然是这样:

  • 分布式计算

  • 两个节点之间的进程如何通信?

  • 如何发现自己要调用的服务?

  • 如何做避免系统雪崩?

  • 如何确定系统是正常运行的?

  • 如何做分布式锁?

  • 分布式存储

  • 如何做数据分片?

  • 如何保障数据一致性?

  • 如何做分布式事务?

抽象视角

对于运行视角面临的一些问题,进行抽象和归类,可以归为下面三个问题:

  • 路由问题
  • 共识问题
  • 运维问题

cloud