2.4. 技术道路¶
大数据系统从google的三篇经典论文(GFS, MapReduce, BigTable)开始, 还有Google强大的集群管理系统Borg, 到开源的Hadoop实现(HDFS, Mapreduce, HBase, Yarn), 慢慢衍生出一个完整平台和生态系统.
2.4.1. Google的道路¶
- GFS -> Colossus(GFS2)
- MapReduce -> Tenzing -> Dremel
- BigTable -> Procator -> MegaStore -> Spanner
- Borg -> Omega
2.4.2. Hadoop的道路¶
开源Hadoop基本上跟着Google的路走, 只不过慢了N年. 不过这也是需求驱动, 毕竟没有几个公司到达Google那个规模。
- 核心:HDFS. Mapreduce, HBase, Yarn
- 外围: Hive, Storm
- 黑马: Spark
2.4.4. 大规模运维和监控系统¶
这是各个大公司软实力所在,这些基础的系统好坏直接关系到服务质量和产品迭代速度。
在这里记录一些对这些技术的理解, 欢迎交流~ lshmouse@gmail.com