- 云计算环境下的信息资源集成与服务
- 朝乐门 杜小勇 卢小宾等
- 267字
- 2021-03-31 07:00:21
2.1.2 MapReduce 2.0的优化
MapReduce 1.0的主要局限性体现在可靠性及可扩展性差、资源利用率低以及计算模式的单一等几方面。为此,人们将YARN
引入MapReduce之中,将MapReduce 1.0中的资源管理功能交由YARN完成,进而提出了下一代MapReduce计算框架——MapReduce 2.0,如图2-1所示。MapReduce 2.0中资源管理和作业控制为两个独立的进程,不仅减轻了Master节点的负载,而且使MapReduce可以支持多种计算框架。
![](https://epubservercos.yuewen.com/B9C239/15936052104962306/epubprivate/OEBPS/Images/Figure-P38_5155.jpg?sign=1739226882-AB69ABbAQTacIiXuHsHownfFyD5zNIxv-0-cb790dd32b2459200f7f9e5b2674cf31)
图2-1 从MapReduce 1.0到MapReduce 2.0
随着大数据时代的到来及计算技术的不断发展,人们针对不同需求提出了多种计算框架(MapReduce、Tez、Spark、Storm、Druid等,见表2-1),这些计算框架进一步呈现出相互集成的发展趋势。其中,MapReduce和Spark是现阶段最为广泛应用的计算框架。
表2-1 几种常用的计算框架
![](https://epubservercos.yuewen.com/B9C239/15936052104962306/epubprivate/OEBPS/Images/Figure-T38_11779.jpg?sign=1739226882-8yePQvQnu1nPHknkjJQZCe3hMGKjGTcI-0-0faca110592b9a61a979070c7dec8340)