博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Sahara将加速OpenStack与Hadoop的融合
阅读量:5876 次
发布时间:2019-06-19

本文共 1240 字,大约阅读时间需要 4 分钟。

OpenStack Sahara(旧称:Savanna)项目的负责人Sergey Lukjanov昨天正式宣布,Sahara从OpenStack孵化项目顺利毕业,将从OpenStack下一版本Juno开始作为OpenStack核心项目之一。Sahara是在2013年由领先的Apache Hadoop贡献方Hortonworks公司,最大的OpenStack 系统集成商Mirantis公司,以及全球领先的开源解决方案及最新版OpenStack的最大贡献方红帽公司联合发起的,致力于共同在 OpenStack上实现Apache Hadoop,使OpenStack用户能够轻松供应和管理弹性Hadoop集群,加快Hadoop在OpenStack上的开发和部署进程。

Apache Hadoop是MapReduce技术的一种实现,目前被各行业广泛采用,已成为大数据处理的行业标准。Sahara项目旨在为OpenStack用户提供一种简单、快捷地部署以及管理Hadoop集群的方案,类似于亚马逊Elastic MapReduce (EMR) 服务。

Sahara项目的架构图如下:

  • Horizon——提供GUI以使用所有Sahara的特性。
  • Keystone——认证用户并提供安全令牌,用以与OpenStack通信,用以给用户分配特定的OpenStack权限。
  • Nova——为Hadoop集群配置虚拟机。
  • Glance——用于储存Hadoop虚拟机镜像,每个镜像都包含了已安装的OS和Hadoop;预安装的Hadoop应该给予我们在节点布置上的便利。
  • Swift——可以作为需要进行Hadoop作业的预存储。

用户需要给Sahara提供一些信息来建立集群,比如Hadoop版本、集群拓扑、节点硬件详情以及一些其它的信息。在用户提供这些参数之后,Sahara将帮助用户在几分钟之内建立起集群,同样还可以帮助用户根据需求对集群进行扩展(增加或者删除工作节点)。

云计算提供基础架构平台,大数据应用在这个平台上运行,这是目前公认非常高效的处理大数据的方法之一。使用Sahara方案可有效满足如下使用场景:

1. 在OpenStack云环境中快速部署Hadoop集群;

2. 更充分地利用通用OpenStack IaaS云环境中未被利用的计算资源;

3. 与亚马逊EMR类似,为临时的或突发的数据分析任务,提供数据分析即服务(Analytics as a Service)

OpenStack和Hadoop的融合,既最大限度提高了服务器的资源利用率,又大大降低了大数据处理的准入门槛。可以预见,作为云计算和大数据的桥梁之一,Sahara将会推动OpenStack云平台和Hadoop的整合,逐步进入大数据处理市场,更快速地借助云计算平台和大数据处理技术把数据转换为商业价值。

原文发布时间为:2014年04月01日
本文作者:王后明
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

转载地址:http://dfuix.baihongyu.com/

你可能感兴趣的文章
golang 指针实践
查看>>
Android JNI 代码自动生成
查看>>
elemetui中好用的小技巧
查看>>
Laravel 文件上传提示 “The file "" deos not exits ” ,但确实已经上传了文件
查看>>
4.4 -4.5
查看>>
一天一个知识点 - 浅谈 JavaScript 原型链
查看>>
【变态需求】bootstrapTable列排序-选择正序倒序不排序
查看>>
Interface实现Fragment之间的通讯
查看>>
基于Vue+Canvas移动端的简单水印制作
查看>>
微信小游戏学习笔记 - 使用three.js 绘制一个旋转的三角形
查看>>
charles之localhost、127.0.0.1抓不到包的问题
查看>>
一些git实用技巧
查看>>
关于flutter APP更新相关部分内容
查看>>
Centos7.6安装MySQL+Redis(最新版)
查看>>
ListIterator
查看>>
Redis实战之限制操作频率
查看>>
单例模式
查看>>
RxSwift笔记四变换序列
查看>>
前端基础知识复习之CSS
查看>>
Python学习笔记 - 文件和异常
查看>>