GreenPlum hive与hadoop的关系什么关系

GreenPlum 与hadoop什么关系? - 知乎有问题,上知乎。知乎作为中文互联网最大的知识分享平台,以「知识连接一切」为愿景,致力于构建一个人人都可以便捷接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,发现更大的世界。26被浏览<strong class="NumberBoard-itemValue" title="分享邀请回答赞同 添加评论分享收藏感谢收起同步各端记录
下载PC客户端,上传视频更轻松!
药品服务许可证(京)-经营-
请使用者仔细阅读优酷、、
Copyright(C)2017 优酷 youku.com 版权所有
不良信息举报电话:
基于Greenplum Hadoop分布式平台的大数据之Hadoop的起源和体系
基于Greenplum Hadoop分布式平台的大数据之Hadoop的起源和体系—在线播放—《基于Greenplum Hadoop分布式平台的大数据之Hadoop的起源和体系》—教育—优酷网,视频高清在线观看
微信/手机 扫码分享
点击一下 网页分享
<input id="link4" type="text" class="fn-share-input" value="" data-spm-anchor-id="0.0.0.i1" />
复制通用代码
<input type="text" class="fn-share-input" id="link3" value="" />
复制Html代码
复制Flash代码
将启用PC客户端下载视频
基于Greenplum Hadoop分布式平台的大数据之Hadoop的起源和体系
用优酷移动APP扫码
或用微信扫码观看
二维码2小时有效
没有客户端?扫码马上安装
IPHONE / 安卓
基于Greenplum Hadoop分布式平台的大数据之Hadoop的起源和体系
使用HTML5播放器
使用FLASH播放器博客访问: 1609
博文数量: 0
注册时间:
&&&& 该分类下暂时没有公开的博文,给他留言提醒一下吧。
给主人留下些什么吧!~~
请登录后留言。漫谈 Greenplum 开源背后的动机
这几天最大的消息莫过于greenplum的开源,年初开始pivotal就宣布了greenplum的开源,经过大半年的翘首等待,终于在十月底在欧洲的Postgres大会宣布开源,并兑现在github上,社区的官网为&&, 其官方博客也有提到。
代码是采用apache许可,今天已经有社区的朋友尝鲜从社区取下代码,在greenplum上测试了tpch的性能,虽然测试比较粗糙但是结果基本和商业版的一样,印证了之前greenplum将走向全开源的消息。虽然里面关键的新一代优化器orca还没有看到代码,但据消息这部分后续也会开出来,估计这个是其对这个最核心资产的一个谨慎的操作。&
总体的印象来看,其采取开放的apache许可,代码基本上无保留开源,这次的开源更大程度是公司层面的战略行为,而不是简单的市场推广的战术行为。
greenplum的开源,在我看来有几个驱动力。
首先,是受其cloud foundry开源战略成功的驱动
pivotal在整个emc联邦的定位来说是偏中间件这一层,emc是存储,vmware是虚拟化,pivotal要搞定的是PaaS。而pivotal的业务上来说,要把云和大数据这两个支柱搞定,才能把emc联邦的疆域稳定下来。云这一层来说vmware已经是私有云的霸主,而剩下的上层PaaS这一层如果落入他人之手对其来说也是一个大威胁,所以PaaS这一层也是志在必得。
鉴于当时已经在市场有很多对手,2011年的时候cloudfoundry启动是以开源的模式来去做,把IBM和HP拉上。这个战略取得了出人意料的巨大成功,现在CF几乎要变成了PaaS的事实标准,IBM也推出了基于CF的bluemix产品,而pivotal在今年发布的2014年的财报,极为惹眼的标题:破纪录的2014年,史上最快的开源产品。在短短的一年里,就获得4千万美金的软件销售收入,另外也获得了财富500强中的100个客户!这对于基础软件来说,基本是神话。
说了这么多,无外乎就是给大家强调一下,整个pivotal在cloudfoudry的巨大成功下,对于开源的认识已经到了商业战略的层次,已经不需要去讨论要不要开源,开源已经成为杀手级的武器!在此背景下我们来去理解greenplum的开源才更容易理解。
其次,Pivotal的大数据战场,需要新的战略调整
上面提到,除了云以外,Pivotal的战略重心是大数据,Pivotal除了有自己的hadoop发行版以外还有greenplum作为大数据最重要的资产。
但是大数据整个市场都不是太理想,Hadoop发行版除了有Cloudera,Hortonworks,MapR这三个第三方发行版以外,还有Pivotal,IBM,Intel这些厂商本身的发行版,市场最突出的问题是碎片化(fragmented),Hadoop的门槛低,厂商林立,同质化严重,不仅仅难以溢价出售,传统大厂商靠溢价销售基础软件获取超额利益的路子开始行不通;更为重要的是越来越多的客户倾向于使用第三方独立的发行版。
道理不难理解,用户更希望的是Linux生态里面有Redhat和SuSe这样的发行厂商,而不希望类似AIX或者是Windows Server这种由厂商控制的生态,这个更加加剧了厂商面临的困境。
Intel由于其发行版的糟糕市场表现,开始陆续解散自己的Hadoop团队,国内的星环就是在这个背景下诞生,2014年Intel重金投资Cloudera 7.4亿美金取得18%的股权,Dell也投入Cloudera的阵营,HP、微软、Teradata则倾向于直接使用Hortonworks的发行版,HP还投资了Hortonworks。但是Cloudera的优势明显,营收是Hortonworks的将近一倍,Cloudera俨然有成为Hadoop生态的新的霸主的阵势,市场格局开始慢慢固化,Intel有可能是这场战役的赢家。
在这样的市场格局里面,Pivotal的困境可想而知,HD的发行版肯定需要重新调整策略,所以Pivotal联合IBM、GE等15个弱势玩家, 在今年3月宣告成立ODP(Open Data Platform)组织,本质上是希望通过支持Hortonworks抗衡Cloudera,取得平衡。但是这个赌注的胜算并不明显,Cloudera的CEO甚至公开嘲讽ODP,说其出现本身就是Cloudera的一个,Greenplum的开源正是作为ODP的砝码而出现,Pivotal决定把HD发行版、Gemfire、HAWQ还有Greenplum开源,所以从这个角度我们看到,Greenplum的开源本身,就是Pivotal希望赢回这场战役的一个砝码,对其而言,越多人用越好,没有必要隐藏任何功能。
其实在Greenplum开源之前,MPP数据库的日子也并不好过,也是市场碎片化,每个厂家也就区区几千万美金的营收,市场难以有大的突破,传统丰厚的DW市场也难以打入,Hadoop生态又是以开源为主,甚至很多类似Impala这样的产品也在做其类似的功能,传统的打不开,新市场又难以全面 打开,而且竞争重重,进退两难。而Greenplum十多年来的架构也无力进行大的调整。正是在这样的背景下,倒不如开源,盘活大局。下面这篇文章称其举动为&&。
Greenplum的开源应该是相对比较激进和带有攻击性(aggressive)一着棋,成败难料,但对于整个生态会有比较大的影响,明天的文章里我再给大家分享一下我对于其影响的看法。
这几天最大的消息莫过于greenplum的开源,年初开始pivotal就宣布了greenplum的开源,经过大半年的翘首等待,终于在十月底在欧洲的Postgres大会宣布开源,并兑现在github上开放代码,社区的官网为http://greenplum.org/, 其官方博客也有提到相关事项。 代码是采用apache许可,今天已经有社区的朋友尝鲜从社区取下代码,在greenplum上测试了tpch的性能,虽然测试比较粗糙但是结果基本和商业版的一样,印证了之前greenplum将走向全开源的消息。虽然里面关键的新一代优化器orca还没有看到代码,但据消息这部分后续也会开出来,估计这个是其对
上一篇:下一篇:
评论功能关闭
根据国家法律法规要求,本站暂时关闭文章评论功能。开放时间不确定。我们将谋求一种可以让大家更好的发表意见的方式。
根据国家法律法规要求,只有实名认证后才可以发表评论。
分享到微信
打开微信,点击顶部的“╋”,
使用“扫一扫”将网页分享至微信。
请将我们加入您的广告过滤器的白名单,请支持开源站点。谢谢您。GreenPlum 与hadoop什么关系_百度知道
GreenPlum 与hadoop什么关系
我有更好的答案
主流服务器一般由多个NUMA节点组成,每个NUMA节点是一个SMP结构,一般由多个CPU组成,并且具有本地内存和IO设备。NUMA节点可以直接访问本地内存,也可以通过NUMA互联模块访问其他NUMA节点的内存,但是访问本地内存的速度远远高于远程访问速度,因此,开发程序要尽量减少不同NUMA节点之间的信息交互。
采纳率:74%
来自团队:
为您推荐:
其他类似问题
&#xe675;换一换
回答问题,赢新手礼包&#xe6b9;
个人、企业类
违法有害信息,请在下方选择后提交
色情、暴力
我们会通过消息、邮箱等方式尽快将举报结果通知您。

我要回帖

更多关于 hadoop和hbase的关系 的文章

 

随机推荐