读书频道 > 网站 > 网页设计 > 深入理解Hadoop(原书第2版)
1.3.2 内存数据库系统
15-11-29    下载编辑
收藏    我要投稿   

本文所属图书 > 深入理解Hadoop(原书第2版)

本书详细地讲述了Hadoop生态圈中最为重要的几个组件。不仅介绍了Hadoop涉及的分布式理论基础知识,还着重讲解Hadoop系统的工程实践应用。为了深入浅出地讲述Hadoop各个组件的运行机理,作者使用了贴切的实战用例立即去当当网订购

从系统运行的角度来看,内存数据库系统类似于MPP系统。它们的不同之处在于,内存数据库系统的每个计算节点拥有巨大容量的内存,并且大部分数据会被预先加载到内存中。SAP 公司的HANA系统就是按照这个原则来运行的。另外一些系统,比如Oracle公司的Exalytics系统,利用特殊的硬件,一个应用程序就可以管理执行多个主机。就本质来说,内存数据库系统就像是带有SQL接口的内存MPP数据库系统。

内存数据库系统的商业版本中有个重要的缺点是,其中内置了大量的硬件和软件。诚然,这些系统拥有专用设备和特定硬件,但这通常费用高昂。如果因为这些内存数据库系统准备的商用硬件来扩容内存数据库系统集群是非常方便的。举个例子,假设一个商用服务器有25GB RAM。我们要搭建1TB容量的内存数据库就需要40台以上的主机(考虑到还有其他业务需要使用这个服务器)。1TB也未必够用,但是我们的集群节点数已经达到了40个。

下面列出了内存数据库系统编程模型的几个要点特征,这些特征同样符合前文中给出的最初的大数据系统定义:

如前面的例子中所述,数据按州划分。各个节点把数据加载到内存中。

各个计算节点都拥有程序所需的执行库,并对分配到该节点的数据进行数据处理。

每个计算节点读取本地数据。一个例外是你未考虑数据的分配情况就进行数据查询请求,这时,计算任务会从其他节点来获取所需数据。

由于数据是被缓存到内存的,所以除了最初的数据加载入内存的过程外,这里不适用顺序读取数据的特性。

点击复制链接 与好友分享!回本站首页
分享到: 更多
您对本文章有什么意见或着疑问吗?请到论坛讨论您的关注和建议是我们前行的参考和动力  
上一篇:1.3 功能
下一篇:1.5 小结
相关文章
图文推荐
JavaScript网页动画设
1.9 响应式
1.8 登陆页式
1.7 主题式
排行
热门
文章
下载
读书

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训
版权所有: 红黑联盟--致力于做最好的IT技术学习网站