读书频道 > 网络 > Splunk大数据分析
1.3 Splunk是什么
2014-05-29 15:08:31     我来说两句 
收藏    我要投稿   

本文所属图书 > Splunk大数据分析

在大数据和业务智能领域,Splunk是功能强大、简单易学并且能够快速获取直接动力的一个分析工具。你可以利用Splunk实时地监控数据,或者在海量事实中进行数据挖掘。Splunk提供的强有力的可视化工具可以帮助你从海  立即去当当网订购

从技术上讲,Splunk是一个时间序列索引器,但是为了简化,我们称其为一个能很好处理3个V的产品。之前描述的大部分产品在处理人产生的数字足迹方面都有自己的起源,然而Splunk一开始用来处理机器数据的产品。由于这个不起眼的开端,并不总是认为Splunk是大数据世界中的一员。但是这不妨碍我们使用它来分析属于数字足迹类的大数据,因为如本书所展示,Splunk能很好地处理数字足迹类的数据。Splunk有3个主要功能:

数据采集,即采集静态数据,也可以实时地监控文件或者整个目录的变化和增加。也可以从网络端口或直接从程序或脚本中收集数据。此外,Splunk能连接到关系数据库以实现收集、插入或更新数据。

数据索引,将所收集的数据分解成事件,这个事件大致相当于数据库中的记录,或简单地认为是数据行。然后,对已存储的数据进行处理和更新高性能索引。

搜索和分析。使用Splunk处理语言(Splunk Processing Language),我们能够搜索数据和通过操作它而得到想要的报表或告警格式的结果。得到的结果可以用独立的事件、表格或者图表的样式展示。

每一个功能都能独立地扩展,例如,数据采集组件可以扩展到处理成千上万台服务器。数据索引功能可以扩展到大量分布式的对等服务器上,而且如果有必要,还可以选择在透明处理容错性的同时确保高可用性。搜索器(search head),也可以扩展到所需数量,就像已知的用于搜索和分析功能的服务器。此外,每一个功能都可以优化为可以适应地理位置、时区、数据中心或任何其他需求。Splunk有非常灵活的可扩展性,所以我们可以从自己的笔记本电脑上运行该产品的单个实例作为起步。

我们可以使用基于浏览器的用户界面SplunkWeb,或直接使用命令行界面(CLI)来与Splunk交互。Splunk非常灵活,它可以运行在Windows或任何类Unix系统下。

Splunk还是可用来开发处理大数据分析应用程序的一个平台。它有一个强大的API集,可以嵌入Python、Java、JavaScript、Ruby、PHP、C#中使用。在Splunk上开发应用程序的内容超出了本书的范围,但是,本书将介绍如何使用一些可免费使用的流行应用程序。对于Splunk的介绍暂且先到这里,因为这本书余下的部分都是关于Splunk的。

点击复制链接 与好友分享!回本站首页
分享到: 更多
您对本文章有什么意见或着疑问吗?请到论坛讨论您的关注和建议是我们前行的参考和动力  
上一篇:1.2 非传统的数据处理技术
下一篇:1.4 关于本书
相关文章
图文推荐
1.2.2 包与帧
1.2.1 网络协议栈
云数据中心网络技术
3.4.6 文本约定
排行
热门
文章
下载
读书

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训
版权所有: 红黑联盟--致力于做最好的IT技术学习网站