读书频道 > 网络 > Splunk大数据分析
1.4 关于本书
2014-05-29 15:19:19     我来说两句 
收藏    我要投稿   

本文所属图书 > Splunk大数据分析

在大数据和业务智能领域,Splunk是功能强大、简单易学并且能够快速获取直接动力的一个分析工具。你可以利用Splunk实时地监控数据,或者在海量事实中进行数据挖掘。Splunk提供的强有力的可视化工具可以帮助你从海  立即去当当网订购

我们对本书有两个期望。第一是期望本书能提供足够的知识使读者成为一名“数据牧马人”(data wrangler),从而让读者能够从数据中汲取智慧。第二是期望本书能使读者学会如何使用Splunk这个简单但非常强大的软件,它能使读者通过单击就能从所分析的数据中得到有价值的东西。

本书的内容安排旨在让读者了解数字足迹和机器数据这两类大数据。它一开始介绍简单的概念,并逐步介绍更难的方法。本书是指导大数据分析项目的实践指南,这些项目涉及机器数据、社会化媒体以及挖掘现有的数据仓库。我们将通过真实的项目详细地介绍如何收集数据、如何将数据导入Splunk、如何处理和分析数据,以及如何形成可以让目标受众更容易理解的可视化结果的方法。本书分为四部分:

Splunk的基本操作,其中介绍基础数据的收集、处理、分析及结果的可视化。这部分将使用机器数据来介绍Splunk处理语言的基础命令。第7章将介绍一种使用日志文件来创建高级数据分析报表的方法。

航空公司准点率项目。在熟悉了Splunk的基本概念和命令之后,第二部分介绍一个典型的大数据分析项目。我们将介绍一种简单的方法,这个方法将用在过去26年的航空公司绩效数据的分析项目上。该项目的数据属于挖掘现有数据仓库一类。通过这个项目,我们将介绍如何从CSV格式文件中以及直接从关系数据库中采集数据。在这两种情况下,关于数据集中可用的时间戳,存在一些需要特别注意的地方,我们会详细介绍如何处理它们。在这个有趣的项目中,我们会介绍一些新的Splunk命令,以及在第一部分已展示的命令的其他功能。

本书第三部分专门介绍社会化媒体。我们将详细介绍如何收集、处理、分析推文(tweet)和Foursquare的签到信息,并用一个完整的章来讲情感分析。这些章节将提供处理任何涉及社会化媒体流的大数据项目的必要知识。

本书第四部分将详细介绍Splunk的架构和拓扑结构:如何按需求扩展Splunk,以及分布式处理和高可用性的基本概念。

本书还包含几个附录,涵盖Splunk的性能以及各种可用的应用程序快速概览。

本书不会详细描述Splunk的每条命令,因为Splunk公司的在线文档中已有很详细的介绍,所以没必要再重复。我们的重点是大数据项目,通过实践这些项目,我们可以学习如何使用Splunk并使自己熟练地处理大数据项目。本书的章节安排旨在让读者可以直接进入任何一章,无须参考前面的章节就可以读懂并利用其中的内容来指导实践。话虽如此,但如果读者是第一次接触Splunk,那么最好从第1章开始阅读。如果读者从头开始读本书,将会发现书中关于收集数据和安装应用的一些内容重复了,这样做是为了方便那些想直接跳到特定章节阅读的读者。

注意:本书展示的搜索语句已经过优化,使其更具有可读性。但在Splunk的用户界面SplunkWeb中搜索语句是一条连续的语句。

本书所使用的数据都在下载的软件包中,包括原始数据,还有创建或收集数据的程序以及可下载数据的链接。这样读者可以在读这本书的同时参与项目。

我们一直努力让这本书含有更多的练习和实践环节,使读者能够从学习中尽量多获益。我们希望读者能喜欢这本书,并且从这本书中学到足够的知识从而成为一个熟练的数据牧马人,毕竟,世界上有这么多的数据,而没有多少人能够处理它们。

点击复制链接 与好友分享!回本站首页
分享到: 更多
您对本文章有什么意见或着疑问吗?请到论坛讨论您的关注和建议是我们前行的参考和动力  
上一篇:1.3 Splunk是什么
下一篇:概述
相关文章
图文推荐
1.2.2 包与帧
1.2.1 网络协议栈
云数据中心网络技术
3.4.6 文本约定
排行
热门
文章
下载
读书

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训
版权所有: 红黑联盟--致力于做最好的IT技术学习网站