读书频道 > 网站 > 网页设计 > Splunk大数据分析
2.2 Splunk如何处理多样化的数据
14-05-29    奋斗的小年轻
收藏    我要投稿   

本文所属图书 > Splunk大数据分析

在大数据和业务智能领域,Splunk是功能强大、简单易学并且能够快速获取直接动力的一个分析工具。你可以利用Splunk实时地监控数据,或者在海量事实中进行数据挖掘。Splunk提供的强有力的可视化工具可以帮助你从海立即去当当网订购

对于任何实用目的,Splunk能处理几乎任何类型的数据,这些数据有很多不同的来源,例如网络日志、应用程序日志、网络订阅、系统运行日志、数据库中的结构化数据、社会化数据等。Splunk需要为每个数据来源进行配置,并且可以把每个来源配置成一个特定的数据输入。导入Splunk中的数据可以是本地的,这意味着来自运行Splunk的同一台电脑上的数据,导入Splunk中的数据也可以来自已连接到Splunk服务器(组)的任何远程设备。

我们将在本章的后面部分看到如何将远程数据导入Splunk。Splunk将可导入的数据源大致分类为:

文件和目录

网络资源

Windows数据

其他源

我们将详细介绍每一种数据源。Splunk为定义和配置以上数据源作为输入数据提供不同的选择:

Splunk Web:标准用户界面,与Splunk交互的最简单的方式。

Splunk CLI:命令行界面(CLI)也能用于与Splunk交互,但是它主要用于批处理脚本程序。

应用程序或附加组件:它们是基于Splunk框架构建的专用应用程序,使处理一种或多种类型的数据源变得简单。本章后面将讨论应用和附加组件之间的差异,并通过例子介绍如何使用。

配置文件:Splunk提供各种配置文件来配置和指向不同的数据源。无论使用什么方式来配置数据源,inputs.conf文件可以同时通过Splunk Web、Splunk CLI、应用程序和附加组件或手动方式进行更新。

不论我们选择何种方式运行Splunk,数据输入的定义和配置最终都会存储在配置文件中。例如,在本书中,我们将使用Splunk Web用户界面。还有一种非常受欢迎的机器或日志数据,被企业广泛用于运营分析,叫做网络日志或称为访问日志。我们将从网络日志开始探索并熟悉Splunk。为模拟现实中在线网络应用会发生的事,我们创建一个虚拟的销售小电子产品的电子商务网站MyGizmoStore.com。MyGizmoStore.com上的数据由本章后面描述的一个数据生成器来生成。这个数据生成器模拟典型用户活动产生的日志文件,这些活动包括浏览商品、添加到购物车和潜在购买行为。

点击复制链接 与好友分享!回本站首页
分享到: 更多
您对本文章有什么意见或着疑问吗?请到论坛讨论您的关注和建议是我们前行的参考和动力  
上一篇:1.3 功能
下一篇:1.5 小结
相关文章
图文推荐
JavaScript网页动画设
1.9 响应式
1.8 登陆页式
1.7 主题式
排行
热门
文章
下载
读书

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训
版权所有: 红黑联盟--致力于做最好的IT技术学习网站