互联网的一切都与行为动词有关,我们点击、搜索、导航、选择。诸多媒介之中,只有网络能让我们拥有自主的用户体验。当企业想通过网络赢得用户时,他们最迫切想了解的就是:如何才能让用户按照我们的意愿行事?这
恭喜!你已经向塑造优质Web内容迈出了一大步。很高兴能在提高Web内容影响力的征程中为你充当向导。首先,我先简要介绍一下本书。本书的由来这本书是爱的结晶——源自我对内容策略、说服艺术以及积极改变的热爱。
本书从内容策略、语言风格和心理学角度,深入探讨了如何创建有影响力的Web 内容。作者首先介绍了影响力的基本原理,接下来指导读者如何将这些原理付诸实践——如何规划、评估和调整内容,最后讨论了影响力内容的
之前我们一直在强调:Logstash的流程中,是以 json形式来流转一个 event的。但是我们知道,Linux程序交互是基于文本流的(UNIX哲学三大原则之一),所以在 Logstash的 input中,很重要的一件事情就是在转换文
不是所有的数据都需要处理成复杂的结构化数据并提供全面的分析统计功能。有时候,我们更在乎的是其中某一个数值的发展,或者对某个关键词的触发。这时我们就没有必要启用 ElasticSearch+Kibana,而完全可以用其
上例中,我们只提到如何使用 output到存储中,现在讲如何提供更高级而且方便的搜索报表功能。Logstash默认的 WebUI比较简单,社区基本都在使用另一个,即同样几乎是开箱即用的 Kibana项目,来完成 Web inte
到上节为止,Logstash似乎并没有体现出什么特别的地方,现在介绍的就是 Logstash最强大的功能——Grok filter。Grok是一个数据结构化工具。只需要通过简单地变量定义,我们就可以将文本格式的字符串,转换成为
Logstash社区非常重视新人的上手难度问题,甚至有一句话叫做让新手为难的问题那就是个 bug。所以使用 Logstash非常容易。a.最简单的使用我们从标准输入 stdin字符串testdata,让 Logstash转换到标准输出。$
比上一节的 Flume-ng更进一步,下面介绍一个非 Java的项目。Logstash是由 Loggy(前 Splunk员工构建在亚马逊 AWS云基础上的世界上最大的第三方日志分析处理服务商)贡献的开源项目。其官网地址是 http: l
Flume-ng是在原先 Flume的基础上发展而来的。它去除了原先架构中复杂的ZooKeeper高可用等组件,形成了目前这个比较轻量的结构。Flume-ng主要包括 source,sink和 channel三个部分。当 source来自多个源地址或
有了上节介绍的各种传输协议和工具,我们已经可以简单地通过一些 Shell和 Perl脚本,做到自动化数据收集传输了。但是随着数据来源的种类越来越多,或者传输后的分析平台越来越多,自己动手写脚本会是一件越来越
在日志处理方面,常见的 Gearman使用流程图如图 3-4所示。图 3-4 在海量日志实时处理方面,Gearman最简单也最常见的一个运用,是实时的访问排行。在单机上分析日志,我们都会使用如下命令来统计 Web日志中访
Gearman的初始版本是用 Perl写的。不过目前已经改成 C语言版本。所以最简单的使用方法是直接通过命令行来演示。直接通过 apt或者 yum安装 gearman-job-server或者 gearmand,然后我们可以看到在本机 4730
一个 Gearman请求的处理过程涉及三个角色:Client -> Job -> Worker。对于 Clinet和Worker并不限制使用一样的语言,所以有利于多语言系统之间的集成。Client:请求的发起者,可以是 C、PHP、Perl、MySQL和
Gearman是一套分布式程序框架,可以用在各种场合,与 Hadoop相比,Gearman更偏向于任务分发功能。它的任务分发非常简单,简单得可以只需要用脚本就能完成。Gearman最初用于 LiveJournal的图片 resize功能,由
采用 RPC协议的运维系统产品目前不是很多。个人感觉是因为 RPC通常用在有比较复杂的数据结构的场景中,日志数据还是扁平的字符串居多。当然,在超大规模的互联网企业中,数据的采集和传输不单单是普通的系统和
STOMP,顾名思义是基于文本的消息传输协议。它在 TCP层上定义了一个类似 HTTP的方法,数据传输一共包括十种:CONNECT、SEND、SUBSCRIBE、UNSUBSCRIBE、 BEGIN、COMMIT、ABORT、ACK、NACK和 DISCONNECT。数据
MQTT定义传输的,是遥测型数据,主要用于低带宽的小型设备场合。MQTT的实现中,大多数是 IBM等厂商的商业化产品,如 WebSphere MQ等。
AMQP与 JMS的区别在于,AMQP定义的是以 8字节为单位的数据流格式。在 AMQP中,数据的基本单位是帧。AMQP中一共有九种帧:open、begin、attach、transfer、flow、 disposition、detach、end和 close。数据传
Syslog虽好,但不是没有缺点,具体如下。1.运行在 UDP模式下的 Syslog是会丢数据的。2.即使运行在 TCP模式下解决了丢包的问题,Syslog的 PRI包括 TAG的方式依然无法充分满足大多数情况下对不同业务不同数