3.1 采集点的取舍
说到数据分析,首先当然是数据越全面越详细越好。但是随之带来的分析复杂度也同样让人头疼。所以首先我们要针对不同类型的数据,确定正常收集状态下的采样点。
3.1.1 服务器数据
首先是服务器数据,即第二章所讲的 sar等命令采集到的服务器负载、磁盘读写、网卡流量等信息。这些采样标准,其实完全可以根据数据本身的概念和命令的原理来确定采样频率。
比如平均负载 loadavg,输出的三个值本身就已经是 1分钟、5分钟、15分钟的平均值,那么小于 1分钟的采样就是没有意义的。
相反,对于 I/O操作,大多数条件下都是瞬时操作,如果依然使用 5分钟甚至 10分钟的采样频率,很可能就会遗漏掉一些异常情况直到累积爆发。
而另一方面,即便是相同的数据,针对不同应用的采样点也应该有所区别。
比如常见的缓存服务器软件 Squid,在 version 3.2之前,是不支持多核的。那么其数据采样就不能和 Nginx等服务一样采用 loadavg,而需要关注其具体的 CPU util%。