- 数据挖掘核心技术揭秘贾双成,王奇
- 本书包括五部分内容。第一部分(第1~3章)涉及数据挖掘技术的基础知识,介绍数据挖掘的定义、数据挖掘工具及应用领域,数据挖掘的数学基础内容,以及海量数据挖掘处理技术。第二部分(第4~5章)分别从聚类技术和离群点挖掘技术阐述聚类在语音区分、新闻分组、销售策略制定、交通事故预测、欺诈检测、入侵检测、异常气候检测等方面的应用。第三部分(第6~11章)分别从决策树、基于实例的学习、支持向量机、贝叶斯学习、人工神经网络、遗传算法在病情诊断、信用卡欺诈、机械装备设计、法律案件审理、动物分类、垃圾邮件过滤、手写文字识别、股票价格预测、人脸识别、音乐生成等方面阐述分类的应用。第四部分(第12章)阐述回归数据挖掘技术的应用,涉及卡尔曼算法在股票价格预测、GPS定位方面的应用。第五部分(第13章)介绍推荐系统这个最典型的数据挖掘应用。附录总结本书内容,阐述数据挖掘技术的数学本质。
- 出版社:机械工业出版社 出版日期:2016-01-01 ISBN:978-7-111-51924-9 定 价:59元
- 免责声明:图书版权归出版社和作者所有,www.2cto.com 仅提供试读
本书试读章节
- 前言与目录
- 前言
- 目录
- 第1章 引言
- 概述
- 1.1 数据挖掘的含义
- 1.2 数据挖掘的演变过程
- 1.3 数据工具简介
- 1.3.1 Hadoop与MapReduce
- 1.3.2 Pig语言
- 1.3.3 MATLAB编程
- 1.3.4 SAS
- 1.3.5 WEKA
- 1.3.6 R语言编程
- 1.4 数据挖掘应用领域
- 1.5 小结
- 第2章 数学基础
- 概述
- 2.1 概率统计
- 2.1.1 基本概念
- 2.1.2 随机变量及其分布
- 2.2.1 期望与方差
- 2.2.2 距离
- 2.2.3 相关系数
- 2.3 矩阵计算
- 2.4.1 最小二乘法定义
- 2.4.2 回归
- 2.4.3 参数的最小二乘法估计
- 第3章 海量数据处理技术
- 概述
- 3.1 索引技术
- 3.1.1 数据库索引
- 3.1.2 文本索引
- 3.2 海量数据处理技术
- 3.2.1 外排序
- 3.2.2 分布式处理
- 3.2.3 Bloom filter
- 3.2.4 常用技巧