数据挖掘系统已成功地用于超大型数据库的知识挖掘。它广泛地应用于市场营销、银行业、生产销售、零售业、制造业、经济业、保险业、政府防卫、医药业、电信业、公司经营管理、计算机软件和硬件等各个应用方向。工具系统的总体发展趋势是,使数据挖掘技术进一步为用户所接受和使用,也可以使用更贴近用户的语言从而方便用户使用。
数据挖掘技术对于科技的发展起了重要的推动作用,而且这种影响仍将延续。我们举几个例子简要描述数据挖掘技术的应用领域。
股票的涨跌。股票的涨跌一直是众多经济学家研究的热点问题,众多投资者、股评人、证券结构从业者无不对此有着饱满的热情。人们一直思考着一个问题,是否有一种方式可以让投资者持续获利?答案是否定的,毕竟市场的瞬息万变往往出乎意料。那么,我们能否做到尽可能降低风险呢?答案是肯定的,数据挖掘技术正是解决这类问题的技术之一。
流行病预测。我们以谷歌的一项研究为例。早在2009年,谷歌公司的工程师在H1N1爆发几周前在《Nature》上发表了一篇论文,用以预测流感的爆发,该算法甚至具体到特定的地区和州,并且可以提前数周乃至数月预测流感爆发,不像疾控中心一样要在流感爆发一两周之后才可以做到。
保单推荐。保险公司有时候希望卖出更多的保险,然而一些保险销售人员往往跑了无数的客户,仅仅卖出很少的保险。那么,我们能否做到精准营销,将客户群体框定都一定范围,然后集中推荐销售。依靠保险公司已经卖出的保险数据,我们可以对保险类型、购买者特点进行分析,通过数据挖掘技术实现精准营销,提高保险公司销售额。
交通路况预测。交通路况预测具有重要的现实意义。一方面,交通控制管理中心通过采集到的交通信息掌握道路网络的实时交通状态,通过交通信息预测之后道路网的交通状态,对道路网的交通状态实时管理和监控,科学合理地引导出行者的行走路线,使交通流量能够合理地分配在路网上,在拥堵未发生之前,采取措施来避免拥堵的发生,而不是当拥堵发生后被动地解决和处理;另一方面,出行者可以利用交通控制管理中心发布的交通信息,了解道路网的交通状况,对出行前和出行中的路径、出发时间、交通工具做出正确选择,避免交通堵塞。以数据挖掘技术为解决方案,通过历史交通路况信息,结合当前路况预测后期交通路况,目前已经成功应用于交通出行领域。
商品推荐。亚马逊作为财力雄厚的电子商务网站,其对客户的了解与分析属于业界翘楚。市场调研公司的数据显示,亚马逊网站开发的推荐系统的销售转化率可以高达60%。从根本上讲,这家零售巨头的推荐系统推荐的基础是一系列基本元素:用户过去购买过哪些商品;他们的虚拟购物车里有什么;哪些商品被他们评价或“赞”过;其他用户浏览及购买了哪些东西。亚马逊把这套自主研发的算法称为“从项目到项目的协同过滤算法”。依靠这套算法,亚马逊向回头客提供了深度定制的浏览体验。数码爱好者们会发现亚马逊上满是新潮电子产品的推荐,而新妈妈们在相同的位置看到的却是婴幼儿产品。