适用范围:大数据的排序、去重。
原理及要点:外排序的归并方法、置换选择+败者树原理、最优归并树。
问题实例:有一个1GB大小的文件,里面每一行是一个词,词的大小不超过16个字节,内存限制大小是1MB。返回频数最高的100个词。
这个数据具有很明显的特点,词的大小为16个字节,但是内存只有1MB,做hash有些不够,所以可以用来排序。内存可以用作途输入缓冲区。
关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 版权所有: 红黑联盟--致力于做最好的IT技术学习网站