(1)
算法:海量日志数据,提取出某日访问百度次数最多的那个IP
http://blog.csdn.net/tayanxunhua/article/details/20528389
(2)
bitmap与2bitmap实现
在2.5亿个整数找出不重复的整数,内存不足以容纳着2.5亿个整数
(3)java海量数据处理方法大全
http://wenku.baidu.com/link?url=3o0NPeu2kRvKqE5gXvojP0BSgJKtVq43dIajm9x7Metbe21djWQXBiZubAYtGtzGBjQTIfnb8G-r6d_0pKPmlp8uHNWi7peQU5ceEy_kIO_