哈希技术杂烩

2170阅读 0评论2015-09-20 梦醒潇湘love
分类:C/C++


    普通的哈希算法暂且不讲了,我们探讨下哈希技术的各种应用。
    1、一致性哈希,这个在分布式系统用途非常广泛。
    2、局部敏感哈希LSH:simhash和minhash,key用于相似度检测等,谷歌有篇文章利用LSH进行网页去重。
    3、布龙过滤器,判断一个元素是否在一个集合中。
    4、在数据流算法中哈希算法应用更加广泛,比如数据流中独立元素计数等。
    5、特征哈希,近几年在nips等机器学习会议上,将特征使用minhash进行压缩,降低数据量,这里可以对minhash进行改进,比如b-bit minhash。
    

    感谢原作者。    
    http://blog.csdn.net/dm_ustc/article/details/45569569
上一篇:Hadoop Streaming编程
下一篇:没有了