simhash

9772阅读 0评论2012-06-15 playmud
分类:云计算

今天看了一下simhash,原理上就是bitmap的比较,当然精度上跟bitmap差一些,海明距离可以理解成不同元素的数量。其实google的东西大多数是为了google的应用场景搞出来,不一定适合其他场景。跟hadoop或者说bigtable不适合普通用户的场景一样,但是没办法,google是以技术见长的大公司,跟风者众~
当然google也有很多适合普遍场景的很多技术。
上一篇:redis命令
下一篇:可疑数据的取舍方法