「算法笔记」判断两个文本的相似度simhash算法

在项目中,有时客户需要判定两个文本的差异比较,求出差异的内容。二进制串A 和 二进制串B 的海明距离 就是 A xor B 后二进制中1的个数。