图片相似算法D-Hash,PHP版本

简单识别图片相似度。使用PHP实现

在网上查了写资料,这里作为整理,比较高级的算法这里不讨论,这里仅仅说一下php容易实现的简单算法。算法的思路是对图片进行压缩处理,得到特征hash,然后对比hash进行监测相似度。

这类算法称为:感知哈希算法,包括aHash、pHash、dHash。顾名思义,感知哈希不是以严格的方式计算Hash值,而是以更加相对的方式计算哈希值,因为“相似”与否,就是一种相对的判定。

以下来自网络,没有实际测试:

aHash:平均值哈希。速度比较快,但是常常不太精确。
pHash:感知哈希。精确度比较高,但是速度方面较差一些。
dHash:差异值哈希。Amazing!精确度较高,且速度也非常快。因此我就选择了dHash作为我图片判重的算法。

<?php
/**
 * Created by: newsgao <[email protected]>
 * Time: 2018/5/24 16:41
 */
$_start = microtime(true);
$hash_1 = dHash("./1.jpg");
$hash_2 = dHash("./2.jpg");
echo "汉明距离:" . getLeng($hash_1, $hash_2) . "\n";
$_end = microtime(true);
echo "耗时:" . round(($_end - $_start) * 1000, 4) . "ms ";
echo "内存:" . round(memory_get_usage() / 1024, 3) . "KB \n";
/**
 * 根据图片路径获取图片指纹
 * @param $src
 * @return bool|string
 */
function dHash($src)
{
    if (!file_exists($src)) {
        return false;
    }
    $info = getimagesize($src);
    if ($info === false) {
        return false;
    }
    $w   = 9;  // 采样宽度
    $h   = 8;  // 采样高度
    $dst = imagecreatetruecolor($w, $h);
    $img = imagecreatefromstring(file_get_contents($src));
    // 缩放
    $img && imagecopyresized($dst, $img, 0, 0, 0, 0, $w, $h, $info[0], $info[1]);
    $hash = '';
    for ($y = 0; $y < $h; $y++) {
        $pix = getGray(imagecolorat($dst, 0, $y));
        for ($x = 1; $x < $w; $x++) {
            $_pix = getGray(imagecolorat($dst, $x, $y));
            $_pix > $pix ? $hash .= '1' : $hash .= '0';
            $pix = $_pix;
        }
    }
    $hash = base_convert($hash, 2, 16);
    //imagejpeg($dst,"$hash.jpg");
    return $hash;
}

/**
 * 获取像素点的灰度值
 * @param $rgb
 * @return int
 */
function getGray($rgb)
{
    $r = ($rgb >> 16) & 0xFF;
    $g = ($rgb >> 8) & 0xFF;
    $b = $rgb & 0xFF;
    return intval(($r + $g + $b) / 3) & 0xFF;
}

/**
 * 获取汉明距离
 * @param $dhash_1
 * @param $dhash_2
 */
function getLeng($dhash_1, $dhash_2)
{
    $tem = hex2bin($dhash_1) ^ hex2bin($dhash_2);
    $tem = bin2hex($tem);
    $tem = base_convert($tem, 16, 2);
    return substr_count($tem, '1');
}

猜你喜欢

转载自blog.51cto.com/13640989/2532170
今日推荐