union-find上(quick-find)算法

声明:
主要代码和部分算法说明参考自算法(第四版),这里将代码列出,是想和大家交流一些学习心得。

1.前言

先不多说上图,请大家仔细观察下面的图片(有玄机),看完之后我有非常深奥的问题想要问大家。
这里写图片描述
问题1:
数字0和数字1相连吗?
问题2:
数字2和数字3相连吗?
看到这里可能有人要在下面留言喷我,先等等,上面的图片大家一眼就会看出答案,但是那只是因为上面图片只有10个数字,但是如果有上百万,乃至上千万个数字呢?到那时,任意两个数字之间的关系都是错综复杂的,凭借肉眼是无法做出判断的。
那么今天的主角,也就是union-find算法就可以完美解决这个问题。

2.算法用途

2.1网络
可以把这些整数看成网络中的计算机,而有无链接可以判断是否需要在两个计算机之间架设连接。
2.2变量名等价性
当有多个引用指向同一对象时,系统需要能够判断两个给定的变量名是否等价。
2.3数学集合
可以将输入的所有整数看做属于不同的数学集合,在处理一个整数对时,判断他们是否属于相同集合。
2.4人际关系
用于判断两个人是否直接或间接(通过他们的朋友)认识。

3.名词介绍

触点:
上面数字0-9每个数字称作一个触点。
连通分量:
每个相连触点的连接集合称作一个连通分量,上面有两个连通分量一个是0、1、2、6、7,另外一个连通分量是3、4、8、9。

4.实现思路

模拟数据:
用程序读取文件tinyUF.txt,文件中有成对出现的数字,每对数字看做一个连接。
文件:
这里写图片描述
实现每个连通分量内部的逻辑连接:
在计算机中,我们当然不能像在纸上一样,用笔将各个数字连接起来。所以这里我们采用一种逻辑连接的方式,即给每个触点一个标识符(以下统称为分量值),直接或间接相连的触点间具有相同的分量值,并因为触点和连通标识都是数字,所以我们采用int数组来完成这个操作。
数组的角标为0-9,分别对应着上面各个数字i(触点),然后以此数字为角标的数组中的值为分量值,
例:触点3的标识值=数组[3]

5.算法API

这里写图片描述
除此之外UF类的有两个成员变量如下:
这里写图片描述

6.算法实现

6.1实现UF(int N)
目标:
初始化count值;
初始化id[],角标为各个触点0-9,数组中的值(分量值),我们不妨先设为0-9。即开始时触点0所在的连通分量(其实只有它自己)的分量值为0.
代码实现:

    //构造方法
    public UF(int N){
        count = N; //开始时,有N个分量,每个触点都构成了只含它自己的分量
        //初始化分量数组
        id = new int[N];
        for(int i=0;i<N;i++) id[i] = i;
    }

6.2实现count()
目标:
返回count值
代码实现:

    //连通分量的数量
    public int count(){
        return count;
    }

6.3实现find(int p)
目标:
用于返回该触点的分量值
代码:

    //查找p或q所在分量的标识量
    public int find(int p){
        return id[p];
    }

6.4实现connected(int p,int q)
目标:判断p、q是否直接或间接相连
判断依据:根据二者的分量值是否相等
代码:

    //判断p和q是否已连接
    public boolean connected(int p,int q){
        return find(p) == find(q); //依据:判断二者标识量是否相等
    }

6.5实现union(int p,int q)
目标:
首先判断两个触点是否已经连接,如果没有连接,我们将p所在分量的分量值改为q所在分量的分量值。(当然用p代替q也可以)
代码:

    //连接p和(将p和q归并到相同分量中)
    public void union(int p,int q){
        int pID = id[p]; //找到p的分量值
        int qID = id[q]; //找到q的分量值
        //二者已经连通,则结束这个方法
        if(pID == qID) return; 
        //前提:当p和q连接时,我们不妨让p的值都改为q的值(当然q改为p的值也可以)
        for(int i=0;i<id.length;i++){
            //找到所有和p相连的触点,然后把这些触点的分量值都改为q的分量值
            //即:将这些触点和p所在分量连接
            if(id[i] == pID) id[i] = qID;
        }
        count--; //每进行一次连接,则分量数减1
    }

6.6测试代码

    //测试
    public static void main(String[] args) {
        int N = StdIn.readInt(); //读取触点数
        UF uf = new UF(N); 
        while(!StdIn.isEmpty()){
            int p = StdIn.readInt(); //读取前一个数
            int q = StdIn.readInt(); //读取后一个数
            if(uf.connected(p, q)) continue; //如果已经连接,则继续向下读取
            uf.union(p, q); //连接p、q
            StdOut.println(p + " " + q); //打印刚刚建立的连接
        }
        StdOut.println(uf.count + " components"); //打印连通分量的数量
    }

最后输出结果:
这里写图片描述

7.测试步骤

用debug跟踪程序:
并把上面的文件tinyUF.txt作为main方法的参数输入。
原始数组:0 1 2 3 4 5 6 7 8 9

p:4 q:3
数组:0 1 2 3 3 5 6 7 8 9
这里写图片描述

p:3 q:8
数组:0 1 2 8 8 5 6 7 8 9
这里写图片描述

p:6 q:5
数组:0 1 2 8 8 5 5 7 8 9
这里写图片描述

p:9 q:4
数组:0 1 2 8 8 5 5 7 8 8
这里写图片描述

p:2 q:1
数组:0 1 1 8 8 5 5 7 8 8
这里写图片描述

p:8 q:9
数组:0 1 1 8 8 5 5 7 8 8(无变化,因为已经连接)
这里写图片描述

p:5 q:0
数组:0 1 1 8 8 0 0 7 8 8
这里写图片描述

p:7 q:2
数组:0 1 1 8 8 0 0 1 8 8
这里写图片描述

p:6 q:1
数组:1 1 1 8 8 1 1 1 8 8
这里写图片描述

p:1 q:0
数组:1 1 1 8 8 1 1 1 8 8(无变化,因为已经连接)
这里写图片描述

p:6 q:7
数组:1 1 1 8 8 1 1 1 8 8(无变化,因为已经连接)
这里写图片描述

总之我们可以根据connected(int p,int q)方法判断出两个触点是否连接,但是此算法却有个缺陷,即在每次调用union(int p,int q)方法时,都需要遍历整个数组。所以quick-find只适合处理小规模的数据。所以我们需要优化union方法,具体见中篇:
http://blog.csdn.net/qq_32293345/article/details/78825280

8.完整代码

import edu.princeton.cs.algs4.StdIn;
import edu.princeton.cs.algs4.StdOut;

//p138  union-find算法
public class UF {
    private int[] id; //存储分量的数组,以触点作为索引
    private int count; //分量数量

    //构造方法
    public UF(int N){
        count = N; //开始时,有N个分量,每个触点都构成了只含它自己的分量
        //初始化分量数组
        id = new int[N];
        for(int i=0;i<N;i++) id[i] = i;
    }

    //连接p和(将p和q归并到相同分量中)
    public void union(int p,int q){
        int pID = id[p]; //找到p的分量值
        int qID = id[q]; //找到q的分量值
        //二者已经连通,则结束这个方法
        if(pID == qID) return; 
        //前提:当p和q连接时,我们不妨让p的值都改为q的值(当然q改为p的值也可以)
        for(int i=0;i<id.length;i++){
            //找到所有和p相连的触点,然后把这些触点的分量值都改为q的分量值
            //即:将这些触点和p所在分量连接
            if(id[i] == pID) id[i] = qID;
        }
        count--; //每进行一次连接,则分量数减1
    }

    //查找p或q所在分量的标识量
    public int find(int p){
        return id[p];
    }

    //判断p和q是否已连接
    public boolean connected(int p,int q){
        return find(p) == find(q); //依据:判断二者标识量是否相等
    }

    //连通分量的数量
    public int count(){
        return count;
    }

    //测试
    public static void main(String[] args) {
        int N = StdIn.readInt(); //读取触点数
        UF uf = new UF(N); 
        while(!StdIn.isEmpty()){
            int p = StdIn.readInt(); //读取前一个数
            int q = StdIn.readInt(); //读取后一个数
            if(uf.connected(p, q)) continue; //如果已经连接,则继续向下读取
            uf.union(p, q); //连接p、q
            StdOut.println(p + " " + q); //打印刚刚建立的连接
        }
        StdOut.println(uf.count + " components"); //打印连通分量的数量
    }

}

猜你喜欢

转载自blog.csdn.net/qq_32293345/article/details/78820208