数据量比较大的两个集合,求交集和差集

  

1、求交集

1.1、使用 retainAll 函数求交集


import java.util.*;

/**
 * 求交集 1
 */
public class ListIntersection1 {
    
    

    public static void main(String[] args) {
    
    

        List<String>  listA = new ArrayList<String>();
        for (int i= 1; i<=200000; i++)
          listA.add(String.valueOf(i));
        System.out.println("listA 集合长度 : " + listA.size());

        List<String>  listB = new ArrayList<String>();
        for (int i= 100000; i<=300000; i++)
            listB.add(String.valueOf(i));
        System.out.println("listB 集合长度 : " + listB.size());
        long startTime1 =  System.currentTimeMillis();
        // 求交集
        listA.retainAll(listB);
        System.out.println("result 集合长度 : " + listA.size());
        long endTime1 =  System.currentTimeMillis();
        long timeDif = (endTime1 - startTime1);
        System.out.println("求交集 耗时 : " + timeDif + " ms");

    }



}

 
执行结果:
 
在这里插入图片描述
 

直接导致程序处于假死状态(程序当然是还在运行).

1.2、使用 LinkedList + 迭代器求交集



import java.util.*;

/**
 * 求交集 2
 */
public class ListIntersection2 {
    
    

    public static void main(String[] args) {
    
    

        List<String>  listA = new ArrayList<String>();
        for (int i= 1; i<=2000000; i++)
          listA.add(String.valueOf(i));
        System.out.println("listA 集合长度 : " + listA.size());

        List<String>  listB = new ArrayList<String>();
        for (int i= 100000; i<=3000000; i++)
            listB.add(String.valueOf(i));
        System.out.println("listB 集合长度 : " + listB.size());
       long startTime1 =  System.currentTimeMillis();
        // 求交集
        List<String> result = receiveCollectionList(listA,listB);
        System.out.println("result 集合长度 : " + result.size());
        long endTime1 =  System.currentTimeMillis();
        long timeDif = (endTime1 - startTime1);
        System.out.println("求交集 耗时 : " + timeDif + " ms");

    }

    /**
     * 获取两个ArrayList的交集
     * @param firstArrayList 第一个 ArrayList 集合
     * @param secondArrayList 第二个 ArrayList 集合
     * @return
     */
    public static List<String> receiveCollectionList(List<String> firstArrayList, 
                                                  List<String> secondArrayList) {
    
    
        if (firstArrayList == null || firstArrayList.size() == 0
                || secondArrayList == null || secondArrayList.size() == 0)
            return  null;
        /** 大集合用 LinkedList **/
        LinkedList<String> result = new LinkedList<String>(firstArrayList);
        /** 小集合用 HashSet **/
        HashSet<String> othHash = new HashSet<String>(secondArrayList);
        /** 采用Iterator迭代器进行数据的操作 **/
        Iterator<String> iter = result.iterator();
        while(iter.hasNext()) {
    
    
            if(!othHash.contains(iter.next()))  iter.remove();
        }
        return new ArrayList<String>(result);
    }

}

 
执行结果:
 
在这里插入图片描述
 

2、求差集

2.1、使用 removeAll 函数求差集


import java.util.*;

/**
 * 求差集 1
 */
public class ListIntersection2 {
    
    

    public static void main(String[] args) {
    
    

        List<String>  listA = new ArrayList<String>();
        for (int i= 1; i<=200000; i++)
          listA.add(String.valueOf(i));
        System.out.println("listA 集合长度 : " + listA.size());

        List<String>  listB = new ArrayList<String>();
        for (int i= 100000; i<=300000; i++)
            listB.add(String.valueOf(i));
        System.out.println("listB 集合长度 : " + listB.size());
        long startTime1 =  System.currentTimeMillis();
        // 求差集,从listA列表中移除所有listB元素
        listA.removeAll(listB);
        System.out.println("result 集合长度 : " + listA.size());
        long endTime1 =  System.currentTimeMillis();
        long timeDif = (endTime1 - startTime1);
        System.out.println("求交集 耗时 : " + timeDif + " ms");

    }



}

2.2、使用 LinkedList + 迭代器求差集

/**
  * @方法描述:获取两个ArrayList的差集
  * @param firstArrayList 第一个ArrayList
  * @param secondArrayList 第二个ArrayList
  * @return resultList 差集ArrayList
  */
 public List<String> receiveDefectList(List<String> firstArrayList, List<String> secondArrayList) {
    
    
     List<String> resultList = new ArrayList<String>();
     LinkedList<String> result = new LinkedList<String>(firstArrayList);// 大集合用linkedlist
     HashSet<String> othHash = new HashSet<String>(secondArrayList);// 小集合用hashset
     Iterator<String> iter = result.iterator();// 采用Iterator迭代器进行数据的操作
     while(iter.hasNext()){
    
    
         if(othHash.contains(iter.next())){
    
    
             iter.remove();
         }
     }
     resultList = new ArrayList<String>(result);
     firstArrayList.clear();
     resultList.forEach(o-> firstArrayList.add(o));
     return firstArrayList;
 }

 
数据量达到十万、百万级时,建议使用后者

 
 
 
 
 
 
 
.

猜你喜欢

转载自blog.csdn.net/weixin_41922349/article/details/108759956