Java基础知识--集合框架--Set及其实现类

一.Set的定义和概念:
Set是Collection子接口，模拟了数学上的集的概念。
Set集合存储特点:
1):不允许元素重复.
2):不会记录元素的先后添加顺序.

Set只包含从Collection继承的方法，不过Set无法记住添加的顺序，不允许包含重复的元素。当试图添加两个相同元素进Set集合，添加操作失败，add()方法返回false。
Set判断两个对象是否相等用**equals,**而不是使用==。也就是说两个对象equals比较返回true，Set集合是不会接受这个两个对象的。

二.HashSet
HashSet是Set接口最常用的实现类,顾名思义,底层才用了哈希表(散列/hash)算法.
其底层其实也是一个数组,存在的意义是提供查询速度,插入速度也比较快,但是适用于少量数据的插入操作.

在HashSet中如何判断两个对象是否相同问题:
1):两个对象的equals比较相等. 返回true,则说明是相同对象.
2):两个对象的hashCode方法返回值相等.

对象的hashCode值决定了在哈希表中的存储位置.
二者:缺一不可.
当往HashSet集合中添加新的对象的时候,先回判断该对象和集合对象中的hashCode值:
1):不等: 直接把该新的对象存储到hashCode指定的位置.
2):相等: 再继续判断新对象和集合对象中的equals做比较.
1>:hashCode相同,equals为true: 则视为是同一个对象,则不保存在哈希表中.
2>:hashCode相同,equals为false:非常麻烦,存储在之前对象同槽为的链表上(拒绝,操作比较麻烦).
对象的hashCode和equals方法的重要性:
每一个存储到hash表中的对象,都得提供hashCode和equals方法,用来判断是否是同一个对象.
存储在哈希表中的对象,都应该覆盖equals方法和hashCode方法,并且保证equals相等的时候,hashCode也应该相等.

三.LinkedHashSet类
List接口: 允许元素重复,记录先后添加顺序.
Set接口: 不允许元素重复,不记录先后添加顺序.
需求: 不允许元素重复,但是需要保证先后添加的顺序.
LinkedHashSet:底层才有哈希表和链表算法.
哈希表:来保证唯一性,.此时就是HashSet,在哈希表中元素没有先后顺序.
链表: 来记录元素的先后添加顺序.
在这里插入图片描述
四.TreeSet类
TreeSet集合底层才有红黑树算法,会对存储的元素默认使用自然排序(从小到大).
注意: 必须保证TreeSet集合中的元素对象是相同的数据类型,否则报错.
TreeSet的排序规则:
自然排序(从小到大):
TreeSet调用集合元素的compareTo方法来比较元素的大小关系,然后讲集合元素按照升序排列(从小到大).
注意:要求TreeSet集合中元素得实现java.util.Comparable接口.
在这里插入图片描述
java.util.Comparable接口:可比较的.
覆盖 public int compareTo(Object o)方法,在该方法中编写比较规则.
在该方法中,比较当前对象(this)和参数对象o做比较(严格上说比较的是对象中的数据,比如按照对象的年龄排序).
this > o: 返回正整数. 1
this < o: 返回负整数. -1
this == o: 返回0. 此时认为两个对象为同一个对象.

在TreeSet的自然排序中,认为如果两个对象做比较的compareTo方法返回的是0,则认为是同一个对象.

定制排序(从大到小,按照名字的长短来排序):
在TreeSet构造器中传递java.lang.Comparator对象.并覆盖public int compare(Object o1, Object o2)再编写比较规则.

对于TreeSet集合来说,要么使用自然排序,要么使用定制排序.
判断两个对象是否相等的规则:
自然排序: compareTo方法返回0;
定制排序: compare方法返回0;

五.Set实现类的性能对比的总结
在这里插入图片描述
Set接口的实现类:
共同的特点:
1):都不允许元素重复.
2):都不是线程安全的类.
解决方案:Set s = Collections.synchronizedSet(Set对象);
HashSet: 不保证元素的先后添加顺序.
底层才有的是哈希表算法,查询效率极高.
判断两个对象是否相等的规则:
1):equals比较为true.
2):hashCode值相同.
要求:要求存在在哈希中的对象元素都得覆盖equals和hashCode方法.

LinkedHashSet:
HashSet的子类,底层也采用的是哈希表算法,但是也使用了链表算法来维持元素的先后添加顺序.
判断两个对象是否相等的规则和HashSet相同.
因为需要多使用一个链表俩记录元素的顺序,所以性能相对于HashSet较低.
一般少用, 如果要求一个集合既要保证元素不重复,也需要记录添加先后顺序,才选择使用LinkedHashSet.

TreeSet:
不保证元素的先后添加顺序,但是会对集合中的元素做排序操作.
底层才有红黑树算法(树结构,比较擅长做范围查询).
TreeSet要么才有自然排序,要么定制排序.
自然排序: 要求在TreeSet集合中的对象必须实现java.lang.Comparable接口,并覆盖compareTo方法.
定制排序: 要求在构建TreeSet对象的时候,传入一个比较器对象(必须实现java.lang.Comparator接口).
在比较器中覆盖compare方法,并编写比较规则.
TreeSet判断元素对象重复的规则:
compareTo/compare方法是否返回0.如果返回0,则视为是同一个对象.
HashSet做等值查询效率高,TreeSet做范围查询效率高.
而我们更多的情况,都是做等值查询, 在数据库的索引中做范围查询较多,所以数结构主要用于做索引,用来提高查询效率.

附录:HashSet的实现原理
（1）基于HashMap实现的，默认构造函数是构建一个初始容量为16，负载因子为0.75 的HashMap。封装了一个 HashMap 对象来存储所有的集合元素，所有放入 HashSet 中的集合元素实际上由 HashMap 的 key 来保存，而 HashMap 的 value 则存储了一个 PRESENT，它是一个静态的 Object 对象。

（2）当我们试图把某个类的对象当成 HashMap的 key，或试图将这个类的对象放入 HashSet 中保存时，重写该类的equals(Object obj)方法和 hashCode() 方法很重要，而且这两个方法的返回值必须保持一致：当该类的两个的 hashCode() 返回值相同时，它们通过 equals() 方法比较也应该返回 true。通常来说，所有参与计算 hashCode() 返回值的关键属性，都应该用于作为 equals() 比较的标准。

（3）HashSet的其他操作都是基于HashMap的。

它是基于HashMap实现的，HashSet底层使用HashMap来保存所有元素，因此HashSet 的实现比较简单，相关HashSet的操作，基本上都是直接调用底层HashMap的相关方法来完成， HashSet的源代码如下：

import java.util.AbstractSet;
import java.util.Collection;
import java.util.HashMap;
import java.util.LinkedHashMap;
import java.util.Set;
 
import javax.swing.text.html.HTMLDocument.Iterator;
 
public class HashSet<E> 
          extends AbstractSet<E> 
          implements Set<E>, Cloneable, java.io.Serializable 
{ 
static final long serialVersionUID = -5024744406713321676L; 
 
// 底层使用HashMap来保存HashSet中所有元素。 
private transient HashMap<E,Object> map; 
   
// 定义一个虚拟的Object对象作为HashMap的value，将此对象定义为static final。 
private static final Object PRESENT = new Object(); 
 
  
//  默认的无参构造器，构造一个空的HashSet。
//  
//  实际底层会初始化一个空的HashMap，并使用默认初始容量为16和加载因子0.75。
   
public HashSet() { 
map = new HashMap<E,Object>(); 
} 
 
  
//  构造一个包含指定collection中的元素的新set。
// 
//  实际底层使用默认的加载因子0.75和足以包含指定
//  collection中所有元素的初始容量来创建一个HashMap。
//  @param c 其中的元素将存放在此set中的collection。
  
public HashSet(Collection<? extends E> c) { 
map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16)); 
addAll(c); 
} 
 
  
//  以指定的initialCapacity和loadFactor构造一个空的HashSet。
// 
//  实际底层以相应的参数构造一个空的HashMap。
// @param initialCapacity 初始容量。
//  @param loadFactor 加载因子。
    
public HashSet(int initialCapacity, float loadFactor) { 
map = new HashMap<E,Object>(initialCapacity, loadFactor); 
} 
 
  
//  以指定的initialCapacity构造一个空的HashSet。
// 
//  实际底层以相应的参数及加载因子loadFactor为0.75构造一个空的HashMap。
//  @param initialCapacity 初始容量。
  
public HashSet(int initialCapacity) { 
map = new HashMap<E,Object>(initialCapacity); 
} 
 
 
//  以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。
//  此构造函数为包访问权限，不对外公开，实际只是是对LinkedHashSet的支持。
// 
//  实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。
//  @param initialCapacity 初始容量。
//  @param loadFactor 加载因子。
//  @param dummy 标记。
    
HashSet(int initialCapacity, float loadFactor, boolean dummy) { 
map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor); 
} 
 
  
//  返回对此set中元素进行迭代的迭代器。返回元素的顺序并不是特定的。
// 
// 底层实际调用底层HashMap的keySet来返回所有的key。
//  可见HashSet中的元素，只是存放在了底层HashMap的key上，
//  value使用一个static final的Object对象标识。
//  @return 对此set中元素进行迭代的Iterator。
 
 public Iterator<E> iterator() { 
     return map.keySet().iterator(); 
 
} 
  
// 返回此set中的元素的数量（set的容量）。
// 
//  底层实际调用HashMap的size()方法返回Entry的数量，就得到该Set中元素的个数。
//  @return 此set中的元素的数量（set的容量）。
   
public int size() { 
return map.size(); 
} 
 
  
//  如果此set不包含任何元素，则返回true。
// 
//  底层实际调用HashMap的isEmpty()判断该HashSet是否为空。
//  @return 如果此set不包含任何元素，则返回true。
  
public boolean isEmpty() { 
return map.isEmpty(); 
} 
 
  
//  如果此set包含指定元素，则返回true。
//  更确切地讲，当且仅当此set包含一个满足(o==null ? e==null : o.equals(e))
//  的e元素时，返回true。
//
//  底层实际调用HashMap的containsKey判断是否包含指定key。
// @param o 在此set中的存在已得到测试的元素。
// @return 如果此set包含指定元素，则返回true。
   
public boolean contains(Object o) { 
return map.containsKey(o); 
} 
 
 
// 如果此set中尚未包含指定元素，则添加指定元素。
// 更确切地讲，如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))
// 的元素e2，则向此set 添加指定的元素e。
// 如果此set已包含该元素，则该调用不更改set并返回false。
//
// 底层实际将将该元素作为key放入HashMap。
// 由于HashMap的put()方法添加key-value对时，当新放入HashMap的Entry中key
//与集合中原有Entry的key相同（hashCode()返回值相等，通过equals比较也返回true），
//新添加的Entry的value会将覆盖原来Entry的value，但key不会有任何改变，
//  因此如果向HashSet中添加一个已经存在的元素时，新添加的集合元素将不会被放入HashMap中，
//  原来的元素也不会有任何改变，这也就满足了Set中元素不重复的特性。
//  @param e 将添加到此set中的元素。
//  @return 如果此set尚未包含指定元素，则返回true。
  
public boolean add(E e) { 
       return map.put(e, PRESENT)==null; 
} 
 
//  如果指定元素存在于此set中，则将其移除。
//  更确切地讲，如果此set包含一个满足(o==null ? e==null : o.equals(e))的元素e，
//  则将其移除。如果此set已包含该元素，则返回true
// （或者：如果此set因调用而发生更改，则返回true）。（一旦调用返回，则此set不再包含该元素）。
// 
//  底层实际调用HashMap的remove方法删除指定Entry。
//  @param o 如果存在于此set中则需要将其移除的对象。
//  @return 如果set包含指定元素，则返回true。
  
public boolean remove(Object o) { 
return map.remove(o)==PRESENT; 
} 
 
  
//  从此set中移除所有元素。此调用返回后，该set将为空。
// 
//  底层实际调用HashMap的clear方法清空Entry中所有元素。
  
public void clear() { 
map.clear(); 
} 
  
//  返回此HashSet实例的浅表副本：并没有复制这些元素本身。
 
//  底层实际调用HashMap的clone()方法，获取HashMap的浅表副本，并设置到HashSet中。
  
public Object clone() { 
    try { 
        HashSet<E> newSet = (HashSet<E>) super.clone(); 
        newSet.map = (HashMap<E, Object>) map.clone(); 
        return newSet; 
    } catch (CloneNotSupportedException e) { 
        throw new InternalError(); 
    } 
} 
}

范亚明

发布了99 篇原创文章 · 获赞 2 · 访问量 2605

私信关注

Java基础知识--集合框架--Set及其实现类

猜你喜欢