java集合Map,List与Set的区别

Set,List,Map的区别

java集合主要分为三种类型:

  1. Set(集)
  2. List(列表)
  3. Map(映射)

要深入理解集合首先要了解我们熟悉的数组:

数组是大小固定的,并且同一个数组只能存放类型一样的数组(基本类型/引用类型),而JAVA集合可以存储和操作数目不固定的一组数据。所有的JAVA集合都位于java.util包中!!!java集合只能存放引用类型的数据,不能存放基本数据类型。

简单说下集合和数组的区别(参考文章:数据结构之数组

  1. 世界上本来没有集合,(只有数组参考C语言)但有人想要,所以有了集合。
  2. 有人想要可以自动扩展的数组,所以有了List。
  3. 有人想要没有重复的数组,所有有了Set。
  4. 有人想有自动排序的组数,所有有了TreeSet,TreeList,Tree**。
  5.   
  6. 而几乎有的集合都是基于数组来实现的。
  7. 因为集合是对数组做的封装,所以,数组永远比任何一个集合要快。
  8.  
  9. 但任何一个集合,比数组提供的功能要多
  10.  
  11. 一,数组声明了它容纳的元素的类型,而集合不声明。这是由于集合以object形式来存储他们的元素。
  12. 二,一个数组实例具有固定的大小,不能伸缩。集合则可根据需要动态改变大小。
  13. 三,数组是一种可读/可写数据结构------没有办法创建一个只读数组。然而可以使用集合提供的ReadOnly方法,以只读方式来使用集合,该方法将返回一个集合的只读版本。

 Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

1

效率高,但容量固定切无法动态改变。

array还有一个缺点就是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

2

java中有一个Arrays类,专门用来操作array。

arrays中拥有一组static函数,

equals():比较两个array是否相等。array拥有相同元素个数,且所对应元素两两相等。

fill():将值填入array中。

sort():用来对array进行排序。

binarySearch():在排好序的array中寻找元素。

System。arraycopy():array的复制。

若攥写程序不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适合。所以就要用到集合。

那我们开始讨论java中的集合。

集合分类:

Collection:List,Set

Map:HashMap,hashTable

1.1 Collection接口

Collection是最基本的集合接口,声明了适合java集合(只包括Set和List)的通用方法。Set和List都继承了Collection,Map。

1.1.1 Collection接口方法:

  1. boolean add(Object o):想集合众加入一个对象的引用。
  2.  
  3. void clear():删除集合中所有的对象,即不再持有这些对象的引用。
  4.  
  5. boolean isEmpty():判断集合是否为空。
  6.  
  7. boolean contains(Object o):判断集合中是否持有特定对象的引用
  8.  
  9. Iterartor iterator():返回一个Iterator对象,可以用来遍历集合中的元素。
  10.  
  11. boolean remove(Object o):从集合中删除一个对象的引用
  12.  
  13. int size():返回集合中元素的数目。
  14.  
  15. Object【】 toArray():返回一个数组,该数组中包括集合中的所有元素。

关于Iterator()和toArray()方法都用于集合所有的元素,前者返回一个Iterator对象,后者返回一个包含集合中所有元素的数组。

1.1.2 Iterator接口声明了如下方法:

  1. hasNext():判断集合众元素是否遍历完毕,如果没有,就返回true。
  2.  
  3. next():返回下一个元素。
  4.  
  5. remove():从集合中删除上一个next()方法返回的元素。

1.2 Set(集合)

Set是最简单的一种集合。集合中的对象不安特定的方式排序,并且没有重复对象。Set接口主要实现了两个实现类:

  • HashSet:HashSet类按照哈希算法来存取集合中的对象,存取速度比较快
  • TreeSet:TreeSet类实现了SortedSet接口,能够对集合中的对象进行排序。

Set用法:存放的是对象的引用,没有重复对象。

    Set set = new HashSet();
    String s1 = new String("Hello");
    String s2 = s1;
    String s3 = new String("world");
    set.add(s1);
    set.add(s2);
    set.add(s3);
    System.out.println(set.size());
    //打印集合众对象的数目为2

Set的add()方法是如何判断对象是否已经存放在集合中?

    boolean isExists = false;
    Iterator iterator = set.iterator();
    while(iterator.hasNext()){
        String oldStr = iterator.next();
        if(newStr.equals(oldStr)){
            isExits = true;
        }
    }

Set的功能和方法

Set具有与Collection完全一样的接口,因此没有任何额外的功能,不像前面两个不同的List。实际上Set就是Collection,只是行为不同。(这是继承与多态思想的典型应用:表现不同的行为。)Set不保存重复的元素(至于如何判断元素相同则较为复杂)

Set:存入Set的每个元素都必须是唯一的,因为Set不保存重复元素。加入Set的元素必须定义equals()方法以确保对象的唯一性。Set与Collection有完全一样的接口。Set接口不保证维护元素的次序。

HashSet:为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。

TreeSet:保存次序的Set,底层为树结构。使用它可以从Set中提取有序idea序列。

LinkedHashSet:具有HashSet的查询速度,切内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set,结果会按元素插入的次序显示。

1.3 List(列表)

List的特征是其元素以线性方式存储,集合中存放重复对象。

List接口主要实现类包括(参考文章:ArrayList与LinkedList的区别)

  • ArrayList():代表长度可以改变的数组。可以对元素进行随机的访问,向ArrayList()中插入与删除元素的速度慢。
  • LinkedList():在现实中采用链表数据结构,插入和删除速度快,访问速度慢。

对于List的随机访问来说,就是只随机来检索位于特定位置的元素,List的get(int index)方法返回集合中由参数index指定的索引位置的对象,下标从“0”开始。最基本的两种检索集合中的所有对象的方法:

1:for循环和get()方法

for( int i=0;i<list.size();i++){

    System.out.println(list.get(i));

}

2:使用迭代器(iterator)

Iterator it = list.iterator();

while(it.hasNext()){

     System.out.println(it.next());

}

List的功能方法

实际上有两种List:一种是基本的ArrayList,其优点在于随机访问元素,另一种是更强大的LinkedList,它并不是为快速随机访问设计的,而是具有一套通用的方法。

  • List:次序是List最重要的特点:它保证维护元素特定的顺序。List为Collection添加了许多方法,使得能够向List中间插入与移除元素(这只推荐LinkedList使用。)一个List可以生成Listiterator,使用它可以从两个方向遍历List,也可以从List中间插入和移除元素。
  • ArrayList:由数组实现的List。允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来向后向前遍历ArrayList,而不是用来插入和移除元素。因为那比LinkedList开销要大很多。
  • LinkedList:对顺序访问进行了优化,向List中间插入与删除的开销并不大。随机访问则相对较慢(使用ArrayList代替)。还具有下列方法:addFirst(),addLast(),getLast(),removeFirst()和removeFirst()。这些方法(没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈,队列和双向队列使用。

1.4 Map(映射)

    Map是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。Map没有继承于Collection接口从Map集合中检索元素时,只要给出键对象,就会返回对应的值对象。

    Map的常用方法:

    1.添加,删除操作:

Object put(Object key,Object value):向集合中加入元素。

Object remove(Object key):删除与KEY相关的元素。

void putAll(Map t):将来自特定映像的所有元素添加给该映像。

void clear():从映像中删除所有映射。

   2.查询操作:

   Object get(Object key):获得与关键字key相关的值,Map集合中的键对象不允许重复,也就是说,任意两个键对象通过equals()方法比较的结果都是false,但是可以将任意多个键独享映射到同一个值对象上。

   Map的功能方法

   方法put(Object key,Object value)添加一个“值”(想要得东西)和与“值”相关联的“键”(key)(使用它来查找)。方法get(Object key)返回与给定“键”相关联的“值”。可以用containsKey()和containsValue()测试Map中是否包含某个“键”或“值”。标准的java类库中包含了几种不同的Map:

HashMap,TreeMap,LinkedHashMap,WeakHashMap,IdentityHashMap。它们都有同样的基本接口Map,但是行为,效率,排序策略,保存对象的生命周期和判定“键”等价的策略等各不相同。

   执行效率是Map的一个大问题。看看get()要做哪些事,就会明白为什么在ArrayList中搜索“键”是相当慢的。而这正是HashMap提高速度的地方。HashMap使用特殊的值,称为“散列码”(hash code),来取代对键的缓慢搜索。“散列码”是相对唯一“用以代表对象的int值,它是通过将该对象的某些信息进行转换而生成的。所有Java对象都能产生散列码,因为hashCode()是定义在基类Object中的方法。

   HashMap就是适用对象的hashCode()进行快速查询的。此方法能够显著提高性能。

   Map:维护”键值对“的关联性,使你可以通过”键“查找”值“。

   HashMap:Map基于散列表的实现,插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子loadfactor,以调整容器的性能。

   LinkedHashMap:类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。

   TreeMap:基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在于,你得到的结果经过排序的。TreeMap是唯一的带有subMap()方法,它可以返回一个子树。

   WeakHashMap:弱键(weak key)Map,Map中使用的对象也被允许释放,这是因为解决特殊问题设计的。如果没有map之外的引用指向某个“键 ”,则此“键”可以被垃圾收集器回收。

     IdentifyHashMap:使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。

1.4 区别

1.4.1 Collection 和 Map的区别

容器内每个为之所存储的元素个数不同。

Collection类型者,每个位置只有一个元素。

Map类型者,持有key-value pair,像个小型数据库。

1.4.2 各自旗下的子类关系

 Collection

 --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同:ArrayList/LinkedList/Vector

 --Set: 不能含有重复的元素:HashSet/TreeSet

 --Map:HashMap,HashTable,TreeMap

1.4.3其他特征

  List,Set,Map将持有对象一律视为Object类型。

  Collection,List,Set,Map都是接口,不能实例化。

  继承自它们的ArrayList,Vector,HashTable,HashMap是具像class,这些才可被实例化。

  vector容器确切知道它所持有的对象隶属什么类型,vector不能进行边界检查

总结

  1. 如果涉及到堆栈,队列等操作,应该考虑用List,对于需要快速插入,删除元素,应该使用LinkedList,如果需要快速随机访问元素,应该使用ArrayList。
  2. 如果程序在单线程环境中,或者访问仅仅在一个线程中进行,考虑非同步的类,其效率较高,如果多个线程可能同时操作一个类,应该使用同步的类。
  3. 在除需要排序使用TreeSet,TreeMap外,都应使用HashSet,HashMap。因为他们的效率更高。
  4. 需要特别注意对哈希表的操作,作为key的对象要正确复写equals和hashCode方法。
  5. 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。一旦将对象置入容器内,便损失了该对象的型别信息。
  6. 尽量返回接口而非实际的类型,如返回List而非ArrayList,这样如果以后需要将ArrayList换成LinkedList时,客户端代码不用改变,这就是针对抽象编程。

注意

  1. Collection没有get()方法来取得某个元素。只能通过iterator遍历元素。
  2. Set和Collection拥有一模一样的接口。
  3. List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0).。。。(add/get)。
  4. 一般使用ArrayList,用LinkedList构造堆栈stack,队列queue。
  5. Map用put(k,v)/get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。HashMap会利用对象的HashCode来快速查找key。
  6. Map中元素,可以将key序列,value序列单独抽取出来。

        使用keySet()抽取key序列,将map中的所有keys生成一个Set。

        使用values()抽取value序列,将map中的所有value生成一个Collection。

        为什么一个生成Set,一个生成Collection,那是因为key总是独一无二的,value允许重复。

   

   

   


 

猜你喜欢

转载自blog.csdn.net/qq_31026587/article/details/82751041