Java集合

Java集合框架概述
  • Java 集合可分为 CollectionMap 两种体系
    • Collection 接口 :单列数据,定义了存取一组对象的方法的集合
      • List:元素有序、可重复的集合
      • Set:元素无序、不可重复的集合
    • Map 接口双列数据,保存具有映射关系key-value对的集合
Collection接口继承树

Map接口继承树

Collection 接口
说明
  • Collection 接口是 List、Set 和 Queue 接口的父接口,该接口里定义的方法
    既可用于操作 Set 集合,也可用于操作 List 和 Queue 集合
  • JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List)
    实现
  • 在 Java5 之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都
    当成 Object 类型处理;从 JDK 5.0 增加了 泛型以后,Java 集合可以记住容
    器中对象的数据类型
Collection接口方法
  • 添加
    • add(Object obj)
    • addAll(Collection coll)
  • 获取有效元素的个数
    • int size()
  • 清空集合
    • void clear()
  • 是否是空集合
    • boolean isEmpty()
  • 是否包含某个元素
    • boolean contains(Object obj):是通过元素的equals方法来判断是否
      是同一个对象
    • boolean containsAll(Collection c):也是调用元素的equals方法来比
      较的。拿两个集合的元素挨个比较。
  • 删除
    • boolean remove(Object obj) :通过元素的equals方法判断是否是
      要删除的那个元素。只会删除找到的第一个元素
    • boolean removeAll(Collection coll):取当前集合的差集
  • 取两个集合的交集
    • boolean retainAll(Col lection c):把交集的结果存在当前集合中,不
      影响c
  • 集合是否相等
    • boolean equals(Object obj)
  • 转成对象数组
    • Object[] toArray()
  • 获取集合对象的哈希值
    • hashCode()
  • 遍历
    • iterator():返回迭代器对象,用于集合遍历
Iterator 迭代器接口
  • Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素
  • GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元
    素,而又不需暴露该对象的内部细节迭代器模式,就是为容器而生
  • Collection接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所
    有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了
    Iterator接口的对象
  • Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建
    Iterator 对象,则必须有一个被迭代的集合
  • 集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合
    第一个元素之前
  • 在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且
    下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常
1
2
3
4
5
//hasNext():判断是否还有下一个元素
while(iterator.hasNext()){
//next():①指针下移 ②将下移以后集合位置上的元素返回
System.out.println(iterator.next());
}
  • Iterator 接口remove() 方法
1
2
3
4
5
6
7
Iterator iter = coll.iterator();//回到起点
while(iter.hasNext()){
Object obj = iter.next();
if(obj.equals("Tom")){
iter.remove();
}
}
使用 foreach 循环遍历集合元素
  • Java 5.0 提供了 foreach 循环迭代访问 Collection和数组
  • 遍历操作不需获取Collection或数组的长度,无需使用索引访问元素
  • 遍历集合的底层调用Iterator完成操作
1
2
3
for(Person person: persons) {
System.out.println(person.getName());
}
List接口
实现类
  • JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector
List接口方法

List除了从Collection集合继承的方法外,List 集合里添加了一些根据索引来 操作集合元素的方法

  • void add(int index, Object ele): 在index 位置插入ele 元素
  • boolean addAll(int index, Collection eles): 从index 位置开始将eles中 中
    的所有元素添加进来
  • Object get(int index): 获取指定index 位置的元素
  • int indexOf(Object obj): 返回obj 在集合中首次出现的位置
  • int lastIndexOf(Object obj): 返回obj 在当前集合中末次出现的位置
  • Object remove(int index): 移除指定index 位置的元素,并返回此元素
  • Object set(int index, Object ele): 设置指定index 位置的元素为ele
  • List subList(int fromIndex, int toIndex): 返回从fromIndex 到toIndex
    位置的子集合
List 实现类之一:ArrayList
  • 概述
    • ArrayList 是 List 接口的典型实现类、主要实现类
    • 本质上,ArrayList是对象引用的一个”变长”数组
    • ArrayList 的JDK1.8 之前与之后的实现区别
      • JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组
      • JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元
        素时再创建一个始容量为10的数组
    • Arrays.asList(…) 方法返回的 List 集合,既不是 ArrayList 实例,也不是
      Vector 实例。 Arrays.asList(…) 返回值是一个固定长度的 List 集合
List 实现类之二:LinkedList
  • 对于 频繁的插入或删除元素的操作,建议使用LinkedList类效率较高
  • 新增方法

    • void addFirst(Object obj)
    • void addLast(Object obj)
    • Object getFirst()
    • Object getLast()
    • Object removeFirst()
    • Object removeLast()
  • LinkedList双向链表,内部没有声明数组,而是定义了Node类型的first和last
    用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基
    本结构。Node除了保存数据,还定义了两个变量:

    • prev变量记录前一个元素的位置
    • next变量记录下一个元素的位置
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
    this.item = element;
    this.next = next;
    this.prev = prev;
    }
    }
List 实现类之三:Vector
  • Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList
    相同,区别之处在于Vector是线程安全的

  • 在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,
    使用LinkedList;Vector总是比ArrayList,所以尽量避免使用

  • 新增方法
    • void addElement(Object obj)
    • void insertElementAt(Object obj,int index)
    • void setElementAt(Object obj,int index)
    • void removeElement(Object obj)
    • void removeAllElements()
Set接口
概述
  • Set接口是Collection的子接口,set接口没有提供额外的方法
  • Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个
    Set 集合中,则添加操作失败
  • Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法
Set 实现类之一:HashSet
  • 概述

    • HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类

    • HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除
      性能。

  • 特点

    • 不能保证元素的排列顺序
    • HashSet 不是线程安全的
    • 集合元素可以是 null
    • HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较
      ,并且两个对象的 equals() 方法返回值也相等
    • 对于存放在Set容器中的对象, 对应的类一定要重写equals() 和hashCode(Object
      obj) 方法,以实现对象相等规则 。即: “相等的对象必须具有相等的散列码
  • 向HashSet中添加元素的过程:

    • 当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法
      来得到该对象的 hashCode 值,然后根据 hashCode 值,通过某种散列函数决定该对象
      在 HashSet 底层数组中的存储位置。(这个散列函数会与底层数组的长度相计算得到在
      数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,
      该散列函数设计的越好)
    • 如果两个元素的hashCode()值相等,会再继续调用equals方法,如果equals方法结果
      为true,添加失败;如果为false,那么会保存该元素,但是该数组的位置已经有元素了,
      那么会通过链表的方式继续链接
    • 如果两个元素的 equals() 方法返回 true,但它们的 hashCode() 返回值不相
      等,hashSet 将会把它们存储在不同的位置,但依然可以添加成功
  • 扩容:底层也是数组,初始容量为16,当如果使用率超过0.75,(16*0.75=12)
    就会扩大容量为原来的2倍。(16扩容为32,依次为64,128….等)

  • 重写hashCode()方法的原则

    • 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值
    • 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode()
      方法的返回值也应相等
    • 对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
  • 重写equals()方法的基本原则

    • 复写equals方法的时候一般都需要同时复写hashCode方法。通 通
      算 常参与计算hashCode 的对象的属性也应该参与到equals() 中进行计算
  • demo

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    class User {
    private String name;
    private int age;

    //省略构造方法,get、set方法

    public boolean equals(Object o) {
    if (this == o) return true;
    if (o == null || getClass() != o.getClass()) return false;
    User user = (User) o;
    return age == user.age &&
    name.equals(user.name);
    }

    @Override
    public int hashCode() {
    return Objects.hash(name, age);
    }
    }
Set 实现类之二:LinkedHashSet
  • 概述
    • LinkedHashSetHashSet 的子类
    • LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置
      但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入
      顺序保存的
    • LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全
      部元素时有很好的性能
    • LinkedHashSet 不允许集合元素重复
Set 实现类之三:TreeSet
  • 概述

    • TreeSetSortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态

    • TreeSet底层使用红黑树结构存储数据

    • 新增的方法如下: (了解)

      1
      2
      3
      4
      5
      6
      7
      8
      Comparator comparator()
      Object first()
      Object last()
      Object lower(Object e)
      Object higher(Object e)
      SortedSet subSet(fromElement, toElement)
      SortedSet headSet(toElement)
      SortedSet tailSet(fromElement)
  • TreeSet 两种排序方法: 自然排序和定制排序。默认情况下,TreeSet 采用自然排序

    • 自然排序:TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元
      素之间的大小关系,然后将集合元素按升序(默认情况)排列
      • 如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable
        接口
      • 实现 Comparable 的类必须实现 compareTo(Object obj) 方法,两个对象即通过
        compareTo(Object obj) 方法的返回值来比较大小
      • 前面讲过了Comparable 的典型实现,像String,Date,BigDecimal等
      • 向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添
        加的所有元素都会调用compareTo()方法进行比较
      • 因为只有相同类的两个实例才会比较大小,所以向 TreeSet 中添加的应该是同
        一个类的对象
      • 对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通
        过 compareTo(Object obj) 方法比较返回值
      • 当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保
        证该方法与 compareTo(Object obj) 方法有一致的结果:如果两个对象通过
        equals() 方法比较返回 true,则通过 compareTo(Object obj) 方法比较应返回 0。
        否则,让人难以理解
    • 定制排序:定制排序,通过Comparator接口来实现。需要重写compare(T o1,T o2)方法
      • 利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表
        示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2
      • 要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构
        造器。
      • 此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异
      • 使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0
Map接口
概述
  • Map与Collection并列存在。用于保存具有映射关系的数据:key-value
  • Map 中的 key 和 value 都可以是任何引用类型的数据
  • Map 中的 key 用Set来存放, 不允许重复,即同一个 Map 对象所对应
    的类,须重写hashCode()和equals()方法
  • 常用String类作为Map的“键”
  • key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到
    唯一的、确定的 value
实现类
  • Map接口的常用实现类HashMap、TreeMap、LinkedHashMap和
    Properties。其中,HashMap是 Map 接口使用频率最高的实现类
常用方法
  • 添加 、删除、修改操作
    • Object put(Object key,Object value):将指定key-value添加到(或修改)当前map对象中
    • void putAll(Map m): 将m中的所有key-value对存放到当前map中
    • Object remove(Object key):移除指定key的key-value对,并返回value
    • void clear():清空当前map中的所有数据
  • 元素查询的操作

    • Object get(Object key):获取指定key对应的value
    • boolean containsKey(Object key):是否包含指定的key
    • boolean containsValue(Object value):是否包含指定的value
    • int size():返回map中key-value对的个数
    • boolean isEmpty():判断当前map是否为空
    • boolean equals(Object obj):判断当前map和参数对象obj是否相
  • 元视图操作的方法

    • Set keySet():返回所有key构成的Set集合
    • Collection values():返回所有value构成的Collection集合
    • Set entrySet():返回所有key-value对构成的Set集合
Map 实现类之一:HashMap
  • 概述
    • HashMap是 Map 接口 使用频率最高的实现类
    • 允许使用null键和null值,与HashSet一样,不保证映射的顺序
    • 所有的key构成的集合是Set:无序的、不可重复的。所以,key所在的类要重写:
      equals()和hashCode()
    • 所有的value构成的集合是Collection:无序的、可以重复的。所以,value所在的类
      要重写:equals()
    • 一个key-value构成一个entry
    • 所有的entry构成的集合是Set:无序的、不可重复的
    • HashMap 判断两个key相等的标准是:两个 key 通过 equals() 方法返回 true,
      hashCode 值也相等
    • HashMap 判断两个 value 相等的标准是:两个 value 通过 equals() 方法返回 true
  • HashMap源码中的重要常量说明

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    DEFAULT_INITIAL_CAPACITY : HashMap的默认容量,16
    MAXIMUM_CAPACITY : HashMap的最大支持容量,2^30
    DEFAULT_LOAD_FACTOR :HashMap的默认加载因子
    TREEIFY_THRESHOLD :Bucket中链表长度大于该默认值,转化为红黑树
    UNTREEIFY_THRESHOLD :Bucket中红黑树存储的Node小于该默认值,转化为链表
    MIN_TREEIFY_CAPACITY :桶中的Node被树化时最小的hash表容量。(当桶中Node的
    数量大到需要变红黑树时,若hash表容量小于MIN_TREEIFY_CAPACITY时,此时应执行
    resize扩容操作这个MIN_TREEIFY_CAPACITY的值至少是TREEIFY_THRESHOLD的4
    倍。)
    table :存储元素的数组,总是2的n次幂
    entrySet:存储具体元素的集
    size :HashMap中存储的键值对的数量
    modCount :HashMap扩容和结构改变的次数。
    threshold :扩容的临界值,= 容量*填充因子
    loadFactor:填充因子
  • HashMap的存储结构

    • JDK 7及以前版本:HashMap是数组+链表结构(即为链地址法)

    • 说明:

      • HashMap的内部存储结构其实是数组和链表的结合。当实例化一个HashMap时,
        系统会创建一个长度为Capacity的Entry数组,这个长度在哈希表中被称为容量
        (Capacity),在这个数组中可以存放元素的位置我们称之为“桶”(bucket),每个
        bucket都有自己的索引,系统可以根据索引快速的查找bucket中的元素。、
      • 每个bucket中存储一个元素,即一个Entry对象,但每一个Entry对象可以带一个引
        用变量,用于指向下一个元素,因此,在一个桶中,就有可能生成一个Entry链
        而且新添加的元素作为链表的head
      • 向HashMap中添加entry1(key,value),需要首先计算entry1中key的哈希值(根据
        key所在类的hashCode()计算得到),此哈希值经过处理以后,得到在底层Entry[]数
        组中要存储的位置i。如果位置i上没有元素,则entry1直接添加成功。如果位置i上
        已经存在entry2(或还有链表存在的entry3,entry4),则需要通过循环的方法,依次
        比较entry1中key和其他的entry。如果彼此hash值不同,则直接添加成功。如果
        hash值相同,继续比较二者是否equals。如果返回值为true,则使用entry1的value
        去替换equals为true的entry的value。如果遍历一遍以后,发现所有的equals返回都
        为false,则entry1仍可添加成功。entry1指向原有的entry元素
    • HashMap的扩容(jdk7-)

      • 当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数
        size) loadFactor 时 , 就 会 进 行 数 组 扩 容 , loadFactor 的 默 认 值
        (DEFAULT_LOAD_FACTOR)为0.75,这是一个折中的取值。也就是说,默认情况
        下,数组大小(DEFAULT_INITIAL_CAPACITY)为16,那么当HashMap中元素个数
        超过16
        0.75=12(这个值就是代码中的threshold值,也叫做临界值)的时候,就把
        数组的大小扩展为 2*16=32,即扩大一倍然后重新计算每个元素在数组中的位置,
        而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,
        那么预设元素的个数能够有效的提高HashMap的性能
  • JDK 8版本发布以后:HashMap是数组+链表+红黑树实现

  • 说明

    • HashMap的内部存储结构其实是 数组+ 链表+ 树 的结合。当实例化一个
      HashMap时,会初始化initialCapacity和loadFactor,在put第一对映射关系
      时,系统会创建一个长度为initialCapacity的Node数组,这个长度在哈希表
      中被称为容量(Capacity),在这个数组中可以存放元素的位置我们称之为
      “桶”(bucket),每个bucket都有自己的索引,系统可以根据索引快速的查
      找bucket中的元素
    • 每个bucket中存储一个元素,即一个Node对象,但每一个Node对象可以带
      一个引用变量next,用于指向下一个元素,因此,在一个桶中,就有可能
      生成一个Node链。也可能是一个TreeNode对象每一个TreeNode对象
      可以有两个叶子结点left和right因此,在一个桶中,就有可能生成一个
      TreeNode树。而新添加的元素作为链表的last,或树的叶子结点
  • HashMap的扩容和树形化(jdk8+)

    • 当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数
      size) loadFactor 时 , 就 会 进 行 数 组 扩 容 , loadFactor 的 默 认 值
      (DEFAULT_LOAD_FACTOR)为0.75,这是一个折中的取值。也就是说,默认
      情况下,数组大小(DEFAULT_INITIAL_CAPACITY)为16,那么当HashMap中
      元素个数超过16
      0.75=12(这个值就是代码中的threshold值,也叫做临界值)
      的时候,就把数组的大小扩展为 2*16=32,即扩大一倍然后重新计算每个元
      素在数组中的位置,而这是一个非常消耗性能的操作所以如果我们已经预知
      HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能

    • 当HashMap中的其中一个链的对象个数如果达到了8个,此时如果capacity没有
      达到64,那么HashMap会先扩容解决如果已经达到了64,那么这个链会变成
      树,结点类型由Node变成TreeNode类型当然,如果当映射关系被移除后,
      下次resize方法时判断树的结点个数低于6个,也会把树再转为链表。

  • 总结 jdk1.8相较于之前的变化

    • HashMap map = new HashMap();//默认情况下,先不创建长度为16的数组
    • 当首次调用map.put()时,再创建长度为16的数组
    • 数组为Node类型,在jdk7中称为Entry类型
    • 形成链表结构时,新添加的key-value对在链表的尾部(七上八下)
    • 数组指定索引位置的链表长度>8时,且map中的数组的长度> 64时,此索引位置
      上的所有key-value对使用红黑树进行存储
Map 实现类之二:LinkedHashMap
  • 概述
    • LinkedHashMap 是 HashMap 的子类
    • 在HashMap存储结构的基础上,使用了一对双向链表来记录添加
      元素的顺序
    • 与LinkedHashSet类似,LinkedHashMap 可以维护 Map 的迭代
      顺序:迭代顺序与 Key-Value 对的插入顺序一致
Map 实现类之三:TreeMap
  • 概述:
    • TreeMap存储 Key-Value 对时,需要根据 key-value 对进行排序。
      TreeMap 可以保证所有的 Key-Value 对处于 有序状态
    • TreeMap底层使用红黑树结构存储数据
    • TreeMap 的 Key 的排序:
      • 自然排序:TreeMap 的所有的 Key 必须实现 Comparable 接口,而且所有
        Key 应该是同一个类的对象,否则将会抛出 ClasssCastException
      • 定制排序创建 TreeMap 时,传入一个 Comparator 对象,该对象负责对
        TreeMap 中的所有 key 进行排序。此时不需要 Map 的 Key 实现
        Comparable 接口
    • TreeMap判断 两个key 相等的标准:两个key通过compareTo()方法或
      者compare()方法返回0
Map 实现类之四:Hashtable
  • 概述
    • Hashtable是个古老的 Map 实现类JDK1.0就提供了。不同于HashMap,
      Hashtable是线程安全的
    • Hashtable实现原理和HashMap相同,功能相同。底层都使用哈希表结构,查询
      速度快,很多情况下可以互用
    • 与HashMap不同,Hashtable 不允许使用 null 作为 key 和 value
    • 与HashMap一样,Hashtable 也不能保证其中 Key-Value 对的顺序
    • Hashtable判断两个key相等、两个value相等的标准,与HashMap一致。
Map 实现类之五:Properties
  • 概述

    • Properties 类是 Hashtable 的子类该对象用于处理属性文件
    • 由于属性文件里的 key、value 都是字符串类型,所以 Properties 里的 key
      和 value 都是字符串类型
    • 存取数据时,建议使用setProperty(String key,String value)方法和
      getProperty(String key)方法
    1
    2
    3
    4
    Properties pros = new Properties();
    pros.load(new FileInputStream("jdbc.properties"));
    String user = pros.getProperty("user");
    System.out.println(user);
Collections工具类
概述
  • Collections 是一个操作 Set、List 和 Map 等集合的工具类(操作数组的工具类:Arrays)
  • Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,
    还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
排序操作(均为static方法)
  • reverse(List):反转 List 中元素的顺序
  • shuffle(List):对 List 集合元素进行随机排序
  • sort(List):根据元素的自然顺序对指定 List 集合元素按升序排序
  • sort(List,Comparator):根据指定的 Comparator 产生的顺序对 List 集合元素进行排序
  • swap(List,int, int):将指定 list 集合中的 i 处元素和 j 处元素进行交换
查找、替换
  • Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
  • Object max(Collection,Comparator):根据 Comparator 指定的顺序,返回
    给定集合中的最大元素
  • Object min(Collection)
  • Object min(Collection,Comparator)
  • int frequency(Collection,Object):返回指定集合中指定元素的出现次数
  • void copy(List dest,List src):将src中的内容复制到dest中
  • boolean replaceAll(List list,Object oldVal,Object newVal):使用新值替换
    List 对象的所有旧值
Collections常用方法:同步控制
  • Collections 类中提供了多个 synchronizedXxx() 方法,该方法可使将指定集
    合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题

0%