Java集合框架概述
- Java 集合可分为 Collection 和 Map 两种体系
- Collection 接口 :单列数据,定义了存取一组对象的方法的集合
- List:元素有序、可重复的集合
- Set:元素无序、不可重复的集合
- Map 接口:双列数据,保存具有映射关系key-value对的集合
- Collection 接口 :单列数据,定义了存取一组对象的方法的集合
Collection接口继承树
Map接口继承树
Collection 接口
说明
- Collection 接口是 List、Set 和 Queue 接口的父接口,该接口里定义的方法
既可用于操作 Set 集合,也可用于操作 List 和 Queue 集合 - JDK不提供此接口的任何直接实现,而是提供更具体的子接口(如:Set和List)
实现 - 在 Java5 之前,Java 集合会丢失容器中所有对象的数据类型,把所有对象都
当成 Object 类型处理;从 JDK 5.0 增加了 泛型以后,Java 集合可以记住容
器中对象的数据类型
Collection接口方法
- 添加
- add(Object obj)
- addAll(Collection coll)
- 获取有效元素的个数
- int size()
- 清空集合
- void clear()
- 是否是空集合
- boolean isEmpty()
- 是否包含某个元素
- boolean contains(Object obj):是通过元素的equals方法来判断是否
是同一个对象 - boolean containsAll(Collection c):也是调用元素的equals方法来比
较的。拿两个集合的元素挨个比较。
- boolean contains(Object obj):是通过元素的equals方法来判断是否
- 删除
- boolean remove(Object obj) :通过元素的equals方法判断是否是
要删除的那个元素。只会删除找到的第一个元素 - boolean removeAll(Collection coll):取当前集合的差集
- boolean remove(Object obj) :通过元素的equals方法判断是否是
- 取两个集合的交集
- boolean retainAll(Col lection c):把交集的结果存在当前集合中,不
影响c
- boolean retainAll(Col lection c):把交集的结果存在当前集合中,不
- 集合是否相等
- boolean equals(Object obj)
- 转成对象数组
- Object[] toArray()
- 获取集合对象的哈希值
- hashCode()
- 遍历
- iterator():返回迭代器对象,用于集合遍历
Iterator 迭代器接口
- Iterator对象称为迭代器(设计模式的一种),主要用于遍历 Collection 集合中的元素
- GOF给迭代器模式的定义为:提供一种方法访问一个容器(container)对象中各个元
素,而又不需暴露该对象的内部细节。 迭代器模式,就是为容器而生。 - Collection接口继承了java.lang.Iterable接口,该接口有一个iterator()方法,那么所
有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了
Iterator接口的对象 - Iterator 仅用于遍历集合,Iterator 本身并不提供承装对象的能力。如果需要创建
Iterator 对象,则必须有一个被迭代的集合。 - 集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合
的第一个元素之前 - 在调用it.next()方法之前必须要调用it.hasNext()进行检测。若不调用,且
下一条记录无效,直接调用it.next()会抛出NoSuchElementException异常
1 | //hasNext():判断是否还有下一个元素 |
- Iterator 接口remove() 方法
1 | Iterator iter = coll.iterator();//回到起点 |
使用 foreach 循环遍历集合元素
- Java 5.0 提供了 foreach 循环迭代访问 Collection和数组
- 遍历操作不需获取Collection或数组的长度,无需使用索引访问元素
- 遍历集合的底层调用Iterator完成操作
1 | for(Person person: persons) { |
List接口
实现类
- JDK API中List接口的实现类常用的有:ArrayList、LinkedList和Vector。
List接口方法
List除了从Collection集合继承的方法外,List 集合里添加了一些根据索引来
操作集合元素的方法
- void add(int index, Object ele): 在index 位置插入ele 元素
- boolean addAll(int index, Collection eles): 从index 位置开始将eles中 中
的所有元素添加进来 - Object get(int index): 获取指定index 位置的元素
- int indexOf(Object obj): 返回obj 在集合中首次出现的位置
- int lastIndexOf(Object obj): 返回obj 在当前集合中末次出现的位置
- Object remove(int index): 移除指定index 位置的元素,并返回此元素
- Object set(int index, Object ele): 设置指定index 位置的元素为ele
- List subList(int fromIndex, int toIndex): 返回从fromIndex 到toIndex
位置的子集合
List 实现类之一:ArrayList
- 概述:
- ArrayList 是 List 接口的典型实现类、主要实现类
- 本质上,ArrayList是对象引用的一个”变长”数组
- ArrayList 的JDK1.8 之前与之后的实现区别?
- JDK1.7:ArrayList像饿汉式,直接创建一个初始容量为10的数组
- JDK1.8:ArrayList像懒汉式,一开始创建一个长度为0的数组,当添加第一个元
素时再创建一个始容量为10的数组
- Arrays.asList(…) 方法返回的 List 集合,既不是 ArrayList 实例,也不是
Vector 实例。 Arrays.asList(…) 返回值是一个固定长度的 List 集合
List 实现类之二:LinkedList
- 对于 频繁的插入或删除元素的操作,建议使用LinkedList类,效率较高
新增方法:
- void addFirst(Object obj)
- void addLast(Object obj)
- Object getFirst()
- Object getLast()
- Object removeFirst()
- Object removeLast()
LinkedList: 双向链表,内部没有声明数组,而是定义了Node类型的first和last,
用于记录首末元素。同时,定义内部类Node,作为LinkedList中保存数据的基
本结构。Node除了保存数据,还定义了两个变量:- prev变量记录前一个元素的位置
- next变量记录下一个元素的位置
1
2
3
4
5
6
7
8
9
10
11private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
List 实现类之三:Vector
Vector 是一个古老的集合,JDK1.0就有了。大多数操作与ArrayList
相同,区别之处在于Vector是线程安全的在各种list中,最好把ArrayList作为缺省选择。当插入、删除频繁时,
使用LinkedList;Vector总是比ArrayList慢,所以尽量避免使用- 新增方法:
- void addElement(Object obj)
- void insertElementAt(Object obj,int index)
- void setElementAt(Object obj,int index)
- void removeElement(Object obj)
- void removeAllElements()
Set接口
概述
- Set接口是Collection的子接口,set接口没有提供额外的方法
- Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个
Set 集合中,则添加操作失败 - Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals() 方法
Set 实现类之一:HashSet
概述:
HashSet 是 Set 接口的典型实现,大多数时候使用 Set 集合时都使用这个实现类。
HashSet 按 Hash 算法来存储集合中的元素,因此具有很好的存取、查找、删除
性能。
特点:
- 不能保证元素的排列顺序
- HashSet 不是线程安全的
- 集合元素可以是 null
- HashSet 集合判断两个元素相等的标准:两个对象通过 hashCode() 方法比较相
等,并且两个对象的 equals() 方法返回值也相等 - 对于存放在Set容器中的对象, 对应的类一定要重写equals() 和hashCode(Object
obj) 方法,以实现对象相等规则 。即: “相等的对象必须具有相等的散列码”
向HashSet中添加元素的过程:
- 当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法
来得到该对象的 hashCode 值,然后根据 hashCode 值,通过某种散列函数决定该对象
在 HashSet 底层数组中的存储位置。(这个散列函数会与底层数组的长度相计算得到在
数组中的下标,并且这种散列函数计算还尽可能保证能均匀存储元素,越是散列分布,
该散列函数设计的越好) - 如果两个元素的hashCode()值相等,会再继续调用equals方法,如果equals方法结果
为true,添加失败;如果为false,那么会保存该元素,但是该数组的位置已经有元素了,
那么会通过链表的方式继续链接 - 如果两个元素的 equals() 方法返回 true,但它们的 hashCode() 返回值不相
等,hashSet 将会把它们存储在不同的位置,但依然可以添加成功
- 当向 HashSet 集合中存入一个元素时,HashSet 会调用该对象的 hashCode() 方法
扩容:底层也是数组,初始容量为16,当如果使用率超过0.75,(16*0.75=12)
就会扩大容量为原来的2倍。(16扩容为32,依次为64,128….等)重写hashCode()方法的原则
- 在程序运行时,同一个对象多次调用 hashCode() 方法应该返回相同的值
- 当两个对象的 equals() 方法比较返回 true 时,这两个对象的 hashCode()
方法的返回值也应相等 - 对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。
重写equals()方法的基本原则
- 复写equals方法的时候一般都需要同时复写hashCode方法。通 通
算 常参与计算hashCode 的对象的属性也应该参与到equals() 中进行计算
- 复写equals方法的时候一般都需要同时复写hashCode方法。通 通
demo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19class User {
private String name;
private int age;
//省略构造方法,get、set方法
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
User user = (User) o;
return age == user.age &&
name.equals(user.name);
}
public int hashCode() {
return Objects.hash(name, age);
}
}
Set 实现类之二:LinkedHashSet
- 概述:
- LinkedHashSet 是 HashSet 的子类
- LinkedHashSet 根据元素的 hashCode 值来决定元素的存储位置,
但它同时使用双向链表维护元素的次序,这使得元素看起来是以插入
顺序保存的 - LinkedHashSet插入性能略低于 HashSet,但在迭代访问 Set 里的全
部元素时有很好的性能 - LinkedHashSet 不允许集合元素重复
Set 实现类之三:TreeSet
概述:
TreeSet 是 SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。
TreeSet底层使用红黑树结构存储数据
新增的方法如下: (了解)
1
2
3
4
5
6
7
8Comparator comparator()
Object first()
Object last()
Object lower(Object e)
Object higher(Object e)
SortedSet subSet(fromElement, toElement)
SortedSet headSet(toElement)
SortedSet tailSet(fromElement)
TreeSet 两种排序方法: 自然排序和定制排序。默认情况下,TreeSet 采用自然排序
- 自然排序:TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元
素之间的大小关系,然后将集合元素按升序(默认情况)排列- 如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable
接口 - 实现 Comparable 的类必须实现 compareTo(Object obj) 方法,两个对象即通过
compareTo(Object obj) 方法的返回值来比较大小。 - 前面讲过了Comparable 的典型实现,像String,Date,BigDecimal等
- 向 TreeSet 中添加元素时,只有第一个元素无须比较compareTo()方法,后面添
加的所有元素都会调用compareTo()方法进行比较 - 因为只有相同类的两个实例才会比较大小,所以向 TreeSet 中添加的应该是同
一个类的对象 - 对于 TreeSet 集合而言,它判断两个对象是否相等的唯一标准是:两个对象通
过 compareTo(Object obj) 方法比较返回值 - 当需要把一个对象放入 TreeSet 中,重写该对象对应的 equals() 方法时,应保
证该方法与 compareTo(Object obj) 方法有一致的结果:如果两个对象通过
equals() 方法比较返回 true,则通过 compareTo(Object obj) 方法比较应返回 0。
否则,让人难以理解
- 如果试图把一个对象添加到 TreeSet 时,则该对象的类必须实现 Comparable
- 定制排序:定制排序,通过Comparator接口来实现。需要重写compare(T o1,T o2)方法
- 利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表
示o1大于o2;如果返回0,表示相等;返回负整数,表示o1小于o2 - 要实现定制排序,需要将实现Comparator接口的实例作为形参传递给TreeSet的构
造器。 - 此时,仍然只能向TreeSet中添加类型相同的对象。否则发生ClassCastException异
常 - 使用定制排序判断两个元素相等的标准是:通过Comparator比较两个元素返回了0
- 利用int compare(T o1,T o2)方法,比较o1和o2的大小:如果方法返回正整数,则表
- 自然排序:TreeSet 会调用集合元素的 compareTo(Object obj) 方法来比较元
Map接口
概述
- Map与Collection并列存在。用于保存具有映射关系的数据:key-value
- Map 中的 key 和 value 都可以是任何引用类型的数据
- Map 中的 key 用Set来存放, 不允许重复,即同一个 Map 对象所对应
的类,须重写hashCode()和equals()方法 - 常用String类作为Map的“键”
- key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到
唯一的、确定的 value
实现类
- Map接口的常用实现类:HashMap、TreeMap、LinkedHashMap和
Properties。其中,HashMap是 Map 接口使用频率最高的实现类
常用方法
- 添加 、删除、修改操作 :
- Object put(Object key,Object value):将指定key-value添加到(或修改)当前map对象中
- void putAll(Map m): 将m中的所有key-value对存放到当前map中
- Object remove(Object key):移除指定key的key-value对,并返回value
- void clear():清空当前map中的所有数据
元素查询的操作:
- Object get(Object key):获取指定key对应的value
- boolean containsKey(Object key):是否包含指定的key
- boolean containsValue(Object value):是否包含指定的value
- int size():返回map中key-value对的个数
- boolean isEmpty():判断当前map是否为空
- boolean equals(Object obj):判断当前map和参数对象obj是否相等
元视图操作的方法:
- Set keySet():返回所有key构成的Set集合
- Collection values():返回所有value构成的Collection集合
- Set entrySet():返回所有key-value对构成的Set集合
Map 实现类之一:HashMap
- 概述:
- HashMap是 Map 接口 使用频率最高的实现类
- 允许使用null键和null值,与HashSet一样,不保证映射的顺序
- 所有的key构成的集合是Set:无序的、不可重复的。所以,key所在的类要重写:
equals()和hashCode() - 所有的value构成的集合是Collection:无序的、可以重复的。所以,value所在的类
要重写:equals() - 一个key-value构成一个entry
- 所有的entry构成的集合是Set:无序的、不可重复的
- HashMap 判断两个key相等的标准是:两个 key 通过 equals() 方法返回 true,
hashCode 值也相等 - HashMap 判断两个 value 相等的标准是:两个 value 通过 equals() 方法返回 true
HashMap源码中的重要常量说明
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15DEFAULT_INITIAL_CAPACITY : HashMap的默认容量,16
MAXIMUM_CAPACITY : HashMap的最大支持容量,2^30
DEFAULT_LOAD_FACTOR :HashMap的默认加载因子
TREEIFY_THRESHOLD :Bucket中链表长度大于该默认值,转化为红黑树
UNTREEIFY_THRESHOLD :Bucket中红黑树存储的Node小于该默认值,转化为链表
MIN_TREEIFY_CAPACITY :桶中的Node被树化时最小的hash表容量。(当桶中Node的
数量大到需要变红黑树时,若hash表容量小于MIN_TREEIFY_CAPACITY时,此时应执行
resize扩容操作这个MIN_TREEIFY_CAPACITY的值至少是TREEIFY_THRESHOLD的4
倍。)
table :存储元素的数组,总是2的n次幂
entrySet:存储具体元素的集
size :HashMap中存储的键值对的数量
modCount :HashMap扩容和结构改变的次数。
threshold :扩容的临界值,= 容量*填充因子
loadFactor:填充因子
HashMap的存储结构
- JDK 7及以前版本:HashMap是数组+链表结构(即为链地址法)
说明:
- HashMap的内部存储结构其实是数组和链表的结合。当实例化一个HashMap时,
系统会创建一个长度为Capacity的Entry数组,这个长度在哈希表中被称为容量
(Capacity),在这个数组中可以存放元素的位置我们称之为“桶”(bucket),每个
bucket都有自己的索引,系统可以根据索引快速的查找bucket中的元素。、 - 每个bucket中存储一个元素,即一个Entry对象,但每一个Entry对象可以带一个引
用变量,用于指向下一个元素,因此,在一个桶中,就有可能生成一个Entry链。
而且新添加的元素作为链表的head - 向HashMap中添加entry1(key,value),需要首先计算entry1中key的哈希值(根据
key所在类的hashCode()计算得到),此哈希值经过处理以后,得到在底层Entry[]数
组中要存储的位置i。如果位置i上没有元素,则entry1直接添加成功。如果位置i上
已经存在entry2(或还有链表存在的entry3,entry4),则需要通过循环的方法,依次
比较entry1中key和其他的entry。如果彼此hash值不同,则直接添加成功。如果
hash值相同,继续比较二者是否equals。如果返回值为true,则使用entry1的value
去替换equals为true的entry的value。如果遍历一遍以后,发现所有的equals返回都
为false,则entry1仍可添加成功。entry1指向原有的entry元素
- HashMap的内部存储结构其实是数组和链表的结合。当实例化一个HashMap时,
HashMap的扩容(jdk7-)
- 当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数
size) loadFactor 时 , 就 会 进 行 数 组 扩 容 , loadFactor 的 默 认 值
(DEFAULT_LOAD_FACTOR)为0.75,这是一个折中的取值。也就是说,默认情况
下,数组大小(DEFAULT_INITIAL_CAPACITY)为16,那么当HashMap中元素个数
超过160.75=12(这个值就是代码中的threshold值,也叫做临界值)的时候,就把
数组的大小扩展为 2*16=32,即扩大一倍,然后重新计算每个元素在数组中的位置,
而这是一个非常消耗性能的操作,所以如果我们已经预知HashMap中元素的个数,
那么预设元素的个数能够有效的提高HashMap的性能。
- 当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数
JDK 8版本发布以后:HashMap是数组+链表+红黑树实现
说明:
- HashMap的内部存储结构其实是 数组+ 链表+ 树 的结合。当实例化一个
HashMap时,会初始化initialCapacity和loadFactor,在put第一对映射关系
时,系统会创建一个长度为initialCapacity的Node数组,这个长度在哈希表
中被称为容量(Capacity),在这个数组中可以存放元素的位置我们称之为
“桶”(bucket),每个bucket都有自己的索引,系统可以根据索引快速的查
找bucket中的元素 - 每个bucket中存储一个元素,即一个Node对象,但每一个Node对象可以带
一个引用变量next,用于指向下一个元素,因此,在一个桶中,就有可能
生成一个Node链。也可能是一个TreeNode对象,每一个TreeNode对象
可以有两个叶子结点left和right,因此,在一个桶中,就有可能生成一个
TreeNode树。而新添加的元素作为链表的last,或树的叶子结点
- HashMap的内部存储结构其实是 数组+ 链表+ 树 的结合。当实例化一个
HashMap的扩容和树形化(jdk8+)
当HashMap中的元素个数超过数组大小(数组总大小length,不是数组中个数
size) loadFactor 时 , 就 会 进 行 数 组 扩 容 , loadFactor 的 默 认 值
(DEFAULT_LOAD_FACTOR)为0.75,这是一个折中的取值。也就是说,默认
情况下,数组大小(DEFAULT_INITIAL_CAPACITY)为16,那么当HashMap中
元素个数超过160.75=12(这个值就是代码中的threshold值,也叫做临界值)
的时候,就把数组的大小扩展为 2*16=32,即扩大一倍,然后重新计算每个元
素在数组中的位置,而这是一个非常消耗性能的操作,所以如果我们已经预知
HashMap中元素的个数,那么预设元素的个数能够有效的提高HashMap的性能当HashMap中的其中一个链的对象个数如果达到了8个,此时如果capacity没有
达到64,那么HashMap会先扩容解决,如果已经达到了64,那么这个链会变成
树,结点类型由Node变成TreeNode类型。当然,如果当映射关系被移除后,
下次resize方法时判断树的结点个数低于6个,也会把树再转为链表。
总结 jdk1.8相较于之前的变化
- HashMap map = new HashMap();//默认情况下,先不创建长度为16的数组
- 当首次调用map.put()时,再创建长度为16的数组
- 数组为Node类型,在jdk7中称为Entry类型
- 形成链表结构时,新添加的key-value对在链表的尾部(七上八下)
- 当数组指定索引位置的链表长度>8时,且map中的数组的长度> 64时,此索引位置
上的所有key-value对使用红黑树进行存储
Map 实现类之二:LinkedHashMap
- 概述:
- LinkedHashMap 是 HashMap 的子类
- 在HashMap存储结构的基础上,使用了一对双向链表来记录添加
元素的顺序 - 与LinkedHashSet类似,LinkedHashMap 可以维护 Map 的迭代
顺序:迭代顺序与 Key-Value 对的插入顺序一致
Map 实现类之三:TreeMap
- 概述:
- TreeMap存储 Key-Value 对时,需要根据 key-value 对进行排序。
TreeMap 可以保证所有的 Key-Value 对处于 有序状态 - TreeMap底层使用红黑树结构存储数据
- TreeMap 的 Key 的排序:
- 自然排序:TreeMap 的所有的 Key 必须实现 Comparable 接口,而且所有
的 Key 应该是同一个类的对象,否则将会抛出 ClasssCastException - 定制排序:创建 TreeMap 时,传入一个 Comparator 对象,该对象负责对
TreeMap 中的所有 key 进行排序。此时不需要 Map 的 Key 实现
Comparable 接口
- 自然排序:TreeMap 的所有的 Key 必须实现 Comparable 接口,而且所有
- TreeMap判断 两个key 相等的标准:两个key通过compareTo()方法或
者compare()方法返回0
- TreeMap存储 Key-Value 对时,需要根据 key-value 对进行排序。
Map 实现类之四:Hashtable
- 概述:
- Hashtable是个古老的 Map 实现类,JDK1.0就提供了。不同于HashMap,
Hashtable是线程安全的 - Hashtable实现原理和HashMap相同,功能相同。底层都使用哈希表结构,查询
速度快,很多情况下可以互用 - 与HashMap不同,Hashtable 不允许使用 null 作为 key 和 value
- 与HashMap一样,Hashtable 也不能保证其中 Key-Value 对的顺序
- Hashtable判断两个key相等、两个value相等的标准,与HashMap一致。
- Hashtable是个古老的 Map 实现类,JDK1.0就提供了。不同于HashMap,
Map 实现类之五:Properties
概述:
- Properties 类是 Hashtable 的子类,该对象用于处理属性文件
- 由于属性文件里的 key、value 都是字符串类型,所以 Properties 里的 key
和 value 都是字符串类型 - 存取数据时,建议使用setProperty(String key,String value)方法和
getProperty(String key)方法
1
2
3
4Properties pros = new Properties();
pros.load(new FileInputStream("jdbc.properties"));
String user = pros.getProperty("user");
System.out.println(user);
Collections工具类
概述
- Collections 是一个操作 Set、List 和 Map 等集合的工具类(操作数组的工具类:Arrays)
- Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,
还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
排序操作(均为static方法)
reverse(List)
:反转 List 中元素的顺序shuffle(List)
:对 List 集合元素进行随机排序sort(List)
:根据元素的自然顺序对指定 List 集合元素按升序排序sort(List,Comparator)
:根据指定的 Comparator 产生的顺序对 List 集合元素进行排序swap(List,int, int)
:将指定 list 集合中的 i 处元素和 j 处元素进行交换
查找、替换
Object max(Collection)
:根据元素的自然顺序,返回给定集合中的最大元素Object max(Collection,Comparator)
:根据 Comparator 指定的顺序,返回
给定集合中的最大元素Object min(Collection)
Object min(Collection,Comparator)
int frequency(Collection,Object)
:返回指定集合中指定元素的出现次数void copy(List dest,List src)
:将src中的内容复制到dest中boolean replaceAll(List list,Object oldVal,Object newVal)
:使用新值替换
List 对象的所有旧值
Collections常用方法:同步控制
Collections 类中提供了多个 synchronizedXxx() 方法,该方法可使将指定集
合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题