LinkedList源码分析
本文涉及的JDK源码版本为1.7.0_79。
LinkedList类定义
LinkedList是基于双向链表实现的,LinkedList除了被当做数组来使用,还可以作为栈、队列来使用。由于LinkedList内部采用链表的形式存储元素,因此随机访问会比较慢,但是插入、删除元素比较快。
和ArrayList一样,LinkedList也是非线程安全的,只有在单线程下才可以使用。为了防止非同步访问,可以采用如下方式创建LinkedList。
List list= Collections.synchronizedList(new LinkedList());
LinkedList的类定义如下。
public class LinkedList<E>
extends AbstractSequentialList<E>
implements List<E>, Deque<E>, Cloneable, java.io.Serializable
-
LinkedList继承了抽象类AbstractSequentialList。 -
LinkedList实现了Serializable接口,可以被序列化,能通过序列化传输。 -
LinkedList实现了Cloneable接口,可以被克隆。 -
LinkedList实现了Deque接口,Deque是双端队列接口,提供了类似push、pop和peek等适用于栈和队列的方法。
LinkedList中定义了内部类Node来代表链表中的节点。
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
Node节点 一共有三个属性:item代表节点值,prev代表节点的前一个节点,next代表节点的后一个节点。
LinkedList类属性
LinkedList一共包含三个类成员变量,size代表链表含有节点的个数,first指向链表的首节点,last指向链表的尾节点。
transient int size = 0;
transient Node<E> first;
transient Node<E> last;
LinkedList类构造函数
LinkedList含有两个构造函数,分别是默认构造函数和带有一个集合对象的构造函数。
public LinkedList() {
}
public LinkedList(Collection<? extends E> c) {
this();
addAll(c);
}
默认构造函数构建了一个空链表,带参数的构造函数将结合对象传入,调用addAll方法初始化链表。既然这里涉及了addAll方法,所以继续追踪下去,addAll方法如下所示。
public boolean addAll(Collection<? extends E> c) {
return addAll(size, c);
}
addAll方法调用了另一个addAll方法,并将链表长度size作为参数传入,该addAll方法如下所示。
public boolean addAll(int index, Collection<? extends E> c) {
checkPositionIndex(index);
Object[] a = c.toArray();
int numNew = a.length;
if (numNew == 0)
return false;
Node<E> pred, succ;
if (index == size) {
succ = null;
pred = last;
} else {
succ = node(index);
pred = succ.prev;
}
for (Object o : a) {
@SuppressWarnings("unchecked") E e = (E) o;
Node<E> newNode = new Node<>(pred, e, null);
if (pred == null)
first = newNode;
else
pred.next = newNode;
pred = newNode;
}
if (succ == null) {
last = pred;
} else {
pred.next = succ;
succ.prev = pred;
}
size += numNew;
modCount++;
return true;
}
对该addAll方法进行分析:当调用new LinkedList(Collection c)时,此时size = 0, first = last = null,且此时index = size = 0。addAll方法内创建了两个Node节点的引用pred和succ,pred指向链表构建过程中节点插入位置的前一个节点。当创建新的LinkedList时,succ = null,当向已经存在的LinkedList中插入元素时,succ指向了以当前链表的第index个结点,也就是指向插入位置的后一个结点(此处调用了node(index)方法,后面会介绍)。将Collection转化为Array,进行遍历,将每个元素插入到双向链表。对于一个插入到链表的Node,通过Node的构造函数维护Node的和pred的关系,即让Node的prev指向pred且让pred的next指向Node。当所有的元素都插入到链表后,使pred的next指向succ且让succ的prev指向pred。最后,更新size的大小。
LinkedList类核心方法
linkFirst、linkLast和linkBefore,以及未显示的unlinkFirst、unlinkLast和unlink方法是用于实现一系列的add和remove方法,是LinkedList的实现基础。这些方法如果学习过数据结构的话很好理解。linkFisrst将元素e插入到当前链表的首节点之前,并作为新的首节点。同理,linkLast将元素插入到当前链表末尾,并作为新的尾节点。linkBefore是将元素插入到指定的某个节点之前,其操作同向双向链表插入一个节点一致。
private void linkFirst(E e) {
final Node<E> f = first;
final Node<E> newNode = new Node<>(null, e, f);
first = newNode;
if (f == null)
last = newNode;
else
f.prev = newNode;
size++;
modCount++;
}
void linkLast(E e) {
final Node<E> l = last;
final Node<E> newNode = new Node<>(l, e, null);
last = newNode;
if (l == null)
first = newNode;
else
l.next = newNode;
size++;
modCount++;
}
void linkBefore(E e, Node<E> succ) {
// assert succ != null;
final Node<E> pred = succ.prev;
final Node<E> newNode = new Node<>(pred, e, succ);
succ.prev = newNode;
if (pred == null)
first = newNode;
else
pred.next = newNode;
size++;
modCount++;
}
接下来是一系列get方法、remove方法和add方法,这些方法都是借助于上面提到的linkXX、unlinkXX方法实现。另外,在分析``LinkedList构造函数时,曾涉及addAll(Collcetion c)`方法。
public E getFirst() {
final Node<E> f = first;
if (f == null)
throw new NoSuchElementException();
return f.item;
}
public E getLast() {
final Node<E> l = last;
if (l == null)
throw new NoSuchElementException();
return l.item;
}
public E removeFirst() {
final Node<E> f = first;
if (f == null)
throw new NoSuchElementException();
return unlinkFirst(f);
}
public E removeLast() {
final Node<E> l = last;
if (l == null)
throw new NoSuchElementException();
return unlinkLast(l);
}
public void addFirst(E e) {
linkFirst(e);
}
public void addLast(E e) {
linkLast(e);
}
public boolean add(E e) {
linkLast(e);
return true;
}
public boolean remove(Object o) {
if (o == null) {
for (Node<E> x = first; x != null; x = x.next) {
if (x.item == null) {
unlink(x);
return true;
}
}
} else {
for (Node<E> x = first; x != null; x = x.next) {
if (o.equals(x.item)) {
unlink(x);
return true;
}
}
}
return false;
}
注意到在addAll(Collection c)方法内,调用过node(int index)方法,node方法返回双向链表的第index个节点,node方法定义如下。这儿用到了一个小策略,当index小于链表长度的一半,那么从前往后遍历,否则,从后往前遍历,在O(n/2)时间内可以找到节点。
Node<E> node(int index) {
// assert isElementIndex(index);
if (index < (size >> 1)) {
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else {
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}
问题
在addAll(int index, Collection<? extends E> c)方法内,先将Collection转化为Array,然后再遍历,这是出于什么考虑?