Java泛型总结
Java
泛型是JDK5
引入的一个新特性,允许在定义类和接口的时候使用类型参数(type parameter
)。声明的类型参数在使用的时候使用具体的类型来替换。泛型最主要的应用是在JDK5
中的新集合类框架中。对于泛型概念的引入,开发社区的观点是褒贬不一。从好的方面上说,泛型的引入可以解决之前的集合类框架在使用过程中通常会出现的运行时刻类型错误,因为编译器可以在编译时刻就发现很多明显的错误。从不好的方面说,为了保证与旧版本的兼容性,Java
泛型的实现上还存在着不够优雅的地方。
类型擦除
正确理解泛型概念的首要前提是理解类型擦除(type erasure
)。Java
中的泛型基本上都是在编译器这个层次来实现的。在生成的Java
字节码中是不包含泛型中的类型信息的。使用泛型的时候加上的类型参数,会被编译器在编译的时候去掉。这个过程就称为类型擦除。比如在代码中定义的List<Object>
和List<String>
等类型,在编译之后都会变成List
。JVM
看到的只是List
,而由泛型附加的类型信息对JVM
来说是不可见的。Java
编译器会在编译时尽可能的发现可能出错的地方,但是仍然无法避免在运行时刻出现类型转换异常的情况。
通过如下代码片段感受类型擦除:
ArrayList<String> a1 = new ArrayList<>();
ArrayList<Integer> a2 =new ArrayList<>();
Class c1 =a1.getClass();
Class c2 = a2.getClass();
System.out.println(c1.equals(c2)); //Output: true
此时,程序输出true
,这就是类型擦除造成的。因为不管是ArrayList<String>
还是ArrayList<Integer>
,都会在编译期被编译器擦除成ArrayList
。编译器这么做的原因归根结底还是为了兼容JDK5
前未使用泛型的代码,因此不得不让编译器擦除有关类型信息的部分,这样生成的代码其实就是类型无关的。
List<Integer> list = new ArrayList<>();
Map<String,Integer> map = new HashMap<>();
System.out.println(Arrays.toString(list.getClass().getTypeParameters())); //[E]
System.out.println(Arrays.toString(map.getClass().getTypeParameters())); //[K, V]
我们期望的是返回泛型参数的类型,结果返回的仅仅是参数的占位符。
public static <T> T[] makeArray(){
return new T[10]; //编译期报错:不能创建泛型类型的数组
}
因为T
仅仅是个占位符,并不具有真实的类型信息。为了解决这个问题,可以利用反射:
public static <T> T[] makeArray(Class<T> clazz) {
return (T[]) Array.newInstance(clazz, 10);
}
很多泛型的奇怪特性都与类型擦除的存在有关,包括:
-
泛型类并没有自己独有的
Class
类对象。比如并不存在List<String>.class
或是List<Integer>.class
,而只有List.class
。 -
静态变量是被泛型类的所有实例所共享的。对于声明为
MyClass<T>
的类,访问其中的静态变量的方法仍然是MyClass.myStaticVar
。不管是通过new MyClass<String>
还是new MyClass<Integer>
创建的对象,都是共享一个静态变量。 -
泛型的类型参数不能用在
Java
异常处理的catch
语句中。因为异常处理是由JVM
在运行时刻来进行的。由于类型信息被擦除,JVM
是无法区分两个异常类型MyException<String>
和MyException<Integer>
的。对于JVM
来说,它们都是MyException
类型的,也就无法执行与异常对应的catch
语句。
当执行类型擦除时,首先是找到用来替换类型参数的具体类。这个具体类一般是Object
。如果指定了类型参数的上界的话,则使用这个上界。把代码中的类型参数都替换成具体的类。同时去掉出现的类型声明,即去掉<>
的内容。比如T get()
方法声明就变成了Object get()
;List<String>
就变成了List
。接下来就可能需要生成一些桥接方法(bridge method
),这是由于擦除了类型之后的类可能缺少某些必须的方法。比如考虑下面的代码:
class MyString implements Comparable<String> {
public int compareTo(String str) {
return 0;
}
}
当类型信息被擦除之后,上述类的声明变成了class MyString implements Comparable
。但是这样类MyString
就会有编译错误,因为没有实现接口Comparable
声明的compareTo(Object)
方法。这个时候就由编译器来动态生成这个方法。
实例分析
了解类型擦除机制之后,就会明白编译器承担了全部的类型检查工作。编译器禁止某些泛型的使用方式,正是为了确保类型的安全性。以List<Object>
和List<String>
为例来具体分析:
public void inspect(List<Object> list) {
for(Object obj : list) {
System.out.println(obj);
}
list.add(1); //这个操作在当前方法的上下文是合法的
}
public void test() {
List<String> strs = new ArrayList<String>();
inspect(strs); //编译错误
}
这段代码中,inspect
方法接受List<Object>
作为参数,当在test
方法中试图传入List<String>
的时候,会出现编译错误。假设这样的做法是允许的,那么在inspect
方法中就可以通过list.add(1)
来向集合中添加一个数字。这样在test
方法看来,其声明为List<String>
的集合中被添加了一个Integer
类型的对象,这显然是违反类型安全原则的,在某个时候肯定会抛出ClassCastException
。因此,编译器禁止这样的行为。
通配符与上下界
在使用泛型类的时候,既可以指定一个具体的类型,如List<String>
就声明了具体的类型是String
;也可以用通配符?
来表示未知类型,如List<?>
就声明了List
中包含的元素类型是未知的。通配符所代表的其实是一组类型,但具体的类型是未知的。List<?>
所声明的就是所有的类型都是可以的。但是List<?>
并不等同于List<Object>
。List<Object>
实际上确定了List
中包含的是Object
及其子类,在使用的时候可以通过Object
来进行引用。而List<?>
则表示其中所包含的元素类型是不确定。其中可能包含的是String
,也可能是Integer
。如果它包含了String
的话,往里面添加Integer
类型的元素就是错误的。正因为类型未知,就不能通过new ArrayList<?>()
的方法来创建一个新的ArrayList
对象。因为编译器无法知道具体的类型是什么。但是对于List<?>
中的元素总是可以用Object
来引用的,因为虽然类型未知,但肯定是Object
及其子类。考虑下面的代码:
public void wildcard(List<?> list) {
list.add(1); //编译错误
}
如上所示,试图对一个带通配符的泛型类进行操作的时候,总是会出现编译错误。其原因在于通配符所表示的类型是未知的。
因为对于List<?>
中的元素只能用Object
来引用,在有些情况下不是很方便。在这些情况下,可以使用上下界来限制未知类型的范围。如List<? extends Number>
说明List
中包含的是Number
及其子类。而List<? super Number>
则说明List
中包含的是Number
及其父类。当引入了上界时候,在使用类型的时候就可以使用上界类中定义的方法。比如访问List<? extends Number>
的时候,就可以使用Number
类的intValue
等方法。
类型系统
在Java
中,比较常见的是通过继承机制而产生的类型体系结构。比如String
继承自Object
。根据Liskov替换原则,子类是可以替换父类的。当需要Object
类的引用的时候,如果传入一个String
对象是没有任何问题的。但是反过来的话,即用父类的引用替换子类引用时,就需要进行强制类型转换。编译器并不能保证运行时刻的这种转换一定是合法的。这种自动的子类替换父类的转换机制,对于数组也是适用的。String[]
可以替换Object[]
。但是泛型的引入,对于这个类型系统产生了一定的影响。例如List<String>
是不能替换List<Object>
的。
引入泛型之后的类型系统增加了两个维度:一个是类型参数自身的继承体系结构,另外一个是泛型类或接口自身的继承体系结构。第一个指的是对于List<String>
和List<Object>
这样的情况,类型参数String
继承自Object
。而第二种指的是List
接口继承自Collection
接口。对于这个类型系统,有如下的一些规则:
-
相同类型参数的泛型类的关系取决于泛型类自身的继承体系结构。即
List<String>
是Collection<String>
的子类型,List<String>
可以替换Collection<String>
。这种情况也适用于带有上下界的类型声明。 -
当泛型类的类型声明中使用了通配符的时候,其子类可以在两个维度上分别展开。如对
Collection<? extends Number>
来说,其子类型可以在Collection
这个维度上展开,即List<? extends Number>
和Set<? extends Number>
等;也可以在Number
这个维度展开,即Collection<Double>
和Collection<Integer>
等。如此循环下去,ArrayList<Long>
和HashSet<Double>
等也都算是Collection<? extends Number>
的子类型。 -
如果泛型类中包含多个类型参数,则对每个类型参数分别应用上面的规则。
因此,对于上面错误的代码,只需要将List<Object>
修正为List<?>
即可。List<String>
是List<?>
的子类型。
开发自己的泛型类
泛型类与一般的Java
类基本相同,只是在类和接口定义上多出来了用<>
声明的类型参数。一个类可以有多个类型参数,比如MyClass<X, Y, Z>
。每个类型参数在声明的时候可以指定上下界。所声明的类型参数在Java
类中可以像一般的类型一样作为方法的参数和返回值,或是作为域和局部变量的类型。由于类型擦除机制,类型参数并不能用来创建对象或是作为静态变量的类型。考虑下面的泛型类中的正确和错误的用法。
class ClassTest<X extends Number, Y, Z> {
private X x;
private static Y y; //编译错误,不能用在静态变量中
public X getFirst() {
return x; //正确用法
}
public void wrong() {
Z z = new Z(); //编译错误,不能查创建对象
}
}
假设允许类型参数声明为静态属性,那么如下代码将会非常混乱。
public class Computer<T> {
private static T os;
public Computer(T os) {
this.os = os;
}
public T getOS() {
return os;
}
public static void main(String [] args) {
Computer<Linux> c1 = new Computer<>();
Computer<MacOS> c2 = new Computer<>();
Computer<Windows> c3 = new Computer<>();
System.out.println(c1.getOS());
System.out.println(c2.getOS());
System.out.println(c3.getOS());
}
}
因为os
为Computer
类的静态属性,所以c1
,c2
,c3
这3
个Computer
实例共享这个属性,那么此时os
的类型是什么?因此,不允许声明静态的类型参数属性。
总结
在使用Java
泛型的时候可以遵循一些基本的原则,从而避免一些常见的问题。
-
在代码中避免泛型类和原始类型的混用。比如
List<String>
和List
不应该共同使用。这样会产生一些编译器警告和潜在的运行时异常。 -
在使用带通配符的泛型类的时候,需要明确通配符所代表的一组类型的概念。由于具体的类型是未知的,很多操作是不允许的。
-
泛型类最好不要同数组一块儿使用。只能创建
new List<?>[10]
这样的数组,无法创建new List<String>[10]
这样的。这限制了数组的使用能力,而且会带来很多费解的问题。