Java 泛型进阶

8,817 阅读11分钟

擦除

在泛型代码内部,无法获得任何有关泛型参数类型的信息。

例子1:

//这个例子表明编译过程中并没有根据参数生成新的类型
public class Main2 {
    public static void main(String[] args) {
        Class c1 = new ArrayList().getClass();
        Class c2 = new ArrayList().getClass();
        System.out.print(c1 == c2);
    }
}
/* output
true
*/

List 中添加 Integer 将不会通过编译,但是ListList在运行时的确是同一种类型。

例子2:

//例子, 这个例子表明类的参数类型跟传进去的类型没有关系,泛型参数只是`占位符`
public class Table {
}
public class Room {
}
public class House {
}
public class Particle {
}
public class Main {
    public static void main(String[] args) {
        List tableList = new ArrayList
(); Map maps = new HashMap(); House house = new House(); Particle particle = new Particle(); System.out.println(Arrays.toString(tableList.getClass().getTypeParameters())); System.out.println(Arrays.toString(maps.getClass().getTypeParameters())); System.out.println(Arrays.toString(house.getClass().getTypeParameters())); System.out.println(Arrays.toString(particle.getClass().getTypeParameters())); } } /** output [E] [K, V] [Q] [POSITION, MOMENTUM] */

我们在运行期试图获取一个已经声明的类的类型参数,发现这些参数依旧是‘形参’,并没有随声明改变。也就是说在运行期,我们是拿不到已经声明的类型的任何信息。

编译器会虽然在编译过程中移除参数的类型信息,但是会保证类或方法内部参数类型的一致性。

例子:

List stringList=new ArrayList();
//可以通过编译
stringList.add("wakaka");
//编译不通过
//stringList.add(new Integer(0));

//List.java
public interface List extends Collection {
//...
boolean add(E e);
//...
}

List的参数类型是Eadd方法的参数类型也是E,他们在类的内部是一致的,所以添加Integer类型的对象到stringList违反了内部类型一致,不能通过编译。

重用 extends 关键字。通过它能给与参数类型添加一个边界。

泛型参数将会被擦除到它的第一个边界(边界可以有多个)。编译器事实上会把类型参数替换为它的第一个边界的类型。如果没有指明边界,那么类型参数将被擦除到Object。下面的例子中,可以把泛型参数T当作HasF类型来使用。

例子:

/** * Created by yxf on 16-5-28. */
// HasF.java
public interface HasF {
    void f();
}

//Manipulator.java
public class Manipulator {
    T obj;
    public T getObj() {
        return obj;
    }
    public void setObj(T obj) {
        this.obj = obj;
    }
}

extend关键字后后面的类型信息决定了泛型参数能保留的信息。

Java中擦除的基本原理

刚看到这里可能有些困惑,一个泛型类型没有保留具体声明的类型的信息,那它是怎么工作的呢?在把《Java编程思想》书中这里的边界与上文的边界区分开来之后,终于想通了。Java的泛型类的确只有一份字节码,但是在使用泛型类的时候编译器做了特殊的处理。

这里根据作者的思路,自己动手写了两个类SimpleHolderGenericHolder,然后编译拿到两个类的字节码,直接贴在这里:

// SimpleHolder.java
public class SimpleHolder {
    private Object obj;
    public Object getObj() {
        return obj;
    }
    public void setObj(Object obj) {
        this.obj = obj;
    }
    public static void main(String[] args) {
        SimpleHolder holder = new SimpleHolder();
        holder.setObj("Item");
        String s = (String) holder.getObj();
    }
}
// SimpleHolder.class
public class SimpleHolder {
  public SimpleHolder();
    Code:
       0: aload_0       
       1: invokespecial #1                  // Method java/lang/Object."":()V
       4: return        

  public java.lang.Object getObj();
    Code:
       0: aload_0       
       1: getfield      #2                  // Field obj:Ljava/lang/Object;
       4: areturn       

  public void setObj(java.lang.Object);
    Code:
       0: aload_0       
       1: aload_1       
       2: putfield      #2                  // Field obj:Ljava/lang/Object;
       5: return        

  public static void main(java.lang.String[]);
    Code:
       0: new           #3                  // class SimpleHolder
       3: dup           
       4: invokespecial #4                  // Method "":()V
       7: astore_1      
       8: aload_1       
       9: ldc           #5                  // String Item
      11: invokevirtual #6                  // Method setObj:(Ljava/lang/Object;)V
      14: aload_1       
      15: invokevirtual #7                  // Method getObj:()Ljava/lang/Object;
      18: checkcast     #8                  // class java/lang/String
      21: astore_2      
      22: return        
}
//GenericHolder.java
public class GenericHolder {
    T obj;
    public T getObj() {
        return obj;
    }
    public void setObj(T obj) {
        this.obj = obj;
    }
    public static void main(String[] args) {
        GenericHolder holder = new GenericHolder<>();
        holder.setObj("Item");
        String s = holder.getObj();
    }
}

//GenericHolder.class
public class GenericHolder {
  T obj;

  public GenericHolder();
    Code:
       0: aload_0       
       1: invokespecial #1                  // Method java/lang/Object."":()V
       4: return        

  public T getObj();
    Code:
       0: aload_0       
       1: getfield      #2                  // Field obj:Ljava/lang/Object;
       4: areturn       

  public void setObj(T);
    Code:
       0: aload_0       
       1: aload_1       
       2: putfield      #2                  // Field obj:Ljava/lang/Object;
       5: return        

  public static void main(java.lang.String[]);
    Code:
       0: new           #3                  // class GenericHolder
       3: dup           
       4: invokespecial #4                  // Method "":()V
       7: astore_1      
       8: aload_1       
       9: ldc           #5                  // String Item
      11: invokevirtual #6                  // Method setObj:(Ljava/lang/Object;)V
      14: aload_1       
      15: invokevirtual #7                  // Method getObj:()Ljava/lang/Object;
      18: checkcast     #8                  // class java/lang/String
      21: astore_2      
      22: return        
}

经过一番比较之后,发现两分源码虽然不同,但是对应的字节码逻辑部分确是完全相同的。

在编译过程中,类型变量的信息是能拿到的。所以,set方法在编译器可以做类型检查,非法类型不能通过编译。但是对于get方法,由于擦除机制,运行时的实际引用类型为Object类型。为了‘还原’返回结果的类型,编译器在get之后添加了类型转换。所以,在GenericHolder.class文件main方法主体第18行有一处类型转换的逻辑。它是编译器自动帮我们加进去的。

所以在泛型类对象读取和写入的位置为我们做了处理,为代码添加约束。

擦除的缺陷

泛型类型不能显式地运用在运行时类型的操作当中,例如:转型、instanceofnew。因为在运行时,所有参数的类型信息都丢失了。

public class Erased {
    private final int SIZE = 100;
    public static void f(Object arg) {
        //编译不通过
        if (arg instanceof T) {
        }
        //编译不通过
        T var = new T();
        //编译不通过
        T[] array = new T[SIZE];
        //编译不通过
        T[] array = (T) new Object[SIZE];
    }
}

擦除的补偿

1. 类型判断问题

例子:

class Building {}
class House extends Building {}
public class ClassTypeCapture {
    Class kind;
    public ClassTypeCapture(Class kind) {
        this.kind = kind;
    }
    public boolean f(Object arg) {
        return kind.isInstance(arg);
    }
    public static void main(String[] args) {
        ClassTypeCapture ctt1 = new ClassTypeCapture(Building.class);
        System.out.println(ctt1.f(new Building()));
        System.out.println(ctt1.f(new House()));
        ClassTypeCapture ctt2 = new ClassTypeCapture(House.class);
        System.out.println(ctt2.f(new Building()));
        System.out.print(ctt2.f(new House()));
    }
}
//output
//true
//true
//false
//true

泛型参数的类型无法用instanceof关键字来做判断。所以我们使用类类型来构造一个类型判断器,判断一个实例是否为特定的类型。

2. 创建类型实例

Erased.java中不能new T()的原因有两个,一是因为擦除,不能确定类型;而是无法确定T是否包含无参构造函数。

为了避免这两个问题,我们使用显式的工厂模式:

例子:

interface IFactory {
    T create();
}

class Foo2 {
    private T x;

    public > Foo2(F factory) {
        x = factory.create();
    }
}

class IntegerFactory implements IFactory {
    @Override
    public Integer create() {
        return new Integer(0);
    }
}

class Widget {
    public static class Factory implements IFactory {
        @Override
        public Widget create() {
            return new Widget();
        }
    }
}

public class FactoryConstraint {
    public static void main(String[] args) {
        new Foo2(new IntegerFactory());
        new Foo2(new Widget.Factory());
    }
}

通过特定的工厂类实现特定的类型能够解决实例化类型参数的需求。

3. 创建泛型数组

一般不建议创建泛型数组。尽量使用ArrayList来代替泛型数组。但是在这里还是给出一种创建泛型数组的方法。

public class GenericArrayWithTypeToken {
    private T[] array;

    @SuppressWarnings("unchecked")
    public GenericArrayWithTypeToken(Class type, int sz) {
        array = (T[]) Array.newInstance(type, sz);
    }

    public void put(int index, T item) {
        array[index] = item;
    }

    public T[] rep() {
        return array;
    }

    public static void main(String[] args) {
        GenericArrayWithTypeToken gai = new GenericArrayWithTypeToken(Integer.class, 10);
        Integer[] ia = gai.rep();
    }
}

这里我们使用的还是传参数类型,利用类型的newInstance方法创建实例的方式。

边界

这里Java重用了 extend关键字。边界可以将类型参数的范围限制到一个子集当中。

interface HasColor {
    Color getColor();
}

class Colored {
    T item;

    public Colored(T item) {
        this.item = item;
    }

    public T getItem() {
        return item;
    }

    public Color color() {
        return item.getColor();
    }
}

class Dimension {
    public int x, y, z;
}

class ColoredDemension {
    T item;

    public ColoredDemension(T item) {
        this.item = item;
    }

    public T getItem() {
        return item;
    }

    Color color() {
        return item.getColor();
    }

    int getX() {
        return item.x;
    }

    int getY() {
        return item.y;
    }

    int getZ() {
        return item.z;
    }

}

interface Weight {
    int weight();
}

class Solid {
    T item;

    public Solid(T item) {
        this.item = item;
    }

    public T getItem() {
        return item;
    }

    Color color() {
        return item.getColor();
    }

    int getX() {
        return item.x;
    }

    int getY() {
        return item.y;
    }

    int getZ() {
        return item.z;
    }

    int weight() {
        return item.weight();
    }
}

class Bounded extends Dimension implements HasColor, Weight {
    @Override
    public Color getColor() {
        return null;
    }

    @Override
    public int weight() {
        return 0;
    }
}

public class BasicBound {
    public static void main(String[] args) {
        Solid solid = new Solid(new Bounded());
        solid.color();
        solid.weight();
        solid.getZ();
    }
}

extends关键字声明中,有两个要注意的地方:

  1. 类必须要写在接口之前;
  2. 只能设置一个类做边界,其它均为接口。

通配符

协变:

public class Holder {
    private T value;

    public Holder(T apple) {
    }

    public T getValue() {
        return value;
    }

    public void setValue(T value) {
        this.value = value;
    }

    @Override
    public boolean equals(Object o) {
        return value != null && value.equals(o);
    }

    public static void main(String[] args) {
        Holder appleHolder = new Holder(new Apple());
        Apple d = new Apple();
        appleHolder.setValue(d);

        // 不能自动协变
        // Holder fruitHolder=appleHolder;

        // 借助 ? 通配符和 extends 关键字可以实现协变
        Holder fruitHolder = appleHolder;

        // 返回一个Fruit,因为添加边界之后返回的对象是 ? extends Fruit,
        // 可以把它转型为Apple,但是在不知道具体类型的时候存在风险
        d = (Apple) fruitHolder.getValue();

        //Fruit以及Fruit的父类,就不需要转型
        Fruit fruit = fruitHolder.getValue();
        Object obj = fruitHolder.getValue();

        try {
            Orange c = (Orange) fruitHolder.getValue();
        } catch (Exception e) {
            System.out.print(e);
        }

        // 编译不通过,因为编译阶段根本不知道子类型到底是什么类型
        //        fruitHolder.setValue(new Apple());
        //        fruitHolder.setValue(new Orange());

        //这里是可以的因为equals方法接受的是Object作为参数,并不是 ? extends Fruit
        System.out.print(fruitHolder.equals(d));
    }
}

在Java中父类型可以持有子类型。如果一个父类的容器可以持有子类的容器,那么我们就可以称为发生了协变。在java中,数组是自带协变的,但是泛型的容器没有自带协变。我们可以根据利用边界和通配符?来实现近似的协变。

Holder就是一种协变的写法。它表示一个列表,列表持有的类型是Fruit或其子类。

这个Holder运行时持有的类型是未知的,我们只知道它一定是Fruit的子类。正因为如此,所以我们无法向这个holder中放入任何类型的对象,Object类型的对象也不可以。但是,调用它的返回方法却是可以的。因为边界明确定义了它是Fruit类型的子类。

逆变:

package wildcard;

import java.util.ArrayList;
import java.util.List;

public class GenericWriting {
    static  void writeExact(List list, T item) {
        list.add(item);
    }

    static List apples = new ArrayList();
    static List fruits = new ArrayList();

    static void f1() {
        writeExact(apples, new Apple());
        //this cannot be compile,said in Thinking in Java
        writeExact(fruits, new Apple());
    }

    static  void writeWithWildcard(List list, T item) {
        list.add(item);
    }

    static void f2() {
        writeWithWildcard(apples, new Apple());
        writeWithWildcard(fruits, new Apple());
    }

    static  readWithWildcard(List list, int index) {
        //Compile Error, required T but found Object
        return list.get(index);
    }
    public static void main(String[] args) {
        f1();
        f2();
    }
}

如果一个类的父类型容器可以持有该类的子类型的容器,我们称这种关系为逆变。声明方式List, List list

不能给泛型参数给出一个超类型边界;即不能声明List

上面的例子中,writeExact(fruits,new Apple());《Java编程思想》中说是不能通过编译的,但我试了一下,在Java1.6,Java1.7中是可以编译的。不知道是不是编译器比1.5版本升级了。

由于给出了参数类型的‘下界’,所以我们可以在列表中添加数据而不会出现类型错误。但是使用get方法获取返回类型的时候要注意,由于声明的类型区间是Object到T具有继承关系的类。所以返回的类型为了确保没有问题,都是以Object类型返回回来的。比如过例子中list.get(index)的返回类型就是Object

无界通配符

无界通配符 意味着可以使用任何对象,因此使用它类似于使用原生类型。但它是有作用的,原生类型可以持有任何类型,而无界通配符修饰的容器持有的是某种具体的类型。举个例子,在List类型的引用中,不能向其中添加Object, 而List类型的引用就可以添加Object类型的变量。

一些需要注意的问题

1. 任何基本类型都不能作为类型参数

2. 实现参数化接口

例子:

interface Payable{}
class Employee implements Payable {}
//Compile Error
class Hourly extends Employee implements Payable {}

因为擦除的原因,PayablePayable简化为相同的Payable,例子中的代码意味着重复两次实现相同的接口。但他们的参数类型却是不相同的。

3. 转型和警告

使用带有泛型类型参数的转型或者instanceof不会有任何效果。因为他们在运行时都会被擦除到上边界上。所以转型的时候用的类型实际上是上边解对应的类型。

4. 重载

//Compile Error. 编译不能通过
public class UseList{
    void f(List v){}
    void f(List v){}
}

由于擦除的原因,重载方法将产生相同的类型签名。避免这种问题的方法就是换个方法名。

5. 基类劫持接口

例子:

public class ComparablePet implements Comparable{
    public int compareTo(ComparablePet arg) {return 0;}
}
class Cat extends ComparablePet implements Comparable{
    // Error: Comparable connot be inherited with
    // different arguments:  and 
    public int compareTo(Cat arg);
}

父类中我们为Comparable确定了ComparablePet参数,那么其它任何类型都不能再与ComparablePet之外的对象再比较。子类中不能对同一个接口用不同的参数实现两次。这有点类似于第四点中的重载。
但是我们可以在子类中覆写父类中的方法。

关于泛型问题就先了解这么多,有什么不对的地方还请大家指正。也欢迎小伙伴们一起交流。