论文部分内容阅读
摘 要: Java设计者在设计java数据类时为程序开发人员提供可以存放同一类型数据的数组类和大量的容器类,而在实际开发时用较多的还是容器类较为普遍,然而在众多的容器类中常用的有List、Map和Set三类基于接口的容器类,这三类容器类中又各自有几种用于不同环境下的常用类,面对如此多的容器类,开发人员经常不知在何种情况下使用哪种容器类较好,有时会很随便的选择一个来使用然而忽略各个容器类的使用场合,就三类容器类中的几种常用类做一深入分析与比较。
关键词: Java;容器;线程;同步
中图分类号:TP312 文献标识码:A 文章编号:1671-7597(2011)1120147-01
0 引言
在Java开发中利用数组可以存放同一类型的数据,然而数组在定义时需要事先知道该数组中元素的数据类型和空间大小,并且要求所有元素的类型要一致。在很多情况下这样的限制对开发者而言很不方便,在很多时候我们需要这样的数组,那就是在定义时并不需要事先定义它们的大小,如果有这样一种数组,需要增加或删除数据时该数组的空间大小是可以动态改变的那就好了。解决该问题的办法是可以利用链表或一系列不同类型的容器类,容器类可以用在比较复杂的情况,例如不确定元素的个数、元素类型等等。
1 容器类的分类与实现
在使用时常见的有以下三类容器类:
1)List接口的容器类:常见的主要有ArrayList类、LinkedList类、Vector类和Stack类。
ArrayList类是由大小可变的数组实现的表结构。该类提供与数组类似的服务,还提供一些方法来操作内部用来存储列表的数组大小。可以使用add()添加对象,使用get()取出一个对象,允许对数组元素进行快速随机访问等。
LinkedList类是List接口的链接列表的一种实现方式。实现所有可选的列表操作,并且允许容纳所有类型元素(包括null)。所有操作都是按照双重链接列表的需要执行的。如果多个线程同时访问一个链接列表,而其中至少一个线程从结构上修改了该列表,则它必须保持外部同步。
Vector类可以实现可增长的对象数组。与数组一样,它包含可以使用整数索引进行访问的组件。
Stack类表示后进先出(LIFO)的对象堆栈。它通过五个操作对类Vector进行了扩展,允许将向量视为堆栈。它提供了通常的push和pop操作,以及取堆栈顶点的peek方法、测试堆栈是否为空的empty方法、在堆栈中查找项并确定到堆栈顶距离的search方法。
2)Map结构的容器类:Map保存的是一种对应关系,它将任意一个对象与另一个对象关联起来。主要有HashMap类、Hashtable类。
HashMap类是基于哈希表的Map接口的实现方式,此实现采用键值对的映射操作方式来操作数据,并允许使用null键和null值。该类不保证映射的顺序,特别是它不保证该顺序恒久不变。
Hashtable类实现一个哈希表,该哈希表将键映射到相应的值。任何非null对象都可以用作键或值。为了成功地在哈希表中存储和获取对象,用作键的对象必须实现hashCode方法和equals方法。除了非同步和允许使用null之外,HashMap类与Hashtable大致相同。
3)Set结构的容器类:正如它的名字一样,它具有集合的特性,其所含的元素只有一份。常见的主要有HashSet类。
HashSet类实现由哈希表(实际上是一个HashMap实例)支持的Set接口。它不保证set的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用null元素。此实现不是同步的,如果多个线程同时访问一个Hash set类,而其中至少一个线程修改了该set,那么它必须保持外部同步。
2 常用类的区别
2.1 ArrayList和Vector的区别
1)同步性方面:Vector是同步的,因此这个类中的一些方法保证了Vector中的对象是线程安全的。而ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的。因为同步的要求会影响执行的效率,所以如果不需要线程安全的容器类那么使用ArrayList是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销。
2)数据增长方面:从内部实现机制来讲ArrayList和Vector都是使用数组(Array)来控制容器中的对象。当向这种类型中增加元素的时候,如果元素的数目超出了内部数组目前的长度它们都需要扩展内部数组的长度。但是,Vector的大小可以根据需要增大或缩小,以适应创建Vector后进行添加或移除项的操作。Vector在缺省情况下自动增长原来数组长度的一倍。由于每个ArrayList实例都有一个容量,该容量用来存储列表元素数组的大小因此随着向ArrayList中不断添加元素而超出原数组大小时ArrayList自动增长原数组大小一半的空间,所以最后这个容器所占的空间总是比它实际需要的要大。所以如果要在容器中保存大量的数据则使用Vector会有一些优势,因为你可以通过设置容器的初始化大小来避免不必要的资源开销。
2.2 HashMap和Hashtable的区别
1)Hashtable是基于陈旧的Dictionary类的,而HashMap是java1.2引进的Map接口的一个实现。
2)同步性方面:Hashtable是线程同步的。这个类中的一些方法保证了Hashtable中的对象是线程安全的,而HashMap则是异步的,因此HashMap中的对象并不是线程安全的。线程安全是指如果不同的线程来访问同一个Hashtable中的数据,那么Hashtable中的数据就不安全。存在被任何一个线程将其中某些数据进行修改的可能,此时,我们应该对其加锁的机制来保证Hashtable中数据的安全问题。有了同步机制则线程是安全的,但是不同线程访问Hashtable中的数据的速度则会降下来。大部分的程序在运行时是在单机上的,因此使用HashMap效率会高一些,如果某些程序是运行在服务器上的,此时就必须考虑线程安全问题。
因为同步的要求会影响执行的效率,所以如果你不需要线程安全的容器那么使用HashMap是一个很好的选择,这样可以避免由于同步带来的不必要的系统开销,从而提高效率。
3)值:HashMap可以将空值作为一个表的条目的key或value,但是Hashtable是不能放入空值(null)的。例如:
Hashtable ht=new Hashtable();
ht.put(null,null);
System.out.println(“测试”+ht.get(null));
此时编译器会报一个空指针类型的错误。
如果换成HashMap
HashMap hm=new HashMap();
hm.put(null,null);
System.out.println(“测试”+hm.get(null));
上面的用法比较死,可以用Map接口的方式来接收一个对象
Map hm=new HashMap();
Hm.put(null,null);
System.out.println(“测试”+hm.get(null));
前面的ArrayList等都可以这样做
这样做的好处就是很好的利用了类的多态性这个特点使得写程序更加方便。
3 总结
Java设计者给我们提供了各种类型的容器类,这对于以后的编程是相当有用的,具体什么时候使用哪个容器类这要根据上面分析的不同类型的容器类的异同来选取。根据实际使用情况现总结以下几点:
1)如果程序中要求线程安全则使用Vector和Hashtable这两类容器。
2)如果程序不要求线程安全则可使用ArrayList、LinkedList、HashMap容器类。
3)如果要求键值对方式时则选择使用HashMap和Hashtable容器类。
4)如果数据量很大又要考虑线程安全则最好使用Vector容器类。
参考文献:
[1]辛运帏、饶一梅,Java程序设计教程[M].北京:机械工业出版社,2007.
[2]姜志强,Java语言程序设计[M].北京:电子工业出版社,2007.
[3]Bruce Eckel,Java编程思想[M].北京:机械工业出版社,2005.
[4]http://www.javaworld.com.
关键词: Java;容器;线程;同步
中图分类号:TP312 文献标识码:A 文章编号:1671-7597(2011)1120147-01
0 引言
在Java开发中利用数组可以存放同一类型的数据,然而数组在定义时需要事先知道该数组中元素的数据类型和空间大小,并且要求所有元素的类型要一致。在很多情况下这样的限制对开发者而言很不方便,在很多时候我们需要这样的数组,那就是在定义时并不需要事先定义它们的大小,如果有这样一种数组,需要增加或删除数据时该数组的空间大小是可以动态改变的那就好了。解决该问题的办法是可以利用链表或一系列不同类型的容器类,容器类可以用在比较复杂的情况,例如不确定元素的个数、元素类型等等。
1 容器类的分类与实现
在使用时常见的有以下三类容器类:
1)List接口的容器类:常见的主要有ArrayList类、LinkedList类、Vector类和Stack类。
ArrayList类是由大小可变的数组实现的表结构。该类提供与数组类似的服务,还提供一些方法来操作内部用来存储列表的数组大小。可以使用add()添加对象,使用get()取出一个对象,允许对数组元素进行快速随机访问等。
LinkedList类是List接口的链接列表的一种实现方式。实现所有可选的列表操作,并且允许容纳所有类型元素(包括null)。所有操作都是按照双重链接列表的需要执行的。如果多个线程同时访问一个链接列表,而其中至少一个线程从结构上修改了该列表,则它必须保持外部同步。
Vector类可以实现可增长的对象数组。与数组一样,它包含可以使用整数索引进行访问的组件。
Stack类表示后进先出(LIFO)的对象堆栈。它通过五个操作对类Vector进行了扩展,允许将向量视为堆栈。它提供了通常的push和pop操作,以及取堆栈顶点的peek方法、测试堆栈是否为空的empty方法、在堆栈中查找项并确定到堆栈顶距离的search方法。
2)Map结构的容器类:Map保存的是一种对应关系,它将任意一个对象与另一个对象关联起来。主要有HashMap类、Hashtable类。
HashMap类是基于哈希表的Map接口的实现方式,此实现采用键值对的映射操作方式来操作数据,并允许使用null键和null值。该类不保证映射的顺序,特别是它不保证该顺序恒久不变。
Hashtable类实现一个哈希表,该哈希表将键映射到相应的值。任何非null对象都可以用作键或值。为了成功地在哈希表中存储和获取对象,用作键的对象必须实现hashCode方法和equals方法。除了非同步和允许使用null之外,HashMap类与Hashtable大致相同。
3)Set结构的容器类:正如它的名字一样,它具有集合的特性,其所含的元素只有一份。常见的主要有HashSet类。
HashSet类实现由哈希表(实际上是一个HashMap实例)支持的Set接口。它不保证set的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用null元素。此实现不是同步的,如果多个线程同时访问一个Hash set类,而其中至少一个线程修改了该set,那么它必须保持外部同步。
2 常用类的区别
2.1 ArrayList和Vector的区别
1)同步性方面:Vector是同步的,因此这个类中的一些方法保证了Vector中的对象是线程安全的。而ArrayList则是异步的,因此ArrayList中的对象并不是线程安全的。因为同步的要求会影响执行的效率,所以如果不需要线程安全的容器类那么使用ArrayList是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销。
2)数据增长方面:从内部实现机制来讲ArrayList和Vector都是使用数组(Array)来控制容器中的对象。当向这种类型中增加元素的时候,如果元素的数目超出了内部数组目前的长度它们都需要扩展内部数组的长度。但是,Vector的大小可以根据需要增大或缩小,以适应创建Vector后进行添加或移除项的操作。Vector在缺省情况下自动增长原来数组长度的一倍。由于每个ArrayList实例都有一个容量,该容量用来存储列表元素数组的大小因此随着向ArrayList中不断添加元素而超出原数组大小时ArrayList自动增长原数组大小一半的空间,所以最后这个容器所占的空间总是比它实际需要的要大。所以如果要在容器中保存大量的数据则使用Vector会有一些优势,因为你可以通过设置容器的初始化大小来避免不必要的资源开销。
2.2 HashMap和Hashtable的区别
1)Hashtable是基于陈旧的Dictionary类的,而HashMap是java1.2引进的Map接口的一个实现。
2)同步性方面:Hashtable是线程同步的。这个类中的一些方法保证了Hashtable中的对象是线程安全的,而HashMap则是异步的,因此HashMap中的对象并不是线程安全的。线程安全是指如果不同的线程来访问同一个Hashtable中的数据,那么Hashtable中的数据就不安全。存在被任何一个线程将其中某些数据进行修改的可能,此时,我们应该对其加锁的机制来保证Hashtable中数据的安全问题。有了同步机制则线程是安全的,但是不同线程访问Hashtable中的数据的速度则会降下来。大部分的程序在运行时是在单机上的,因此使用HashMap效率会高一些,如果某些程序是运行在服务器上的,此时就必须考虑线程安全问题。
因为同步的要求会影响执行的效率,所以如果你不需要线程安全的容器那么使用HashMap是一个很好的选择,这样可以避免由于同步带来的不必要的系统开销,从而提高效率。
3)值:HashMap可以将空值作为一个表的条目的key或value,但是Hashtable是不能放入空值(null)的。例如:
Hashtable ht=new Hashtable();
ht.put(null,null);
System.out.println(“测试”+ht.get(null));
此时编译器会报一个空指针类型的错误。
如果换成HashMap
HashMap hm=new HashMap();
hm.put(null,null);
System.out.println(“测试”+hm.get(null));
上面的用法比较死,可以用Map接口的方式来接收一个对象
Map hm=new HashMap();
Hm.put(null,null);
System.out.println(“测试”+hm.get(null));
前面的ArrayList等都可以这样做
这样做的好处就是很好的利用了类的多态性这个特点使得写程序更加方便。
3 总结
Java设计者给我们提供了各种类型的容器类,这对于以后的编程是相当有用的,具体什么时候使用哪个容器类这要根据上面分析的不同类型的容器类的异同来选取。根据实际使用情况现总结以下几点:
1)如果程序中要求线程安全则使用Vector和Hashtable这两类容器。
2)如果程序不要求线程安全则可使用ArrayList、LinkedList、HashMap容器类。
3)如果要求键值对方式时则选择使用HashMap和Hashtable容器类。
4)如果数据量很大又要考虑线程安全则最好使用Vector容器类。
参考文献:
[1]辛运帏、饶一梅,Java程序设计教程[M].北京:机械工业出版社,2007.
[2]姜志强,Java语言程序设计[M].北京:电子工业出版社,2007.
[3]Bruce Eckel,Java编程思想[M].北京:机械工业出版社,2005.
[4]http://www.javaworld.com.