17.1 Set接口

17.1.1 集合的存储特点

  1. 它不允许出现重复元素;

  2. 不保证集合中元素的顺序(无下标);

  3. 允许包含值为null的元素,但最多只能有一个null元素。

17.1.2.2 HashSet的实现原理

HashSet 是 Set 的实现类,为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。

实现Set接口的集合存储对象时:

  1. 根据每个对象的hash码值(调用hashCode()获得)用固定的算法算出它的存储索引,把对象存放在一个叫散列表的相应位置(表元)中:

    存对象时,集合首先调用该对象的hashCode方法来获得该对象的hashCode值,与hash表中的值进行比较。

    1. 如果不存在,则直接把该对象存入集合中,并把该hashCode值存入hash表中,此次add操作结束。

    2. 如果存在,则进行下面的计算:

      1. 通过“==”操作符判断已经存入过的对象与要存入的对象是否为同一对象。如果true则集合认为添加相同对象,add失败。如果false(不是同一对象),则进行下面的计算:

        1. 调用要添加的对象的equals()方法,并把集合中的另一元素作为参数传入,如果返回值为true则集合认为添加相同对象,add失败。否则添加成功。
  2. 取对象时:根据对象的hash码值计算出它的存储索引,在散列表的相应位置(表元)上的元素间进行少量的比较操作就可以找出它。

  3. Set接口存、取、删对象都有很高的效率。

对于要存放到Set集合中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法以实现对象相等规则。

17.1.2.1 重写hashCode()与重写equals()

因为hashCode()和equals()方法的返回值共同决定了两个对象是否相等,所以覆写着两个方法时一般要保证两个方法的返回值保证兼容。

重写hashCode()和equals()方法的基本规则(建议):

  1. 如果两个对象通过equals()方法比较时返回true,则两个对象的hashCode()方法返回值应该也相等。

  2. 对象中用作equals()比较标准的成员变量(属性),也应该参与到hashCode的计算

17.1.3 LinkedHashSet(了解)

底层用链表记录了HashSet元素的插入顺序;

总结:一个‘有序’(迭代的顺序和插入的顺序一致)的HashSet:。

17.1.4 TreeSet(了解)

如果元素具备自然顺序( 实现了 Comparable<T>接口的类) 的特性,那么就按照元素自然顺序的特性进行排序存储。

如果元素不具备自然顺序的特性,那么不能存入 TreeSet集合。

Set集合不能存放重复的元素,而TreeSet在判断重复条件的情况下,除了 HashSet的规则之后,还会判断comparaTo方法。如果返回0.则识别为重复元素。

results matching ""

    No results matching ""