17.1 Set接口
17.1.1 集合的存储特点
它不允许出现重复元素;
不保证集合中元素的顺序(无下标);
允许包含值为null的元素,但最多只能有一个null元素。
17.1.2.2 HashSet的实现原理
HashSet 是 Set 的实现类,为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。
实现Set接口的集合存储对象时:
根据每个对象的hash码值(调用hashCode()获得)用固定的算法算出它的存储索引,把对象存放在一个叫散列表的相应位置(表元)中:
存对象时,集合首先调用该对象的hashCode方法来获得该对象的hashCode值,与hash表中的值进行比较。
如果不存在,则直接把该对象存入集合中,并把该hashCode值存入hash表中,此次add操作结束。
如果存在,则进行下面的计算:
通过“==”操作符判断已经存入过的对象与要存入的对象是否为同一对象。如果true则集合认为添加相同对象,add失败。如果false(不是同一对象),则进行下面的计算:
- 调用要添加的对象的equals()方法,并把集合中的另一元素作为参数传入,如果返回值为true则集合认为添加相同对象,add失败。否则添加成功。
取对象时:根据对象的hash码值计算出它的存储索引,在散列表的相应位置(表元)上的元素间进行少量的比较操作就可以找出它。
Set接口存、取、删对象都有很高的效率。
对于要存放到Set集合中的对象,对应的类一定要重写equals()和hashCode(Object obj)方法以实现对象相等规则。
17.1.2.1 重写hashCode()与重写equals()
因为hashCode()和equals()方法的返回值共同决定了两个对象是否相等,所以覆写着两个方法时一般要保证两个方法的返回值保证兼容。
重写hashCode()和equals()方法的基本规则(建议):
如果两个对象通过equals()方法比较时返回true,则两个对象的hashCode()方法返回值应该也相等。
对象中用作equals()比较标准的成员变量(属性),也应该参与到hashCode的计算
17.1.3 LinkedHashSet(了解)
底层用链表记录了HashSet元素的插入顺序;
总结:一个‘有序’(迭代的顺序和插入的顺序一致)的HashSet:。
17.1.4 TreeSet(了解)
如果元素具备自然顺序( 实现了 Comparable<T>接口的类) 的特性,那么就按照元素自然顺序的特性进行排序存储。
如果元素不具备自然顺序的特性,那么不能存入 TreeSet集合。
Set集合不能存放重复的元素,而TreeSet在判断重复条件的情况下,除了 HashSet的规则之后,还会判断comparaTo方法。如果返回0.则识别为重复元素。