Set接口及其实现类的底层应用

一、Set

Set 接口是 Collection 的子接口，set 接口没有提供额外的方法

Set 集合不允许包含相同的元素，如果试把两个相同的元素加入同一个 Set 集合中，则添加操作失败。

Set 判断两个对象是否相同不是使用 == 运算符，而是根据 equals() 方法进行判断

Set 存储是无序的、不可存储重复的数据。

其中，Set接口拥有两个自己的实现类，分别是：HashSet和TreeSet。

二、HashSet

作为Set接口的主要实现类；线程不安全的；可以存储null值

HashSet的底层：数组+链表构造方法

//无参构造方法，完成map的创建
public HashSet() {
    map = new HashMap<>();
}
//指定集合转化为HashSet, 完成map的创建
public HashSet(Collection c) {
   map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
   addAll(c);
}
//指定初始化大小，和负载因子
public HashSet(int initialCapacity, float loadFactor) {
    map = new HashMap<>(initialCapacity, loadFactor);
}
//指定初始化大小
public HashSet(int initialCapacity) {
    map = new HashMap<>(initialCapacity);
}
//指定初始化大小和负载因子，dummy 无实际意义
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
    map = new linkedHashMap<>(initialCapacity, loadFactor);
}

通过构造函数可以发现，HashSet底层是采用HashMap实现的。

add( )方法

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
}

我们向HashSet中添加元素a，首先调用元素a所在类的hashCode()方法，计算元素a的哈希值，此时哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置（即为：索引位置），判断数组此位置上是否已经有元素：

如果此位置上没有其他元素，则元素a添加成功

如果此位置上有其他元素b（或一链表形式存在的多个元素），则比较元素a与元素b的hash值：
如果hash值不相同，则元素a添加成功
如果hash值相同，进而需要调用元素a所在类的equals()方法：
equals()返回true，则元素a添加失败
equals()返回false，则元素a添加成功

static final int hash(Object key) {
        int h;
        // key.hashCode()：返回散列值也就是hashcode
        // ^ ：按位异或
        // >>>:无符号右移，忽略符号位，空位都以0补齐
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

public boolean equals(Object obj) {
        return (this == obj);
}

remove( )方法

  
public boolean remove(Object o) {  
    return map.remove(o)==PRESENT;  
}  

public boolean remove(Object o) {
	if (o == null) {
		for (int index = 0; index < size; index++)

		if (elementData[index] == null) {
			fastRemove(index);

			return true;
		}
	} else {
		for (int index = 0; index < size; index++)
			if (o.equals(elementData[index])) {
				fastRemove(index);

				return true;
	
		}
	}

	return false;
}

三、linkedHashSet

linkedHashSet作为HashSet的子类，在添加数据的同时，每个数据还维护了两个引用，记录数据的前一个数据和后一个数据

优点：对于频繁的遍历操作，linkedHashSet效率高于HashSet

	public void test1(){

        Set set = new HashSet();
        set.add(456);
        set.add(123);
        set.add(123);
        set.add("AA");
        set.add("CC");
        set.add(false);

        Iterator iterator = set.iterator();
        while(iterator.hasNext())
        {
            System.out.println(iterator.next());
        }

        System.out.println("******************");
        linkedHashSet linkedHashSet = new linkedHashSet();
        linkedHashSet.add("aa");
        linkedHashSet.add("bb");
        linkedHashSet.add("cc");
        linkedHashSet.add("aa");
        linkedHashSet.add("dd");

        Iterator iterator1 = linkedHashSet.iterator();
        while(iterator1.hasNext())
        {
            System.out.println(iterator1.next());
        }
    }

运行结果：

四、TreeSet

TreeSet中存放的元素是有序的（不是插入时的顺序，是有按关键字大小排序的），且元素不能重复。
而如何实现有序存储，就需要有一个比较器，其实说起来，TreeSet更受关注的是不重复且有序，这个有序就需要有一个compare的过程，因此会需要参数实现Comparable接口。

排序方式完全取决于使用的构造方法。
使用元素的自然顺序对元素进行排序（自然排序）
根据创建 set 时提供的 Comparator 进行排序（比较器排序）
TreeSet保证元素的排序和唯一性的
底层数据结构是红黑树(自平衡二叉树)

    
    public TreeSet(Comparator comparator) {
        this(new TreeMap<>(comparator));
    }

Set接口及其实现类的底层应用

Java相关栏目本月热门文章