ES6 Set 数据结构

  • 基本用法

    ES6 提供了新的数据结构 Set。它类似于数组,但是成员的值都是唯一的,没有重复的值。
    Set 本身是一个构造函数,用来生成 Set 数据结构。
    const s = new Set();
    [2, 3, 5, 4, 5, 2, 2].forEach(x => s.add(x));
    
    for (let i of s) {
     console.log(i);
    }
    // 2 3 5 4
    
    上面代码通过 add() 方法向 Set 结构加入成员,结果表明 Set 结构不会添加重复的值。
    Set 函数可以接受一个数组(或者具有 iterable 接口的其他数据结构)作为参数,用来初始化。
    // 例一
    const set = new Set([1, 2, 3, 4, 4]);
    [...set]
    // [1, 2, 3, 4]
    
    // 例二
    const items = new Set([1, 2, 3, 4, 5, 5, 5, 5]);
    items.size // 5
    
    // 例三
    const set = new Set(document.querySelectorAll('div'));
    set.size // 56
    
    // 类似于
    const set = new Set();
    document
     .querySelectorAll('div')
     .forEach(div => set.add(div));
    set.size // 56
    
    上面代码中,例一和例二都是 Set 函数接受数组作为参数,例三是接受类似数组的对象作为参数。
    上面代码也展示了一种去除数组重复成员的方法。
    // 去除数组的重复成员
    [...new Set(array)]
    
    上面的方法也可以用于,去除字符串里面的重复字符。
    [...new Set('ababbc')].join('')
    // "abc"
    
    Set 加入值的时候,不会发生类型转换,所以 5 和 "5" 是两个不同的值。Set 内部判断两个值是否不同,使用的算法叫做 “Same-value-zero equality”,它类似于精确相等运算符(===),主要的区别是向 Set 加入值时认为NaN等于自身,而精确相等运算符认为NaN不等于自身。
    let set = new Set();
    let a = NaN;
    let b = NaN;
    set.add(a);
    set.add(b);
    set // Set {NaN}
    
    上面代码向 Set 实例添加了两次 NaN,但是只会加入一个。这表明,在 Set 内部,两个 NaN 是相等的。
    另外,两个对象总是不相等的。
    let set = new Set();
    set.add({});
    set.size // 1
    
    set.add({});
    set.size // 2
    
    上面代码表示,由于两个空对象不相等,所以它们被视为两个值。
  • Set 实例的属性和方法

    Set 结构的实例有以下属性。
    • Set.prototype.constructor:构造函数,默认就是 Set 函数。
    • Set.prototype.size:返回 Set 实例的成员总数。
    Set 实例的方法分为两大类:操作方法(用于操作数据)和遍历方法(用于遍历成员)。下面先介绍四个操作方法。
    • Set.prototype.add(value):添加某个值,返回 Set 结构本身。
    • Set.prototype.delete(value):删除某个值,返回一个布尔值,表示删除是否成功。
    • Set.prototype.has(value):返回一个布尔值,表示该值是否为 Set 的成员。
    • Set.prototype.clear():清除所有成员,没有返回值。
    上面这些属性和方法的实例如下。
    s.add(1).add(2).add(2);
    // 注意2被加入了两次
    
    s.size // 2
    
    s.has(1) // true
    s.has(2) // true
    s.has(3) // false
    
    s.delete(2);
    s.has(2) // false
    
    下面是一个对比,看看在判断是否包括一个键上面,Object 结构和 Set 结构的写法不同。
    // 对象的写法
    const properties = {
     'width': 1,
     'height': 1
    };
    
    if (properties[someName]) {
     // do something
    }
    
    // Set的写法
    const properties = new Set();
    
    properties.add('width');
    properties.add('height');
    
    if (properties.has(someName)) {
     // do something
    }
    
    Array.from 方法可以将 Set 结构转为数组。
    const items = new Set([1, 2, 3, 4, 5]);
    const array = Array.from(items);
    
    这就提供了去除数组重复成员的另一种方法。
    function dedupe(array) {
     return Array.from(new Set(array));
    }
    
    dedupe([1, 1, 2, 3]) // [1, 2, 3]
    
  • 遍历操作

    Set 结构的实例有四个遍历方法,可以用于遍历成员。
    • Set.prototype.keys():返回键名的遍历器
    • Set.prototype.values():返回键值的遍历器
    • Set.prototype.entries():返回键值对的遍历器
    • Set.prototype.forEach():使用回调函数遍历每个成员
    需要特别指出的是,Set 的遍历顺序就是插入顺序。这个特性有时非常有用,比如使用 Set 保存一个回调函数列表,调用时就能保证按照添加顺序调用。

    (1)keys(),values(),entries()

    keys 方法、values 方法、entries 方法返回的都是遍历器对象(详见《Iterator 对象》一章)。由于 Set 结构没有键名,只有键值(或者说键名和键值是同一个值),所以 keys 方法和 values 方法的行为完全一致。
    let set = new Set(['red', 'green', 'blue']);
    
    for (let item of set.keys()) {
     console.log(item);
    }
    // red
    // green
    // blue
    
    for (let item of set.values()) {
     console.log(item);
    }
    // red
    // green
    // blue
    
    for (let item of set.entries()) {
     console.log(item);
    }
    // ["red", "red"]
    // ["green", "green"]
    // ["blue", "blue"]
    
    上面代码中,entries 方法返回的遍历器,同时包括键名和键值,所以每次输出一个数组,它的两个成员完全相等。
    Set 结构的实例默认可遍历,它的默认遍历器生成函数就是它的 values 方法。
    Set.prototype[Symbol.iterator] === Set.prototype.values
    // true
    
    这意味着,可以省略 values 方法,直接用 for...of 循环遍历 Set
    let set = new Set(['red', 'green', 'blue']);
    for (let x of set) {
     console.log(x);
    }
    // red
    // green
    // blue
    

    (2)forEach()

    Set 结构的实例与数组一样,也拥有 forEach 方法,用于对每个成员执行某种操作,没有返回值。
    let set = new Set([1, 4, 9]);
    set.forEach((value, key) => console.log(key + ' : ' + value))
    // 1 : 1
    // 4 : 4
    // 9 : 9
    
    上面代码说明,forEach 方法的参数就是一个处理函数。该函数的参数与数组的 forEach 一致,依次为键值、键名、集合本身(上例省略了该参数)。这里需要注意,Set 结构的键名就是键值(两者是同一个值),因此第一个参数与第二个参数的值永远都是一样的。
    另外,forEach 方法还可以有第二个参数,表示绑定处理函数内部的 this 对象。

    (3)遍历的应用

    扩展运算符(...)内部使用 for...of 循环,所以也可以用于 Set 结构。
    let set = new Set(['red', 'green', 'blue']);
    let arr = [...set];
    // ['red', 'green', 'blue']
    
    扩展运算符和 Set 结构相结合,就可以去除数组的重复成员。
    let arr = [3, 5, 2, 2, 5, 5];
    let unique = [...new Set(arr)];
    // [3, 5, 2]
    
    而且,数组的 mapfilter 方法也可以间接用于 Set 了。
    let set = new Set([1, 2, 3]);
    set = new Set([...set].map(x => x * 2));
    // 返回Set结构:{2, 4, 6}
    
    let set = new Set([1, 2, 3, 4, 5]);
    set = new Set([...set].filter(x => (x % 2) == 0));
    // 返回Set结构:{2, 4}
    
    因此使用 Set 可以很容易地实现并集(Union)、交集(Intersect)和差集(Difference)。
    let a = new Set([1, 2, 3]);
    let b = new Set([4, 3, 2]);
    
    // 并集
    let union = new Set([...a, ...b]);
    // Set {1, 2, 3, 4}
    
    // 交集
    let intersect = new Set([...a].filter(x => b.has(x)));
    // set {2, 3}
    
    // 差集
    let difference = new Set([...a].filter(x => !b.has(x)));
    // Set {1}
    
    如果想在遍历操作中,同步改变原来的 Set 结构,目前没有直接的方法,但有两种变通方法。一种是利用原 Set 结构映射出一个新的结构,然后赋值给原来的 Set 结构;另一种是利用 Array.from 方法。
    // 方法一
    let set = new Set([1, 2, 3]);
    set = new Set([...set].map(val => val * 2));
    // set的值是2, 4, 6
    
    // 方法二
    let set = new Set([1, 2, 3]);
    set = new Set(Array.from(set, val => val * 2));
    // set的值是2, 4, 6
    
    上面代码提供了两种方法,直接在遍历操作中改变原来的 Set 结构。