C++知识点 STL容器2—set

~set~

  set可能算是一种比较冷门的STL容器了,

  喜欢用它的人觉得set真牛逼

  不喜欢它的人觉得set真垃圾

  很不幸,我属于第一种


   set作为一种封装好的数据容器

  最吸引人的地方是它的自动排序功能

  这也就是说你可以拥有一个实时的排好序的序列

  或者可以用一个序列同时实现大根堆和小根堆

  时间复杂度和空间都是两者和的1/2

  善于运用set的自动排序特性可以为解题省去不少麻烦

  啊就爽,就很爽。

  继承STL容器的传统

  set也有它自己专属的头文件 <set>

  这个头文件内包含两种容器

  set和multiset

  set是自动排序还附带去重的序列(有序集合),其中的元素不可重复

  multiset是自动排序不去重的序列(有序多重集),其中可以有许多相同的元素

  个人感觉在实际OI问题中比较常用的是multiset这种不去重的

  两者的实现原理都是一颗我不会打的红黑树,它们支持的函数基本相同


  步入正题

  首先我们来看一下怎么声明一个set和multiset并往其中插入元素

 #include <iostream>
 #include <set>
 using namespace std;
 struct Node {
       int l, r, val;
 }; 
 bool operator <(const Node &a, const Node &b)
     { return a.val < b.val; }
 int main()
 {
     set<int> p;//声明方式与其他容器并无太大差异 
     multiset<int> q;
     set<Node> fuc;//压入set的东西类型必须定义"<" 
 }

  当然,你也可以这么写(友元版)

  与上面的写法没有什么区别,但是友元比较难理解点

 #include <iostream>
 #include <set>
 using namespace std;
 struct Node {
     int l, r, val;
     bool friend operator <(const Node &a, const Node &b)
     {return a.val < b.val;}
     set<Node> fuc;   
 }; 
 int main()
 {
     set<int> p; 
     multiset<int> q;
 } 

  这样就完成了以普通数据类型和结构体的sethemultiset的声明

  同时切记:set和multiset内的数据类型必须已定义小于号

  学完了声明就该学如何往容器内插入元素

  (size函数,empty函数,clear函数在set中也有,与在vector中作用无异,故此处不提)

  与vector不同,往set内插入元素不需要指定位置

  元素进入set后自动根据“<”的定义找到自己的位置

  set和multiset都使用insert函数插入元素

  时间复杂度为O(logn)

  代码如下

 #include <iostream>
 #include <set>
 using namespace std;
 int x;
 int main()
 {
     set<int> p; 
     multiset<int> q;
     int n;
     cin>>n;
     for(int i = 1; i <= n; i++)
     {
         cin>>x;
         q.insert(x);
         p.insert(x);
     }
 }

  如此即可实现向set p和multiset q中插入n个元素

  插入完元素后我们可以对这些元素进行操作

  首先需要注意的是set不支持随机访问

  也就是说不能通过下标的方式访问set中的元素

  想想也很好理解,即使这货能用下标你也不知道排完序后哪个元素是哪个

  所以set给了我们与之替代的两种数据查找方式

  迭代器(可以理解为STL的指针)和find函数

  set的迭代器声明方式与在vector中的声明方式无异

  同样是声明一个名为it的迭代器

  有set<int>::iterator it;

  如果++it,

  则it指向set中的下一个元素

  因为set是有序集合,所以++it所表示的元素就是刚好比it所指向的元素大的第一个元素

  同时set也有begin和end函数用来取队首和队尾(的迭代器)

  begin在set中取的是最小元素的迭代器

  end函数跟vector中一样返回队尾下个元素的迭代器

  所以--end()表示的是队尾元素的迭代器

  我们看一段遍历set的代码来帮助我们理解这些抽象的概念

 #include <iostream>
 #include <set>
 using namespace std;
 int main()
 {
     set<int> a;
     multiset<int> b;
     a.insert(1);
     a.insert(2);
     a.insert(3);
     a.insert(1);
     b.insert(1);
     b.insert(2);
     b.insert(3);
     b.insert(1);
     cout<<"set 中的元素依次是 ";
     for(set<int>::iterator it = a.begin(); it != a.end(); it++)
     cout<<*it<<" "; 
     cout<<endl;
     cout<<"multiset 中的元素依次是 ";
     for(multiset<int>::iterator it = b.begin(); it != b.end(); it++)
     cout<<*it<<" ";
     cout<<endl;
     return 0;
} 

  程序输出结果是

 set 中的元素依次是 1 2 3
 multiset 中的元素依次是 1 1 2 3

  在这个例子中我们可以了解到set中迭代器的用法和set与multiset的本质区别

  有助于我们搞明白并在程序上实现set的基本操作

  了解了迭代器

  我们再来看看我认为能与迭代器平起平坐帮了大忙的find函数

  find函数能够找到set中大小为x的元素并返回指向该元素的迭代器。

  如果set中并不存在元素x则返回s.end()

  x 多次出现则返回第一次出现时的迭代器

  样例如下

 #include <iostream>
 #include <set>
 using namespace std;
 int main()
 {
     set<int> p;
     multiset<int> q;
     p.insert(1);
     p.insert(2);
     p.insert(3);
     p.insert(1);
     q.insert(1);
     q.insert(2);
     q.insert(3);
     q.insert(1);
     int a = *p.find(1);
     int b = *q.find(3);
     cout<<a<<"    "<<b<<endl;
     return 0;  
 }

  聪明的你已经看出来了

  我这么写返回的一定是要查找的那个数

  其实就是没屁用

  啊就有的题可能会出现需要用到find函数的地方(装不下去了)

  在实际应用中,我们需要对不需要的元素进行删除

  set给了我们一个强大的数据删除函数erase()

  括号内既可以是一个迭代器

  erase删除这个迭代器所指的元素

  括号内也可以是个值或者啥东西

  erase在set或multiset中查找并删除和括号内这个东西一样的全部元素

  那问题来了

  在用multiset解决实际问题时

  很多情况下我们并不想把所有相同的元素都删除

  只想删除一个两个或几个(erase说没门儿

  此时find函数突然出现

  “劳资返回的是迭代器hahahahaha”

  于是你就可以用find函数定位到元素x第一次出现的位置并返回此时的迭代器

  再用erase通过迭代器删除的功能删除这个x

  由于multiset恒为有序所以删除哪个x无关紧要

  反正修改后的multiset都一样

  所以我们就解决了这个问题(find函数大放异彩)

  最后要介绍的是count函数和lower_bound/upper_bound这三个函数

  首先count函数在multiset中比较常见(set里根本不能用)

  count(x)返回multiset中x的出现次数(在set里用肯定返回0或1,可以作为判断元素是非在集合内的方法,比遍历慢一点)

  目前还没有碰到过需要用count这个函数的题(我可能直接遍历了?大雾)

  lower_bound/upper_bound是二分函数,在其他STL容器中也有出现  

  跟find函数类似  

  lower_bound(x)返回的是>=x的元素中最小的一个

  upper_bound(x)返回的是>x的元素中最小的一个

  当然你也可以用find+迭代器完成这一项功能

  不过难写一点,而且lower_bound和upper_bound的时间复杂度和find一样为O(logn)

  所以二分的时候何乐而不为呢?

 

~END~

原文地址:https://www.cnblogs.com/Jiangxingchen/p/13330665.html