【C++】关联式容器——map和set的使用

平凡的人1
2022社区之星TOP 2
2023-02-20 00:26:57

【C++】关联式容器——map和set的使用

 

文章目录


 

个人简介📝

🏆2022年度博客之星Top18;🏆2022社区之星Top2;的🥇C/C++领域优质创作者;

🥇阿里云专家博主;🥇华为云云享专家;🥇腾讯云年度进取作者;🥇掘金成长之星;

一、关联式容器

序列式容器📕:已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身
关联式容器📕:也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高


二、键值对

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和valuekey代表键值value表示与key对应的信息

比如📝:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义

SGI-STL中关于键值对的定义 👇

template <class T1, class T2>
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;
    pair(): first(T1()), second(T2())
    {}
    
    pair(const T1& a, const T2& b): first(a), second(b)
    {}
};

三、树形结构的关联式容器

根据应用场景的不同,STL总共实现了两种不同结构的管理式容器🔴:树型结构与哈希结构

树型结构的关联式容器主要有四种:mapsetmultimapmultiset。这四种容器的共同点是:使用平衡搜索树(即红黑树)
作为其底层结果,容器中的元素是一个有序的序列。

下面,我们一起来看一看这四种关联式容器👇

1.set

\1. set是按照一定次序存储元素的容器
\2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们
\3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序
\4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代
\5. set在底层是用二叉搜索树(红黑树)实现的 ,中序之后自然是有序的,插入元素之后:小的往左边走,大的往右边走,相等则返回false

set的模板参数列表

image-20230209135708399

T: set中存放元素的类型,实际在底层存储<value, value>的键值对。
Compare:仿函数,set中元素默认按照小于来比较
Alloc:set中元素空间的管理方式,使用STL提供的空间配置器管理

set的构造函数

image-20230209140045767

默认构造、迭代器区间构造、拷贝构造(深拷贝):

void test_set()
{
	int arr[] = { 1,2,3,4,5 };
	set<int> s;//默认构造

	set<int> s1(arr, arr + 5);//区间构造

	set<int> s2(s1);//拷贝构造

	for (auto e : s1) cout << e << " "; cout << endl;
	for (auto e : s2) cout << e << " "; cout << endl;

}

image-20230209141749230

set的迭代器

函数声明功能介绍
iterator begin() \end()返回set中起始位置元素的迭代器\返回set中最后一个元素后面的迭代器
const_iterator cbegin()\cend() const返回set中起始位置元素的const迭代器\返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin() \rend()返回set第一个元素的反向迭代器,即end\返回set最后一个元素下一个位置的反向迭代器,即 rbegin
const_reverse_iterator crbegin() \crend() const返回set第一个元素的反向const迭代器,即cend\返回set最后一个元素下一个位置的反向const迭代器, 即crbegin

我们简单来看一看代码把:

void test_set1()
{
	set<int> s;
	s.insert(1);
	s.insert(2);
	s.insert(1);
	s.insert(3);
	s.insert(4);
	s.insert(5);
	//排序+去重
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	//set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

}
int main()
{
	test_set1();
	return 0;
}

image-20230209084310253

默认是升序,如果是想要降序:使用反向迭代器 仿函数:less👉greater

image-20230209145516913

set的修改操作

find&&erase

image-20230209151218767

image-20230209151253461

对于find和erase我们都是比较熟悉的了,我们可以直接上手代码的实现

void test_set3()
{
	set<int> s;
	s.insert(1);
	s.insert(2);
	s.insert(1);
	s.insert(3);
	s.insert(4);
	s.insert(5);
	//set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	auto pos = s.find(3);//更快一点点,借助二叉树查找O(logN)
	//auto pos = find(s.begin(), s.end(), 3);
    //暴力查找O(N)
	if (pos != s.end())
	{
		s.erase(pos);
	}
	s.erase(1);
	for (auto e : s) cout << e << " ";
	cout << endl;
}

image-20230209151633971

值得一提的是,set还有一个count接口,count返回个数,可以判断一个值是否存在

image-20230209153334684

image-20230209154918795

但是count不是为此设计的!是为了和multiset容器保持接口的一致性。

2.multiset

\1. multiset是按照特定顺序存储元素的容器,其中元素是可以重复的。
\2. 在multiset中,元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对,因此value本身就是key,key就是value,类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的),但可以从容器中插入或删除。
\3. 在内部,multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
\4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢,但当使用迭代器遍历时会得到一个有序序列。
\5. multiset底层结构为二叉搜索树(红黑树)

上面说了这么多的内容,其实就是与set的区别是👉:multiset中的元素可以重复,set是中value是唯一的

void test_multiset()
{
	int arr[] = {1,2,3,1,1,6,8};
	multiset<int> s(arr, arr + sizeof(arr) / sizeof(int));
	for (auto& e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}

image-20230211104721289

另外,如果有多个值相同,find返回的值是中序的第一个:

void test_multiset()
{
	int arr[] = {1,2,3,4,5,6,3};
	multiset<int> s(arr, arr + sizeof(arr) / sizeof(int));
	for (auto& e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	auto it = s.find(3);
	while (it != s.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;
}

image-20230211105409298

3.map

\1. map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
\2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair:typedef pair value_type;
\3. 在内部,map中的元素总是按照键值key进行比较排序的。
\4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
\5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
\6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))

map的模板参数

image-20230209164255934

key: 键值对中key的类型
T:键值对中value的类型
Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc:通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器

map的构造

image-20230209201222399

void test_map()
{
	map<int, int> m;
	int arr[] = { 1,1,1,2,3,4,5,6 };
	for (auto& e : arr)
	{
		m.insert(make_pair(e, e));
	}
	map<int, int>m1(m.begin(), m.end());//迭代器区间构造
	for (auto& e : m1)cout << e.first<<":"<<e.second << " "; cout << endl;
	map<int, int> m2(m1);//拷贝构造
	for (auto& e : m2)cout << e.first << ":" << e.second << " "; cout << endl;
}

image-20230209203117851

map的修改

insert插入

image-20230210000921674

void test_map1()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("排序", "sort"));
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边","right"));
	dict.insert(make_pair("字符串", "string"));
	map<string, string>::iterator it = dict.begin();
	//auto it = dict.begin()
	while (it != dict.end())
	{
		//(*it).first
		cout << it->first<<":"<<it->second << endl;
		++it;
	}
	cout << endl;
	for (auto& e : dict)
	{
		cout << e.first << ":" << e.second << endl;
	}
}

image-20230210002604154

make_pair:函数模板,不需要像pair一样显示声明类型,而是通过传参自动推导,相比于typedef更好用一些

image-20230210001308473

统计次数

第一种方法:迭代器

void test_map2()
{
	//统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果",
		"苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countMap;
	for (auto& e : arr)
	{
		map<string, int>:: iterator it = countMap.find(e);
		if (it == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

image-20230210103145333

第二种方法:map[]的使用

void test_map2()
{//统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果","苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countMap;
	for (auto& e : arr)
	{
		countMap[e]++;
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

image-20230210103401722[]有三个功能:1.插入 2.修改 3.查找给一个key,可以查找在不在,如果不在则可以插入,在的话既可以查找也可以进行修改value

注意[]用的时候要小心,不在的话会偷偷给你插入

下面我们来仔细看一看[]:[]实际上调用的是insert,insert有啥好调用的,我们要关注的是insert的返回值

image-20230210131238825

返回second的别名就可以进行修改了。简单运用一下[]把:

void test_map1()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("排序", "sort"));
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边","right"));
	dict.insert(make_pair("字符串", "string"));
	dict["迭代器"] = "iterator";//插入+修改
	dict["insert"];
	dict.insert(make_pair("左边", "xxx"));//插入失败,搜索树只会比较key
	dict["insert"] = "插入";//修改
	cout << dict["左边"] << endl;//查找:key在就是查找
	auto it = dict.begin();
	while (it != dict.end())
	{
		cout << it->first<<":"<<it->second << endl;
		++it;
	}
	cout << endl;
}

image-20230210133615486

4.multimap

multimap容器与map容器的底层实现以及成员函数的接口都是基本一致,其中多个键值对之间的key是可以重复的

void test_multimap()
{
	multimap<string, string> dict;
	dict.insert(make_pair("left", "左边"));
	dict.insert(make_pair("left", "左边"));
	dict.insert(make_pair("right", "右边"));
	dict.insert(make_pair("sort", "排序"));
	dict.insert(make_pair("left", "xxx"));
	map<string, int> countMap;
	for (auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	cout << endl;
}

image-20230211112606587

multimap并没有[],find()返回中序的第一个,剩下的没什么区别:

void test_multimap()
{
	multimap<string, string> dict;
	dict.insert(make_pair("left","左边"));
	dict.insert(make_pair("right", "右边"));
	dict.insert(make_pair("sort", "排序"));
	dict.insert(make_pair("left", "xxx"));
	map<string, int> countMap;
	for (auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	cout << endl;
}

multimap同样是可以统计次数的

void test_multimap1()
{
	multimap<string, int> countMap;
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果",
		"苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	for (auto& e : arr)
	{
		auto it = countMap.find(e);
		if (it == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

image-20230210135854653

下面做两个题目试一试把👇


四、题目练习

前K个高频单词

image-20230210140910415

给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。

class Solution {
public:
    class greater
    {
        public:
        bool operator()(const pair<string,int>&l,const pair<string,int>& r)
        {
            return l.second>r.second||(l.second==r.second&&l.first<r.first);
        }
    };
    vector<string> topKFrequent(vector<string>& words, int k) {
        unordered_map<string,int> countMap;
        for(auto&e:words) countMap[e]++;
        priority_queue<pair<string,int>,vector<pair<string,int>>,greater> pq;
        for(auto it = countMap.begin();it!=countMap.end();it++)
        {
            pq.push(*it);
            if(pq.size()>k)
                pq.pop();
        }
        vector<string> ret;
        ret.resize(k);
        for(int i = k-1;i>=0;i--)
        {
            ret[i] = pq.top().first;
            pq.pop();
        }
        return ret;
    }
};

两个数组的交集

image-20230211101726355

给定两个数组 nums1 和 nums2 ,返回 它们的交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序

利用set的排序+去重特性,然后去进行比对,找出两个数组之间的交集

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        //排序+去重
        set<int> s1(nums1.begin(),nums1.end());
        set<int> s2(nums2.begin(),nums2.end());
        
        //比对算法逻辑
        auto it1 = s1.begin();
        auto it2 = s2.begin();
        vector<int> ret;
        while(it1!=s1.end()&&it2!=s2.end())
        {
            if(*it1==*it2)
            {
                ret.push_back(*it1);
                it1++;
                it2++;
            }
            else if(*it1>*it2)
            {
                it2++;
            }
            else
            {
                it1++;
            }
        }
        return ret;
    }
};

本篇结束…

...全文
成就一亿技术人!
拼手气红包 5.00元
623 2 打赏 收藏 转发到动态 举报
写回复
用AI写文章
2 条回复
切换为时间正序
请发表友善的回复…
发表回复
哈哥撩编程 2023-02-20
  • 打赏
  • 举报
回复

博主讲解的内容丰富,细节到位

Kr.Forver 2023-02-20
  • 打赏
  • 举报
回复 1

优质好文,给大佬倒茶

107

社区成员

发帖
与我相关
我的任务
社区描述
14天挑战赛发文处
学习 个人社区
社区管理员
  • Alita11101_
  • 穆雄雄
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告

本次活动的文章请发布在社区内

试试用AI创作助手写篇文章吧