【C++】关联式容器——map和set的使用

平凡的人1

2022社区之星TOP 2

2023-02-20 00:26:57

文章目录

个人简介📝

🏆2022年度博客之星Top18;🏆2022社区之星Top2;的🥇C/C++领域优质创作者;

🥇阿里云专家博主;🥇华为云云享专家;🥇腾讯云年度进取作者;🥇掘金成长之星;

一、关联式容器

序列式容器📕:已经接触过STL中的部分容器，比如：vector、list、deque、forward_list(C++11)等，这些容器统称为序列式容器，因为其底层为线性序列的数据结构，里面存储的是元素本身。
关联式容器📕:也是用来存储数据的，与序列式容器不同的是，其里面存储的是<key, value>结构的键值对，在数据检索时比序列式容器效率更高

二、键值对

用来表示具有一一对应关系的一种结构，该结构中一般只包含两个成员变量key和value，key代表键值，value表示与key对应的信息。

比如📝：现在要建立一个英汉互译的字典，那该字典中必然有英文单词与其对应的中文含义，而且，英文单词与其中文含义是一一对应的关系，即通过该应该单词，在词典中就可以找到与其对应的中文含义

SGI-STL中关于键值对的定义 👇

template <class T1, class T2>
struct pair
{
    typedef T1 first_type;
    typedef T2 second_type;
    T1 first;
    T2 second;
    pair(): first(T1()), second(T2())
    {}
    
    pair(const T1& a, const T2& b): first(a), second(b)
    {}
};

三、树形结构的关联式容器

根据应用场景的不同，STL总共实现了两种不同结构的管理式容器🔴：树型结构与哈希结构。

树型结构的关联式容器主要有四种：map、set、multimap、multiset。这四种容器的共同点是：使用平衡搜索树(即红黑树)
作为其底层结果，容器中的元素是一个有序的序列。

下面，我们一起来看一看这四种关联式容器👇

1.set

\1. set是按照一定次序存储元素的容器
\2. 在set中，元素的value也标识它(value就是key，类型为T)，并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const)，但是可以从容器中插入或删除它们。
\3. 在内部，set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
\4. set容器通过key访问单个元素的速度通常比unordered_set容器慢，但它们允许根据顺序对子集进行直接迭代。
\5. set在底层是用二叉搜索树(红黑树)实现的 ,中序之后自然是有序的，插入元素之后：小的往左边走，大的往右边走，相等则返回false。

set的模板参数列表

T: set中存放元素的类型，实际在底层存储<value, value>的键值对。
Compare：仿函数，set中元素默认按照小于来比较
Alloc：set中元素空间的管理方式，使用STL提供的空间配置器管理

set的构造函数

默认构造、迭代器区间构造、拷贝构造（深拷贝）:

void test_set()
{
	int arr[] = { 1,2,3,4,5 };
	set<int> s;//默认构造

	set<int> s1(arr, arr + 5);//区间构造

	set<int> s2(s1);//拷贝构造

	for (auto e : s1) cout << e << " "; cout << endl;
	for (auto e : s2) cout << e << " "; cout << endl;

}

set的迭代器

函数声明	功能介绍
iterator begin() \end()	返回set中起始位置元素的迭代器\返回set中最后一个元素后面的迭代器
const_iterator cbegin()\cend() const	返回set中起始位置元素的const迭代器\返回set中最后一个元素后面的const迭代器
reverse_iterator rbegin() \rend()	返回set第一个元素的反向迭代器，即end\返回set最后一个元素下一个位置的反向迭代器，即 rbegin
const_reverse_iterator crbegin() \crend() const	返回set第一个元素的反向const迭代器，即cend\返回set最后一个元素下一个位置的反向const迭代器，即crbegin

我们简单来看一看代码把：

void test_set1()
{
	set<int> s;
	s.insert(1);
	s.insert(2);
	s.insert(1);
	s.insert(3);
	s.insert(4);
	s.insert(5);
	//排序+去重
	for (auto e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	//set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

}
int main()
{
	test_set1();
	return 0;
}

默认是升序，如果是想要降序：使用反向迭代器 仿函数：less👉greater：

set的修改操作

find&&erase

对于find和erase我们都是比较熟悉的了，我们可以直接上手代码的实现：

void test_set3()
{
	set<int> s;
	s.insert(1);
	s.insert(2);
	s.insert(1);
	s.insert(3);
	s.insert(4);
	s.insert(5);
	//set<int>::iterator it = s.begin();
	auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	auto pos = s.find(3);//更快一点点，借助二叉树查找O(logN)
	//auto pos = find(s.begin(), s.end(), 3);
    //暴力查找O(N)
	if (pos != s.end())
	{
		s.erase(pos);
	}
	s.erase(1);
	for (auto e : s) cout << e << " ";
	cout << endl;
}

值得一提的是,set还有一个count接口，count：返回个数，可以判断一个值是否存在

但是count不是为此设计的！是为了和multiset容器保持接口的一致性。

2.multiset

\1. multiset是按照特定顺序存储元素的容器，其中元素是可以重复的。
\2. 在multiset中，元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对，因此value本身就是key，key就是value，类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的)，但可以从容器中插入或删除。
\3. 在内部，multiset中的元素总是按照其内部比较规则(类型比较)所指示的特定严格弱排序准则进行排序。
\4. multiset容器通过key访问单个元素的速度通常比unordered_multiset容器慢，但当使用迭代器遍历时会得到一个有序序列。
\5. multiset底层结构为二叉搜索树(红黑树)

上面说了这么多的内容，其实就是与set的区别是👉：multiset中的元素可以重复，set是中value是唯一的

void test_multiset()
{
	int arr[] = {1,2,3,1,1,6,8};
	multiset<int> s(arr, arr + sizeof(arr) / sizeof(int));
	for (auto& e : s)
	{
		cout << e << " ";
	}
	cout << endl;
}

另外，如果有多个值相同，find返回的值是中序的第一个：

void test_multiset()
{
	int arr[] = {1,2,3,4,5,6,3};
	multiset<int> s(arr, arr + sizeof(arr) / sizeof(int));
	for (auto& e : s)
	{
		cout << e << " ";
	}
	cout << endl;
	auto it = s.find(3);
	while (it != s.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;
}

3.map

\1. map是关联容器，它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
\2. 在map中，键值key通常用于排序和惟一地标识元素，而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，为其取别名称为pair:typedef pair value_type;
\3. 在内部，map中的元素总是按照键值key进行比较排序的。
\4. map中通过键值访问单个元素的速度通常比unordered_map容器慢，但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时，可以得到一个有序的序列)。
\5. map支持下标访问符，即在[]中放入key，就可以找到与key对应的value。
\6. map通常被实现为二叉搜索树(更准确的说：平衡二叉搜索树(红黑树))

map的模板参数

key: 键值对中key的类型
T：键值对中value的类型
Compare: 比较器的类型，map中的元素是按照key来比较的，缺省情况下按照小于来比较，一般情况下(内置类型元素)该参数不需要传递，如果无法比较时(自定义类型)，需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递)
Alloc：通过空间配置器来申请底层空间，不需要用户传递，除非用户不想使用标准库提供的空间配置器

map的构造

void test_map()
{
	map<int, int> m;
	int arr[] = { 1,1,1,2,3,4,5,6 };
	for (auto& e : arr)
	{
		m.insert(make_pair(e, e));
	}
	map<int, int>m1(m.begin(), m.end());//迭代器区间构造
	for (auto& e : m1)cout << e.first<<":"<<e.second << " "; cout << endl;
	map<int, int> m2(m1);//拷贝构造
	for (auto& e : m2)cout << e.first << ":" << e.second << " "; cout << endl;
}

map的修改

insert插入

void test_map1()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("排序", "sort"));
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边","right"));
	dict.insert(make_pair("字符串", "string"));
	map<string, string>::iterator it = dict.begin();
	//auto it = dict.begin()
	while (it != dict.end())
	{
		//(*it).first
		cout << it->first<<":"<<it->second << endl;
		++it;
	}
	cout << endl;
	for (auto& e : dict)
	{
		cout << e.first << ":" << e.second << endl;
	}
}

make_pair:函数模板，不需要像pair一样显示声明类型，而是通过传参自动推导,相比于typedef更好用一些

统计次数

第一种方法：迭代器

void test_map2()
{
	//统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果",
		"苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countMap;
	for (auto& e : arr)
	{
		map<string, int>:: iterator it = countMap.find(e);
		if (it == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

第二种方法：map[]的使用：

void test_map2()
{//统计水果出现的次数
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果","苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	map<string, int> countMap;
	for (auto& e : arr)
	{
		countMap[e]++;
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

[]有三个功能：1.插入 2.修改 3.查找（给一个key，可以查找在不在，如果不在则可以插入，在的话既可以查找也可以进行修改value）

注意：[]用的时候要小心，不在的话会偷偷给你插入

下面我们来仔细看一看[]:[]实际上调用的是insert,insert有啥好调用的，我们要关注的是insert的返回值

返回second的别名就可以进行修改了。简单运用一下[]把：

void test_map1()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("排序", "sort"));
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边","right"));
	dict.insert(make_pair("字符串", "string"));
	dict["迭代器"] = "iterator";//插入+修改
	dict["insert"];
	dict.insert(make_pair("左边", "xxx"));//插入失败，搜索树只会比较key
	dict["insert"] = "插入";//修改
	cout << dict["左边"] << endl;//查找：key在就是查找
	auto it = dict.begin();
	while (it != dict.end())
	{
		cout << it->first<<":"<<it->second << endl;
		++it;
	}
	cout << endl;
}

4.multimap

multimap容器与map容器的底层实现以及成员函数的接口都是基本一致,其中多个键值对之间的key是可以重复的

void test_multimap()
{
	multimap<string, string> dict;
	dict.insert(make_pair("left", "左边"));
	dict.insert(make_pair("left", "左边"));
	dict.insert(make_pair("right", "右边"));
	dict.insert(make_pair("sort", "排序"));
	dict.insert(make_pair("left", "xxx"));
	map<string, int> countMap;
	for (auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	cout << endl;
}

multimap并没有[],find()返回中序的第一个，剩下的没什么区别:

void test_multimap()
{
	multimap<string, string> dict;
	dict.insert(make_pair("left","左边"));
	dict.insert(make_pair("right", "右边"));
	dict.insert(make_pair("sort", "排序"));
	dict.insert(make_pair("left", "xxx"));
	map<string, int> countMap;
	for (auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	cout << endl;
}

multimap同样是可以统计次数的：

void test_multimap1()
{
	multimap<string, int> countMap;
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果",
		"苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };
	for (auto& e : arr)
	{
		auto it = countMap.find(e);
		if (it == countMap.end())
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}
	for (const auto& kv : countMap)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
}

下面做两个题目试一试把👇

四、题目练习

前K个高频单词

给定一个单词列表 words 和一个整数 k ，返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率，按字典顺序排序。

class Solution {
public:
    class greater
    {
        public:
        bool operator()(const pair<string,int>&l,const pair<string,int>& r)
        {
            return l.second>r.second||(l.second==r.second&&l.first<r.first);
        }
    };
    vector<string> topKFrequent(vector<string>& words, int k) {
        unordered_map<string,int> countMap;
        for(auto&e:words) countMap[e]++;
        priority_queue<pair<string,int>,vector<pair<string,int>>,greater> pq;
        for(auto it = countMap.begin();it!=countMap.end();it++)
        {
            pq.push(*it);
            if(pq.size()>k)
                pq.pop();
        }
        vector<string> ret;
        ret.resize(k);
        for(int i = k-1;i>=0;i--)
        {
            ret[i] = pq.top().first;
            pq.pop();
        }
        return ret;
    }
};

两个数组的交集

给定两个数组 nums1 和 nums2 ，返回 它们的交集 。输出结果中的每个元素一定是唯一的。我们可以 不考虑输出结果的顺序。

利用set的排序+去重特性，然后去进行比对，找出两个数组之间的交集：

class Solution {
public:
    vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {
        //排序＋去重
        set<int> s1(nums1.begin(),nums1.end());
        set<int> s2(nums2.begin(),nums2.end());
        
        //比对算法逻辑
        auto it1 = s1.begin();
        auto it2 = s2.begin();
        vector<int> ret;
        while(it1!=s1.end()&&it2!=s2.end())
        {
            if(*it1==*it2)
            {
                ret.push_back(*it1);
                it1++;
                it2++;
            }
            else if(*it1>*it2)
            {
                it2++;
            }
            else
            {
                it1++;
            }
        }
        return ret;
    }
};

本篇结束…

...全文

成就一亿技术人!