c语言数据结构之并查集 总结

并查集(Union-Find Set):

一种用于管理分组的数据结构。它具备两个操作:(1)查询元素a和元素b是否为同一组 (2) 将元素a和b合并为同一组。

注意:并查集不能将在同一组的元素拆分为两组。

并查集的实现:

用树来实现。

使用树形结构来表示以后,每一组都对应一棵树,然而我们就可以将这个问题转化为树的问题了,我们看两个元素是否为一组我们只要看这两个元素的根是否一致。显然,使用树形结构将问题简单化了。合并时是我们只需要将一组的根与另一组的根相连即可。

并查集的核心在于,一棵树的所有节点根节点都为一个节点。使用Find函数查询时,也是查询到这个节点的根节点。

一行并查集:

int find(int x)
{
 return p[x]==x? x:find(p[x]); //x的父节点保存在p[x]中,如果没有父节点则p[x]=x。
}

实现:

int node[i]; //每个节点 
 
//初始化n个节点 
void Init(int n){ 
 for(int i = 0; i < n; i++){ 
 node[i] = i; 
 } 
} 
//查找当前元素所在树的根节点(代表元素) 
int find(int x){ 
 if(x == node[x]) 
 return x; 
 return find(node[x]); 
} 
//合并元素x, y所处的集合 
void Unite(int x, int y){ 
 //查找到x,y的根节点 
 x = find(x); 
 y = find(y); 
 if(x == y) 
 return ; 
 //将x的根节点与y的根节点相连 
 node[x] = y; 
} 
//判断x,y是属于同一个集合 
bool same(int x, int y){ 
 return find(x) == find(y)

并查集的路径压缩:

在特殊情况下,这棵树是一条长长的树链,设链的最后一个结点为x,则每次执行find(x)都会遍历整条链。效率十分的地下。 改进方法很简单,只要把遍历过的结点都改成根的子结点,后面的查询就会变的快很多。

并查集的复杂度

加入这两个优化之后,并查集的效率就非常高。对n个元素的并查集操作一次的复杂度是: O(α(n))。这里,α(n)是阿克曼(Ackermann)函数的反函数。效率要高于O(log n)。

不过这里O(α(n))是平均复杂度。也就是说,多次操作之后平均复杂度为O(α(n)),换而言之,并不是每一次操作都满足O(α(n))。

路径压缩后的优化代码:

 int node[i]; //每个节点 
 int rank[i]; //树的高度 
 
 //初始化n个节点 
 void Init(int n){ 
 for(int i = 0; i < n; i++){ 
  node[i] = i; 
  rank[i] = 0; 
 } 
 } 
 //查找当前元素所在树的根节点(代表元素) 
 int find(int x){ 
 if(x == node[x]) 
  return x; 
 return node[x] = find(node[x]); //在第一次查找时,将节点直连到根节点 
 } 
 //合并元素x, y所处的集合 
 void Unite(int x, int y){ 
 //查找到x,y的根节点 
 x = find(x); 
 y = find(y); 
 if(x == y) 
  return ; 
 //判断两棵树的高度,然后在决定谁为子树 
 if(rank[x] < rank[y]){ 
  node[x] = y; 
 }else{ 
  node[y] = x; 
  if(rank[x] == rank[y]) rank[x]++: 
 } 
 } 
 //判断x,y是属于同一个集合 
 bool same(int x, int y){ 
 return find(x) == find(y); 
 } 

实例分析:

题目:部落

在一个社区里,每个人都有自己的小圈子,还可能同时属于很多不同的朋友圈。我们认为朋友的朋友都算在一个部落里,于是要请你统计一下,在一个给定社区中,到底有多少个互不相交的部落?并且检查任意两个人是否属于同一个部落。

输入格式:

输入在第一行给出一个正整数N(<= 104),是已知小圈子的个数。随后N行,每行按下列格式给出一个小圈子里的人:

K P[1] P[2] ... P[K]

其中K是小圈子里的人数,P[i](i=1, .., K)是小圈子里每个人的编号。这里所有人的编号从1开始连续编号,最大编号不会超过104。

之后一行给出一个非负整数Q(<= 104),是查询次数。随后Q行,每行给出一对被查询的人的编号。

输出格式:

首先在一行中输出这个社区的总人数、以及互不相交的部落的个数。随后对每一次查询,如果他们属于同一个部落,则在一行中输出“Y”,否则输出“N”。

输入样例:
4
3 10 1 2
2 3 4
4 1 5 7 8
3 9 6 4
2
10 5
3 7

输出样例:

10 2
Y
N

分析:典型并查集问题。

一个部落对应一个集合。 根节点数量等于部落数量。
并查集把每个部落的人连起来,记录哪些人出现过,枚举标号10000,找出有多少人和部落,查询并查集维护。

源码分析:

#include <cstdio>
#include <iostream>
#include <algorithm>
#include <cstring>
using namespace std;
int pre[10005];
int f[10005];
 
void init() { //初始化父集合pre[10005],以及出现的标志数组f[10005]
	for(int i=0; i<10004; i++)
		pre[i]=i, f[i]=0;
}
 
int find(int x) { //并查集查找根节点的 递归程序
	return pre[x]==x? x : pre[x]=find(pre[x]);
}
 
int main()
{
	init();
	int n,q,k,a,b;
	cin>>n;
	for(int i=0; i<n; i++) {
		cin>>k>>a;
		f[a]=1;
		for(int j=1; j<k; j++) {
			cin>>b;
			f[b]=1;
			int x=find(a);
			int y=find(b);
			if(x!=y) pre[x]=y;
		}
	}
	int cnt=0,tot=0; //cnt为所有人数 tot为部落数量
	for(int i=0; i<10004; i++) {
		if(f[i] == 1) { //如果标志为1 则说明出现过,cnt加一
			cnt++;
			if(pre[i]==i) tot++; //如果下标为本身 说明其为根节点 根节点数量为部落的数量
		}
	}
	cout<<cnt<<" "<<tot<<endl;
	cin>>q;
	for(int i=0; i<q; i++) {
		cin>>a>>b;
		if(find(a) == find(b)) //若两参数 有同一根节点 说明为一个部落。
			cout<<"Y"<<endl;
		else cout<<"N"<<endl;
	}
	return 0;
}

好了,这篇文章就介绍到这了。

声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:notice#nhooo.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。