SPOJ DISUBSTR - Distinct Substrings 后缀数组

原题:https://vjudge.net/problem/SPOJ-DISUBSTR

题解:求本质不同子串的个数,考虑用容斥原理,不同的答案就是总数减去相同的,重复的就是后缀数组中h的和即:n*(n+1)/2+\sum _{i=1}^nh[i]

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=1e3+10;
char s[N];
int rak[N<<1],rak1[N<<1],tmp[N],sa[N],h[N],cnt[N],t[N],cas,n;
int main(){
//	freopen("spoj694.in","r",stdin);
	scanf("%d",&cas);
	while(cas--){
		scanf("%s",s+1);n=strlen(s+1);
		memset(rak,0,sizeof rak);
		memset(rak1,0,sizeof rak1); 
		memset(t,0,sizeof t); 
		for(int i=1;i<=n;i++) t[s[i]]++;
		for(int i=1;i<N;i++) t[i]+=t[i-1];
		for(int i=1;i<=n;i++) rak[i]=t[s[i]];
		
		for(int p=1,k=0;k!=n;p<<=1){
			memset(cnt,0,sizeof cnt);
			for(int i=1;i<=n;i++) cnt[rak[i+p]]++;
			for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
			for(int i=n;i>=1;i--) tmp[cnt[rak[i+p]]--]=i;
			
			memset(cnt,0,sizeof cnt);
			for(int i=1;i<=n;i++) cnt[rak[i]]++;
			for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
			for(int i=n;i>=1;i--) sa[cnt[rak[tmp[i]]]--]=tmp[i];
			memcpy(rak1,rak,sizeof(rak)>>1);
			
			k=1;rak[sa[1]]=1;	 
			for(int i=2;i<=n;i++){
				if(rak1[sa[i]]!=rak1[sa[i-1]] || rak1[sa[i]]== rak1[sa[i-1]] && rak1[sa[i]+p]!=rak1[sa[i-1]+p])k++;
				rak[sa[i]]=k;
			}
		} 
	
		for(int i=1,k=0;i<=n;i++){
			if(rak[i]==n){
				h[rak[i]]=0;continue;
			}			
			if(k) k--;
			while(s[i+k]== s[sa[rak[i]+1]+k]) k++;
			h[rak[i]]=k;
		}
		int ans=n*(n+1)>>1;
		for(int i=1;i<=n;i++) ans-=h[i];
		printf("%d\n",ans); 
	}
	return 0;
}

猜你喜欢

转载自blog.csdn.net/weixin_39689721/article/details/87303738