Codeforces 802I Fake News (hard) (SA+单调栈) 或 SAM

原文链接http://www.cnblogs.com/zhouzhendong/p/9026184.html

题目传送门 - Codeforces 802I

题意

  求一个串中,所有本质不同子串的出现次数的平方和。

  $|s|\leq 10^5$

题解

  首先,这一题用$SAM$做就是模板题,比较简单。

  但是,本着练一练$SA$的心态,我开始了$SA+单调栈$的苦海。

  真毒瘤。

  这里讲一讲$SA$的做法,也是经典的做法。

  $SA$闭着眼睛先写了再说。

  首先,我们考虑出现次数大于$1$次的子串。

  考虑按照$SA$数组的顺序来进行处理,这样得到的后缀的字典序不断变大。

  如果要统计一个串与前一个串的$LCP$出现了多少次,该如何统计?

  显然是往前和往后都找到第一个$LCP$比当前小的停止并统计。

  于是我们用单调栈来维护一个$height$升序的序列。具体的统计方法这里不多赘述,可以直接查阅代码。比较明了。

  单调栈要注意处理当前$LCP$和栈顶$LCP$长度值相同的情况。

  考虑只出现一次的串个数。对于第$i$大的后缀(即$SA[i]$),之前统计到的是$SA[i]$与$SA[i-1]$、$SA[i]$与$SA[i+1]$的$LCP$的$\max$。于是没用统计到的就是剩下的。于是当前后缀出现依次的串对答案的贡献就是$len-\max$。

代码

#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N=100005;
int T,n,m,SA[N],rank[N],height[N],tmp[N],tax[N];
char s[N];
int st[N],top,pos[N];
void Sort(int n,int m){
	for (int i=0;i<=m;i++)
		tax[i]=0;
	for (int i=1;i<=n;i++)
		tax[rank[i]]++;
	for (int i=1;i<=m;i++)
		tax[i]+=tax[i-1];
	for (int i=n;i>=1;i--)
		SA[tax[rank[tmp[i]]]--]=tmp[i];
}
bool cmp(int rk[],int x,int y,int w){
	return rk[x]==rk[y]&&rk[x+w]==rk[y+w];
}
void Suffix_Array(char s[],int n){
	memset(SA,0,sizeof SA);
	memset(tmp,0,sizeof tmp);
	memset(rank,0,sizeof rank);
	memset(height,0,sizeof height);
	for (int i=1;i<=n;i++)
		rank[i]=s[i],tmp[i]=i;
	m=127;
	Sort(n,m);
	for (int w=1,p=0;p<n;w<<=1,m=p){
		p=0;
		for (int i=n-w+1;i<=n;i++)
			tmp[++p]=i;
		for (int i=1;i<=n;i++)
			if (SA[i]>w)
				tmp[++p]=SA[i]-w;
		Sort(n,m);
		swap(rank,tmp);
		rank[SA[1]]=p=1;
		for (int i=2;i<=n;i++)
			rank[SA[i]]=cmp(tmp,SA[i],SA[i-1],w)?p:++p;
	}
	for (int i=1,j,k=0;i<=n;height[rank[i++]]=k)
		for (k=max(k-1,0),j=SA[rank[i]-1];s[i+k]==s[j+k];k++);
}
int main(){
	scanf("%d",&T);
	while (T--){
		scanf("%s",s+1);
		n=strlen(s+1);
		Suffix_Array(s,n);
		LL ans=0;
		top=0;
		memset(st,0,sizeof st);
		memset(pos,0,sizeof pos);
		SA[n+1]=height[0]=0;
		for (int i=2;i<=n+1;i++){
			int nowpos=i,len=height[i];
			while (top>0&&st[top]>len){
				LL v1=st[top]-max(st[top-1],len);
				LL v2=i-pos[top]+1;
				ans+=v1*v2*v2;
				nowpos=pos[top--];
			}
			while (top>0&&st[top]==len)
				nowpos=pos[top--];
			st[++top]=len;
			pos[top]=nowpos;
		}
		for (int i=1;i<=n;i++)
			ans+=n-i+1-max(height[rank[i]],height[rank[i]+1]);
		printf("%I64d\n",ans);
	}
	return 0;
}

  

猜你喜欢

转载自www.cnblogs.com/zhouzhendong/p/9026184.html
今日推荐