洛谷4248 BZOJ3238 AHOI2013 差异 SAM 树形dp

版权声明:本文为博主原创文章,可以转载但是必须声明版权。 https://blog.csdn.net/forever_shi/article/details/84749388

题目链接

题意:
给你一个字符串, T i T_i 表示第 i i 个字符开始的后缀,求 1 &lt; = i &lt; j &lt; = n l e n ( T i ) + l e n ( T j ) 2 l c p ( T i , T j ) \sum_{1&lt;=i&lt;j&lt;=n}len(T_i)+len(T_j)-2*lcp(T_i,T_j) ,其中 l e n ( i ) len(i) 表示字符串 i i 的长度, l c p ( i , j ) lcp(i,j) 表示字符串 i i j j 的最长公共前缀。n<=500000。

题解:
首先我们可以化一下那个式子,有一个直觉是那个与字符串长度有关的部分可以直接算出来,那么我们先不管减lcp那一部分,会发现可以转化成 1 &lt; = i &lt; j &lt; = n l e n ( T i ) + l e n ( T j ) = i = 1 n 1 j = i + 1 i + j = ( n 1 ) n ( n + 1 ) / 2 \sum_{1&lt;=i&lt;j&lt;=n}len(T_i)+len(T_j)=\sum_{i=1}^{n-1}\sum_{j=i+1}i+j=(n-1)*n*(n+1)/2 。那么我们就可以算出前面一部分,只要想办法减去lcp就可以了。后缀的LCP是比较容易用SAM算的,我们考虑减出SAM,然后我们发现,其实两个后缀的LCP长度就是parent树上根到LCA的字符串长度,那么我们就可以建出parent树,然后在树上进行树形dp,求出每个点为lca时对答案的贡献,其中字符串长度在建SAM时已经处理好了,所以在树形dp的同时再维护一下子树的size就好了。注意答案会爆int。

代码:

#include <bits/stdc++.h>
using namespace std;

int n,fa[2000010],len[2000010],lst=1,rt=1,cnt=1,ch[2000010][26];
int sz[2000010],hed[2000010],num;
char s[500010];
long long ans; 
struct node
{
	int to,next;
}a[4000010];
inline void insert(int x)
{
	int cur=++cnt,pre=lst;
	lst=cur;
	len[cur]=len[pre]+1;
	sz[cur]=1;
	for(;pre&&!ch[pre][x];pre=fa[pre])
	ch[pre][x]=cur;
	if(!pre)
	fa[cur]=rt;
	else
	{
		int ji=ch[pre][x];
		if(len[ji]==len[pre]+1)
		fa[cur]=ji;
		else
		{
			int gg=++cnt;
			memcpy(ch[gg],ch[ji],sizeof(ch[ji]));
			len[gg]=len[pre]+1;
			fa[gg]=fa[ji];
			fa[ji]=fa[cur]=gg;
			for(;pre&&ch[pre][x]==ji;pre=fa[pre])
			ch[pre][x]=gg;
		}
	}
}
inline void add(int from,int to)
{
	a[++num].to=to;
	a[num].next=hed[from];
	hed[from]=num;
}
inline void dfs(int x)
{
	for(int i=hed[x];i;i=a[i].next)
	{
		int y=a[i].to;
		dfs(y);
		ans-=2ll*len[x]*sz[x]*sz[y];
		sz[x]+=sz[y];
	}
}
int main()
{
	scanf("%s",s+1);
	n=strlen(s+1);
	for(int i=1;i<=n;++i)
	insert(s[i]-'a');
	for(int i=2;i<=cnt;++i)
	add(fa[i],i);
	dfs(1);
	ans+=1ll*n*(n-1)/2*(n+1);
	printf("%lld\n",ans);
	return 0;
}

猜你喜欢

转载自blog.csdn.net/forever_shi/article/details/84749388