POJ - 3294 Life Forms(二分+后缀数组)

题目链接:点击查看

题目大意:给出n个字符串,求出至少在n/2个字符串中出现的最长的公共子串,如果没有,输出“?”

题目分析:和poj3450几乎一样的题目,只不过最长公共子串出现的条件改成了出现次数大于n/2,并且要求输出全部的答案,那么我们只需要对二分时的check函数稍作修改就好了,也就是对于每个组单独进行统计,如果满足当前二分的答案mid,就插入到vector中,最后check函数返回是否至少有一个答案满足条件即可

代码:

#include<iostream>
#include<cstdio> 
#include<string>
#include<ctime>
#include<cstring>
#include<algorithm>
#include<stack>
#include<queue>
#include<map>
#include<set>
#include<sstream>
using namespace std;

typedef long long LL;

const int inf=0x3f3f3f3f;

const int N=1e5+200;

vector<int>ans;

char str[N];

int sa[N]; //SA数组,表示将S的n个后缀从小到大排序后把排好序的
//的后缀的开头位置顺次放入SA中
int t1[N],t2[N],c[N];

int rk[N],height[N],belong[N],len,n;

int s[N];

bool vis[110];
 
void build_sa(int s[],int n,int m)//n为添加0后的总长
{
    int i,j,p,*x=t1,*y=t2;
    for(i=0;i<m;i++) 
		c[i]=0;
    for(i=0;i<n;i++) 
		c[x[i]=s[i]]++;
    for(i=1;i<m;i++) 
		c[i]+=c[i-1];
    for(i=n-1;i>=0;i--) 
		sa[--c[x[i]]]=i;
    for(j=1;j<=n;j<<=1) 
	{
        p=0;
        for(i=n-j;i<n;i++) 
			y[p++]=i;
        for(i=0;i<n;i++) 
            if(sa[i]>=j) 
                y[p++]=sa[i]-j;
        for(i=0;i<m;i++) 
			c[i]=0;
        for(i=0;i<n;i++) 
			c[x[y[i]]]++;
        for(i=1;i<m;i++) 
			c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) 
			sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1,x[sa[0]]=0;
        for(i=1;i<n;i++) 
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+j]==y[sa[i]+j]?p-1:p++;
        if(p>=n) 
			break;
        m=p;
    }
}
 
void get_height(int s[],int n)//n为添加0后的总长
{
    int i,j,k=0;
    for(i=0;i<=n;i++)
        rk[sa[i]]=i;
    for(i=0;i<n;i++) 
	{
        if(k) 
			k--;
        j=sa[rk[i]-1];
        while(s[i+k]==s[j+k]) 
			k++;
        height[rk[i]]=k;
    }
}

void solve(int base=128)
{
	build_sa(s,len+1,base);
	get_height(s,len);
}

bool check(int x)
{
	bool flag=false;
	for(int i=2;i<=len;i++)
	{
		if(height[i]<x)
			continue;
		memset(vis,false,sizeof(vis));
		int cnt=0;
		while(i<=len&&height[i]>=x)//对当前分组进行统计 
		{
			if(belong[sa[i]]!=-1&&!vis[belong[sa[i]]])
			{
				vis[belong[sa[i]]]=true;
				cnt++;
			}
			if(belong[sa[i-1]]!=-1&&!vis[belong[sa[i-1]]])
			{
				vis[belong[sa[i-1]]]=true;
				cnt++;
			}
			i++;
		}
		if(cnt>n/2)
		{
			if(flag)
				ans.push_back(sa[i-1]);
			else
			{
				flag=true;
				ans.clear();
				ans.push_back(sa[i-1]);
			}
		}
	}
	return flag;
}

int main()
{
//	freopen("input.txt","r",stdin);
//	ios::sync_with_stdio(false);
	while(scanf("%d",&n)!=EOF&&n)
	{
		len=0;
		int pos=30;
		for(int i=1;i<=n;i++)
		{
			scanf("%s",str);
			for(int j=0;str[j];j++)
			{
				s[len]=str[j]-'a'+1;
				belong[len]=i;
				len++;
			}
			s[len]=pos;
			belong[len]=-1;
			pos++;
			len++;
		}
		belong[len]=-1;
		s[len]=0;
		solve(pos);
		int l=1,r=1000,lenth=-1;
		while(l<=r)
		{
			int mid=l+r>>1;
			if(check(mid))
			{
				lenth=mid;
				l=mid+1;
			}
			else
				r=mid-1;
		}
		if(lenth!=-1)
		{
			for(int i=0;i<ans.size();i++)
			{
				for(int j=0;j<lenth;j++)
					putchar(s[ans[i]+j]+'a'-1);
				putchar('\n');
			}
		}
		else
			printf("?\n");
		printf("\n");
	}







	
	
	
	
	
	
	
	
	
	return 0;
}
发布了558 篇原创文章 · 获赞 16 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_45458915/article/details/104026298