字符串的最长连续重复子串

两种方法:

循环两次寻找最长的子串:

<方法一>

#include <iostream>

#include <stdio.h>

#include<string>

using namespace std;

int main(){

string str,tep;

cin>>str;

for(int i=str.length()-1;i>1;i--){

for(int j=0;j<str.length();j++){

if(j+i<=str.length()){

size_t t=0;

size_t num=0;

tep=str.substr(j,i);

t=str.find(tep);

num=str.rfind(tep);

if(t!=num){

cout<<tep<<" "<<t+1<<endl;

system("pause");

return 1;

}

}

}

}

system("pause");

return 1;

}

<方法二>

首先,如果输入字符串存储在c[0..n-1]中,那么就可以使用类似于下面的代码比较每对子字符串:

    maxlen = -1

    for i = [0, n)

        for j = (i, n)

            if (thislen = comlen(&c[i], &c[j])) > maxlen

                maxlen = thislen

                maxi = i

                maxj = j

此处:

 

   int comlen(char *p, char* q)

        i = 0

        while *q && (*p++ = *q++)//strlen(q)<strlen(p)

            i++

        return i

 

后缀数组方法:

 

 

#define MAXN 5000000

char c[MAXN], *a[MAXN];

 

首先初始化a,这样,每个元素就都指向输入字符串中的相应字符:

    while (ch = getchar()) != EOF

          a[n] = &c[n];

          c[n++] = ch;

          c[n] = 0 ;//将数组c中的最后一个元素设为空字符,以终止所有字符串。

这样,元素a[0]指向整个字符串,下一个元素指向以第二个字符开始的数组的后缀,等等。

 

第二,对后缀数组进行快速排序,以将后缀相近的(变位词)子串集中在一起

qsort(a, n, sizeof(char*), pstrcmp)

 

 

a[0]:banana                                          a[0]:a

 

a[1]:anana                   qsort                 a[1]:ana

a[2]:nana             ============》 a[2]:anana         

a[3]:ana                                               a[3]:banana

a[4]:na                                                 a[4]:na

a[5]:a                                                   a[5]:nana

注:qsort的说明:

      qsort():

      原型:
      _CRTIMP void __cdecl qsort (void*, size_t, size_t,int (*)(const void*, const void*));

      解释:    qsort ( 数组名 ,元素个数,元素占用的空间(sizeof),比较函数) 
                  比较函数是一个自己写的函数  遵循 int com(const void *a,const void *b) 的格式。
                  当a b关系为 >  <  = 时,分别返回正值 负值 零 (或者相反)。
                  使用a b 时要强制转换类型,从void * 转换回应有的类型后,进行操作。 
                  数组下标从零开始,个数为N, 下标0-(n-1)。

                  实例:
                         int compare(const void *a,const void *b)
                         {
                                return *(int*)b-*(int*)a;  
                          }

                         int main()
                         {
                                int a[20]={2,4,1,23,5,76,0,43,24,65},i;
                                for(i=0;i<20;i++)
                                    cout<<a[i]<<endl;
                               qsort((void *)a,20,sizeof(int),compare);
                               for(i=0;i<20;i++)
                                     cout<<a[i]<<endl;
                                return 0;
                         }

      相关:

            1)why你必须给予元素个数?

               因为阵列不知道它自己有多少个元素

            2)why你必须给予大小?

               因为 qsort 不知道它要排序的单位.

            3)why你必须写那个丑陋的、用来比较俩数值的函式?

               因为 qsort 需要一个指标指向某个函式,因为它不知道它所要排序的元素型别.

            4)why qsort 所使用的比较函式接受的是 const void* 引数而不是 char* 引数?

               因为 qsort 可以对非字串的数值排序.

 

第三,使用以下comlen函数对数组进行扫描比较邻接元素,以找出最长重复的字符串:

for i = [0, n)

     if comlen(a[i], a[i+1]) > maxlen

         maxlen = comlen(a[i], a[i+1])

         maxi = i

printf("%.*s\n", maxlen, a[maxi])

由于少了内层循环,只是多了一次排序,因此该算法的运行时间为O(n logn). 

代码:

1 #include <stdio.h>
 2 #include <stdlib.h>
 3 #include <string.h>
 4 
 5 #define MAXCHAR 5000 //最长处理5000个字符
 6 
 7 char c[MAXCHAR], *a[MAXCHAR];
 8 
 9 int comlen( char *p, char *q ){
10     int i = 0;
11     while*&& (*p++ == *q++) )
12         ++i;
13     return i;
14 }
15 
16 int pstrcmp( const void *p1, const void *p2 ){
17     return strcmp( *(char* const *)p1, *(char* const*)p2 );
18 }
19 
20 int main(  ){
21     char ch;
22     int  n=0;
23     int  i, temp;
24     int  maxlen=0, maxi=0;
25     printf("Please input your string:\n");
26     while( (ch=getchar())!='\n' ){
27         a[n]=&c[n];
28         c[n++]=ch;
29     }
30     c[n]='\0';
31     qsort( a, n, sizeof(char*), pstrcmp );
32     for(i=0; i<n-1++i ){
33         temp=comlen( a[i], a[i+1] );
34         if( temp>maxlen ){
35             maxlen=temp;
36             maxi=i;
37         }
38     }
39     printf("%.*s\n",maxlen, a[maxi]);
40     system("PAUSE");
41     return 0;
42 }

 

疑难解释:

1、a是指针数组,数组的元素全是char* 类型的指针。所以对应pstrcmp里面的void类型就是char*

2、const void*p,将char*代替void后,也就是进行强制类型转换时应该写成(char* const*)p 而不是

      (const char **)p,两者之间的区别见前面博文。强调一点:char* const* p里面的const是修饰char*的

      也就是说,p里面的内容是一个char* const q类型的指针。故(*p)++是不允许的。

 

补充:sort()

 

要使用此函数只需用#include <algorithm> sort即可使用,语法描述为:

sort(begin,end),表示一个范围,例如:

int _tmain(int argc, _TCHAR* argv[])
{
 int a[20]={2,4,1,23,5,76,0,43,24,65},i;
 for(i=0;i<20;i++)
  cout<<a[i]<<endl;
 sort(a,a+20);
 for(i=0;i<20;i++)
 cout<<a[i]<<endl;
 return 0;
}

输出结果将是把数组a按升序排序,说到这里可能就有人会问怎么样用它降序排列呢?这就是下一个讨论的内容.

一种是自己编写一个比较函数来实现,接着调用三个参数的sort:sort(begin,end,compare)就成了。对于list容器,这个方法也适用,把compare作为sort的参数就可以了,即:sort(compare).

1)自己编写compare函数:

bool compare(int a,int b)
{
      return a<b;   //升序排列,如果改为return a>b,则为降序

}

int _tmain(int argc, _TCHAR* argv[])
{
     int a[20]={2,4,1,23,5,76,0,43,24,65},i;
     for(i=0;i<20;i++)
       cout<<a[i]<<endl;
     sort(a,a+20,compare);
     for(i=0;i<20;i++)
       cout<<a[i]<<endl;
     return 0;
}

2)更进一步,让这种操作更加能适应变化。也就是说,能给比较函数一个参数,用来指示是按升序还是按降序排,这回轮到函数对象出场了。

为了描述方便,我先定义一个枚举类型EnumComp用来表示升序和降序。很简单:

enum Enumcomp{ASC,DESC};

然后开始用一个类来描述这个函数对象。它会根据它的参数来决定是采用“<”还是“>”。

class compare
{
      private:
            Enumcomp comp;
      public:
            compare(Enumcomp c):comp(c) {};
      bool operator () (int num1,int num2)
         {
            switch(comp)
              {
                 case ASC:
                        return num1<num2;
                 case DESC:
                        return num1>num2;
              }
          }
};

接下来使用 sort(begin,end,compare(ASC)实现升序,sort(begin,end,compare(DESC)实现降序。

主函数为:

int main()
{
     int a[20]={2,4,1,23,5,76,0,43,24,65},i;
     for(i=0;i<20;i++)
         cout<<a[i]<<endl;
     sort(a,a+20,compare(DESC));
     for(i=0;i<20;i++)
         cout<<a[i]<<endl;
     return 0;
}

3)其实对于这么简单的任务(类型支持“<”、“>”等比较运算符),完全没必要自己写一个类出来。标准库里已经有现成的了,就在functional里,include进来就行了。functional提供了一堆基于模板的比较函数对象。它们是(看名字就知道意思了):equal_to<Type>、not_equal_to<Type>、greater<Type>、greater_equal<Type>、less<Type>、less_equal<Type>。对于这个问题来说,greater和less就足够了,直接拿过来用:

  • 升序:sort(begin,end,less<data-type>());
  • 降序:sort(begin,end,greater<data-type>()).

int _tmain(int argc, _TCHAR* argv[])
{
      int a[20]={2,4,1,23,5,76,0,43,24,65},i;
      for(i=0;i<20;i++)
          cout<<a[i]<<endl;
      sort(a,a+20,greater<int>());
      for(i=0;i<20;i++)
          cout<<a[i]<<endl;
      return 0;
}

4)既然有迭代器,如果是string 就可以使用反向迭代器来完成逆序排列,程序如下:

int main()
{
     string str("cvicses");
     string s(str.rbegin(),str.rend());
     cout << s <<endl;
     return 0;
}

猜你喜欢

转载自1527zhaobin.iteye.com/blog/1615657