后缀自动机学习笔记--思路

原来看这个东西很复杂不敢学,现在发现字符串训练啥都不会,后悔了,强行去学了一波。。。

大体思路:

定义集合endpos(s)集合表示s这个子串在总串S中所有出现的结束位置的集合,那么显然一些子串的endpos集合会是完全相同的,所以将这些子串全都丢在自动机上的一个状态里(即一个点中,注意连接点的边表示的是字母),而有一些endpos集合会包含其他的(比如"b"的集合可能会包含"ab"),那么我们从小的集合向比它大同时最小的集合连一条slink边,所以从一个状态走这种slink边回到初始状态过程中得到的所有子串可以互为后缀(可能这也是名字由来?),同时为了转移以及查询方便等等辅助作用,我们还需保存一个状态中最长串长度、最短串长度以及在该状态后增加某个字符所达的转移状态(显然同一状态中子串加个字符到的下一状态也是一样的),基本上把slink、最长、最短、转移这些东西弄好就可以搞定后缀自动机了。(构建算法实现还在学习中。。。)

猜你喜欢

转载自blog.csdn.net/caoyang1123/article/details/81222747
今日推荐