浅谈字符串哈希 By cellur925

前言

蒟蒻最近在复习字符串算法...但正如之前所说,我OI太菜被关起来了,本蒟蒻只能从最简单的哈希入手了TAT。而别的dalao都在学习AC自动机/后缀数组等高到不知哪里去的算法qwq。


基本思想

映射。把一个任意长度的字符串映射为一个非负整数,要求冲突概率几乎为0。方法是把字符串看成$p$进制数,通常取$p$为131或13331,当然还有特殊情况,如[CTSC2014]企鹅QQ这道题,之后会解释这种情况。


基本操作

*****************采用unsigned long long存储哈希值和131的幂次***********************

一般情况下,我们都是预处理出字符串前缀子串的哈希值,如下。复杂度是$O(n)$的。

1 for(int i=1;i<=len;i++)
2     f[i]=f[i-1]*131+ch[i];
3 //ch[]是字符数组 

当然也可以边用边求啦qwq,主要用于带修改的情况,如[USACO15FEB]审查(黄金)Censoring (Gold),就不能预处理出来,因为随时可能会有删除字符的操作qwq。

调用一个字符串子串$S[l,r]$的哈希值。复杂度是$O(1)$的。$p$数组是131的幂次,可提前预处理出来,注意$p[0]=1$。以及注意$p$数组若需要预处理,一定处理到字符串的最大长度。

1 ull gethash(int l,int r)
2 {
3     return f[r]-f[l-1]*p[r-l+1];
4 }

如果我们想要得到同一个字符串中的两个子串拼接得到的串的哈希值?

$hash$是关键字啦qwqwq,还是尽量避讳的好。

猜你喜欢

转载自www.cnblogs.com/nopartyfoucaodong/p/9775278.html
今日推荐