哈希表、字符串哈希（特别的kmp）

哈希表存储结构（处理冲突）
拉链法840. 模拟散列表开放寻址法字符串哈希法
841. 字符串哈希(kmp的一种特别形式）
哈希表存储结构（处理冲突）拉链法
链式前向星存储邻接表的结构
哈希表长度取成一个质数，且离2的整次幂尽可能远，大于题目查找范围的最小质数
840. 模拟散列表
维护一个集合，支持如下几种操作：
I x，插入一个数 x；
Q x，询问数 x 是否在集合中出现过；
现在要进行 N 次操作，对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 N，表示操作数量。
接下来 N 行，每行包含一个操作指令，操作指令为 I x，Q x 中的一种。
输出格式
对于每个询问指令 Q x，输出一个询问结果，如果 x 在集合中出现过，则输出 Yes，否则输出 No。
每个结果占一行。
数据范围
1 ≤ N ≤ 1 0 5 1≤N≤10^5 1≤N≤105
− 1 0 9 ≤ x ≤ 1 0 9 −10^9≤x≤10^9 −109≤x≤109
输入样例：
5
I 1
I 2
I 3
Q 2
Q 5
输出样例：
Yes
No
#include
using namespace std;
const int N=100003;
struct node{
	int to;
	int next;
}e[N];
int cnt;
int h[N];
void insert(int x){
	int k=(x%N+N)%N;
	e[++cnt].to=x;
	e[cnt].next=h[k];
	h[k]=cnt;
}
bool find(int x){
	int k=(x%N+N)%N;
	for(int i=h[k];i;i=e[i].next){
		if(e[i].to==x)return true;
	}
	return false;
}
int main(){
	int n;
	cin>>n;
	char op;
	int x;
	while(n--){
		cin>>op>>x;
		if(op=='I')insert(x);
		if(op=='Q'){
			if(find(x))cout<<"Yes"< 
开放寻址法 
一维数组，开到题目数据范围的2~3倍，大于题目查找范围两倍的最小质数 
#include
#include 
using namespace std;
const int N=200003,null=0x3f3f3f3f;
int h[N];
int find(int x){
	int k=(x%N+N)%N;
	while(h[k]!=null&&h[k]!=x){
		k++;
		if(k==N)k=0;
	}
	return k;
}
int main(){
	int n;
	cin>>n;
	char op;
	int x;
	memset(h,0x3f,sizeof(h));	
	while(n--){
		cin>>op>>x;
		if(op=='I')h[find(x)]=x;;
		if(op=='Q'){
			if(h[find(x)]==null)cout<<"No"< 
字符串哈希法 
字符串前缀哈希法
 预处理出来所有前缀的哈希
 如何定义每一个前缀的哈希值
 看成一个p进制数，把字符串转化为以恶搞数字 

 1、不能把某个字符映射成0，否则冲突了
 A——0
 AA——0
 2、假定不会出现冲突
 经验值
 P=131、13331
 
    
     
      
       
        Q
       
       
        =
       
       
        
         2
        
        
         64
        
       
      
      
       Q=2 ^{64}
      
     
    Q=264
 这么取
    
     
      
       
        99.9
       
      
      
       99.9%
      
     
    99.9不会出现冲突
 前面的哈希可以容忍冲突然后处理冲突，
 字符串哈希假定人品爆棚不出现冲突，不考虑出现冲突
 3、利用前缀哈希通过公式计算出所有子串的哈希值 
 
 (字符串哈希) O(n)+O(m)O(n)+O(m)
 全称字符串前缀哈希法，把字符串变成一个p进制数字（哈希值），实现不同的字符串映射到不同的数字。 对形如
 
     
      
       
        
         X
        
        
         1
        
        
         X
        
        
         2
        
        
         X
        
        
         3
        
        
         ⋯
        
        
         X
        
        
         n
        
        
         −
        
        
         1
        
        
         X
        
        
         n
        
        
         X
        
        
         1
        
        
         X
        
        
         2
        
        
         X
        
        
         3
        
        
         ⋯
        
        
         X
        
        
         n
        
        
         −
        
        
         1
        
        
         X
        
        
         n
        
       
       
        X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn
       
      
     X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。 
 映射公式 
     
      
       
        
         (
        
        
         X
        
        
         1
        
        
         ×
        
        
         P
        
        
         n
        
        
         −
        
        
         1
        
        
         +
        
        
         X
        
        
         2
        
        
         ×
        
        
         P
        
        
         n
        
        
         −
        
        
         2
        
        
         +
        
        
         ⋯
        
        
         +
        
        
         X
        
        
         n
        
        
         −
        
        
         1
        
        
         ×
        
        
         P
        
        
         1
        
        
         +
        
        
         X
        
        
         n
        
        
         ×
        
        
         P
        
        
         0
        
        
         )
        
        
         m
        
        
         o
        
        
         d
        
        
         Q
        
       
       
        (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ
       
      
     (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ 注意点： 
 任意字符不可以映射成0，否则会出现不同的字符串都映射成0的情况，比如A,AA,AAA皆为0冲突问题：通过巧妙设置P (131 或 13331) , Q (264)(264)的值，一般可以理解为不产生冲突。 
 问题是比较不同区间的子串是否相同，就转化为对应的哈希值是否相同。
 求一个字符串的哈希值就相当于求前缀和，求一个字符串的子串哈希值就相当于求部分和。 
 前缀和公式 
     
      
       
        
         h
        
        
         [
        
        
         i
        
        
         +
        
        
         1
        
        
         ]
        
        
         =
        
        
         h
        
        
         [
        
        
         i
        
        
         ]
        
        
         ×
        
        
         P
        
        
         +
        
        
         s
        
        
         [
        
        
         i
        
        
         ]
        
        
         h
        
        
         [
        
        
         i
        
        
         +
        
        
         1
        
        
         ]
        
        
         =
        
        
         h
        
        
         [
        
        
         i
        
        
         ]
        
        
         ×
        
        
         P
        
        
         +
        
        
         s
        
        
         [
        
        
         i
        
        
         ]
        
        
         i
        
        
         ∈
        
        
         [
        
        
         0
        
        
         ,
        
        
         n
        
        
         −
        
        
         1
        
        
         ]
        
        
         i
        
        
         ∈
        
        
         [
        
        
         0
        
        
         ,
        
        
         n
        
        
         −
        
        
         1
        
        
         ]
        
       
       
        h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i] i∈[0,n−1]i∈[0,n−1]
       
      
     h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i]i∈[0,n−1]i∈[0,n−1]
 h为前缀和数组，s为字符串数组 区间和公式
 
     
      
       
        
         h
        
        
         [
        
        
         l
        
        
         ,
        
        
         r
        
        
         ]
        
        
         =
        
        
         h
        
        
         [
        
        
         r
        
        
         ]
        
        
         −
        
        
         h
        
        
         [
        
        
         l
        
        
         −
        
        
         1
        
        
         ]
        
        
         ×
        
        
         P
        
        
         r
        
        
         −
        
        
         l
        
        
         +
        
        
         1
        
        
         h
        
        
         [
        
        
         l
        
        
         ,
        
        
         r
        
        
         ]
        
        
         =
        
        
         h
        
        
         [
        
        
         r
        
        
         ]
        
        
         −
        
        
         h
        
        
         [
        
        
         l
        
        
         −
        
        
         1
        
        
         ]
        
        
         ×
        
        
         P
        
        
         r
        
        
         −
        
        
         l
        
        
         +
        
        
         1
        
       
       
        h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1
       
      
     h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1 
 区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样，只差两位， 乘上 P2P2 把 ABC 变为 ABC00，再用 ABCDE - ABC00 得到 DE 的哈希值。 
 作者：chocolate-emperor 链接：https://www.acwing.com/solution/content/24738/
 来源：AcWing 
 
841. 字符串哈希(kmp的一种特别形式） 
给定一个长度为 n 的字符串，再给定 m 个询问，每个询问包含四个整数 
    
     
      
       
        l
       
       
        1
       
       
        ,
       
       
        r
       
       
        1
       
       
        ,
       
       
        l
       
       
        2
       
       
        ,
       
       
        r
       
       
        2
       
      
      
       l1,r1,l2,r2
      
     
    l1,r1,l2,r2，请你判断 
    
     
      
       
        [
       
       
        l
       
       
        1
       
       
        ,
       
       
        r
       
       
        1
       
       
        ]
       
       
        和
       
       
        [
       
       
        l
       
       
        2
       
       
        ,
       
       
        r
       
       
        2
       
       
        ]
       
      
      
       [l1,r1] 和 [l2,r2]
      
     
    [l1,r1]和[l2,r2] 这两个区间所包含的字符串子串是否完全相同。 
字符串中只包含大小写英文字母和数字。 
输入格式
 第一行包含整数 n 和 m，表示字符串长度和询问次数。 
第二行包含一个长度为 n 的字符串，字符串中只包含大小写英文字母和数字。 
接下来 m 行，每行包含四个整数 
    
     
      
       
        l
       
       
        1
       
       
        ,
       
       
        r
       
       
        1
       
       
        ,
       
       
        l
       
       
        2
       
       
        ,
       
       
        r
       
       
        2
       
      
      
       l1,r1,l2,r2
      
     
    l1,r1,l2,r2，表示一次询问所涉及的两个区间。 
注意，字符串的位置从 1 开始编号。 
输出格式
 对于每个询问输出一个结果，如果两个字符串子串完全相同则输出 Yes，否则输出 No。 
每个结果占一行。 
数据范围
 
    
     
      
       
        1
       
       
        ≤
       
       
        n
       
       
        ,
       
       
        m
       
       
        ≤
       
       
        1
       
       
        
         0
        
        
         5
        
       
      
      
       1≤n,m≤10^5
      
     
    1≤n,m≤105
 输入样例：
 8 3
 aabbaabb
 1 3 5 7
 1 3 6 8
 1 2 1 2
 输出样例：
 Yes
 No
 Yes 
#include
#include 
using namespace std;
const int N=1e5+7,P=131;//字符串哈希值结果很大需要对2^64取模 
typedef unsigned long long ULL;//unsigned long long 64位 
ULL p[N];//p[i]表示P的i次幂，预处理储存起来 
ULL h[N];
char str[N];
ULL get(int l,int r){
	return h[r]-h[l-1]*p[r-l+1];
}
int main(){
	int n,m;
	cin>>n>>m;
//	for(int i=1;i<=n;i++){
//		cin>>str[i];
//	}
	cin>>str+1;
	p[0]=1;
	//不能映射成0，所以哈希表数组是从下标1开始的 
	for(int i=1;i<=n;i++){
		p[i]=p[i-1]*P;
		h[i]=h[i-1]*P+str[i]; //小写字母97-122
	}
	int l1,r1,l2,r2;
	while(m--){
		cin>>l1>>r1>>l2>>r2;
		if(get(l1,r1)==get(l2,r2))cout<<"Yes"<
哈希表、字符串哈希（特别的kmp）

C/C++/C#相关栏目本月热门文章