哈希表存储结构(处理冲突)
拉链法840. 模拟散列表开放寻址法 字符串哈希法
841. 字符串哈希(kmp的一种特别形式)
哈希表存储结构(处理冲突) 拉链法链式前向星存储邻接表的结构
哈希表长度取成一个质数,且离2的整次幂尽可能远,大于题目查找范围的最小质数
维护一个集合,支持如下几种操作:
I x,插入一个数 x;
Q x,询问数 x 是否在集合中出现过;
现在要进行 N 次操作,对于每个询问操作输出对应的结果。
输入格式
第一行包含整数 N,表示操作数量。
接下来 N 行,每行包含一个操作指令,操作指令为 I x,Q x 中的一种。
输出格式
对于每个询问指令 Q x,输出一个询问结果,如果 x 在集合中出现过,则输出 Yes,否则输出 No。
每个结果占一行。
数据范围
1
≤
N
≤
1
0
5
1≤N≤10^5
1≤N≤105
−
1
0
9
≤
x
≤
1
0
9
−10^9≤x≤10^9
−109≤x≤109
输入样例:
5
I 1
I 2
I 3
Q 2
Q 5
输出样例:
Yes
No
#includeusing namespace std; const int N=100003; struct node{ int to; int next; }e[N]; int cnt; int h[N]; void insert(int x){ int k=(x%N+N)%N; e[++cnt].to=x; e[cnt].next=h[k]; h[k]=cnt; } bool find(int x){ int k=(x%N+N)%N; for(int i=h[k];i;i=e[i].next){ if(e[i].to==x)return true; } return false; } int main(){ int n; cin>>n; char op; int x; while(n--){ cin>>op>>x; if(op=='I')insert(x); if(op=='Q'){ if(find(x))cout<<"Yes"< 开放寻址法 一维数组,开到题目数据范围的2~3倍,大于题目查找范围两倍的最小质数
#include#include using namespace std; const int N=200003,null=0x3f3f3f3f; int h[N]; int find(int x){ int k=(x%N+N)%N; while(h[k]!=null&&h[k]!=x){ k++; if(k==N)k=0; } return k; } int main(){ int n; cin>>n; char op; int x; memset(h,0x3f,sizeof(h)); while(n--){ cin>>op>>x; if(op=='I')h[find(x)]=x;; if(op=='Q'){ if(h[find(x)]==null)cout<<"No"< 字符串哈希法 字符串前缀哈希法
预处理出来所有前缀的哈希
如何定义每一个前缀的哈希值
看成一个p进制数,把字符串转化为以恶搞数字
1、不能把某个字符映射成0,否则冲突了
A——0
AA——0
2、假定不会出现冲突
经验值
P=131、13331
Q = 2 64 Q=2 ^{64} Q=264
这么取 99.9 99.9% 99.9不会出现冲突
前面的哈希可以容忍冲突然后处理冲突,
字符串哈希假定人品爆棚不出现冲突,不考虑出现冲突
3、利用前缀哈希通过公式计算出所有子串的哈希值841. 字符串哈希(kmp的一种特别形式)(字符串哈希) O(n)+O(m)O(n)+O(m)
全称字符串前缀哈希法,把字符串变成一个p进制数字(哈希值),实现不同的字符串映射到不同的数字。 对形如
X 1 X 2 X 3 ⋯ X n − 1 X n X 1 X 2 X 3 ⋯ X n − 1 X n X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn X1X2X3⋯Xn−1XnX1X2X3⋯Xn−1Xn 的字符串,采用字符的ascii 码乘上 P 的次方来计算哈希值。映射公式 ( X 1 × P n − 1 + X 2 × P n − 2 + ⋯ + X n − 1 × P 1 + X n × P 0 ) m o d Q (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ (X1×Pn−1+X2×Pn−2+⋯+Xn−1×P1+Xn×P0)modQ 注意点:
任意字符不可以映射成0,否则会出现不同的字符串都映射成0的情况,比如A,AA,AAA皆为0冲突问题:通过巧妙设置P (131 或 13331) , Q (264)(264)的值,一般可以理解为不产生冲突。
问题是比较不同区间的子串是否相同,就转化为对应的哈希值是否相同。
求一个字符串的哈希值就相当于求前缀和,求一个字符串的子串哈希值就相当于求部分和。前缀和公式 h [ i + 1 ] = h [ i ] × P + s [ i ] h [ i + 1 ] = h [ i ] × P + s [ i ] i ∈ [ 0 , n − 1 ] i ∈ [ 0 , n − 1 ] h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i] i∈[0,n−1]i∈[0,n−1] h[i+1]=h[i]×P+s[i]h[i+1]=h[i]×P+s[i]i∈[0,n−1]i∈[0,n−1]
h为前缀和数组,s为字符串数组 区间和公式
h [ l , r ] = h [ r ] − h [ l − 1 ] × P r − l + 1 h [ l , r ] = h [ r ] − h [ l − 1 ] × P r − l + 1 h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1 h[l,r]=h[r]−h[l−1]×Pr−l+1h[l,r]=h[r]−h[l−1]×Pr−l+1区间和公式的理解: ABCDE 与 ABC 的前三个字符值是一样,只差两位, 乘上 P2P2 把 ABC 变为 ABC00,再用 ABCDE - ABC00 得到 DE 的哈希值。
作者:chocolate-emperor 链接:https://www.acwing.com/solution/content/24738/
来源:AcWing给定一个长度为 n 的字符串,再给定 m 个询问,每个询问包含四个整数 l 1 , r 1 , l 2 , r 2 l1,r1,l2,r2 l1,r1,l2,r2,请你判断 [ l 1 , r 1 ] 和 [ l 2 , r 2 ] [l1,r1] 和 [l2,r2] [l1,r1]和[l2,r2] 这两个区间所包含的字符串子串是否完全相同。
字符串中只包含大小写英文字母和数字。
输入格式
第一行包含整数 n 和 m,表示字符串长度和询问次数。第二行包含一个长度为 n 的字符串,字符串中只包含大小写英文字母和数字。
接下来 m 行,每行包含四个整数 l 1 , r 1 , l 2 , r 2 l1,r1,l2,r2 l1,r1,l2,r2,表示一次询问所涉及的两个区间。
注意,字符串的位置从 1 开始编号。
输出格式
对于每个询问输出一个结果,如果两个字符串子串完全相同则输出 Yes,否则输出 No。每个结果占一行。
数据范围
1 ≤ n , m ≤ 1 0 5 1≤n,m≤10^5 1≤n,m≤105
输入样例:
8 3
aabbaabb
1 3 5 7
1 3 6 8
1 2 1 2
输出样例:
Yes
No
Yes#include#include using namespace std; const int N=1e5+7,P=131;//字符串哈希值结果很大需要对2^64取模 typedef unsigned long long ULL;//unsigned long long 64位 ULL p[N];//p[i]表示P的i次幂,预处理储存起来 ULL h[N]; char str[N]; ULL get(int l,int r){ return h[r]-h[l-1]*p[r-l+1]; } int main(){ int n,m; cin>>n>>m; // for(int i=1;i<=n;i++){ // cin>>str[i]; // } cin>>str+1; p[0]=1; //不能映射成0,所以哈希表数组是从下标1开始的 for(int i=1;i<=n;i++){ p[i]=p[i-1]*P; h[i]=h[i-1]*P+str[i]; //小写字母97-122 } int l1,r1,l2,r2; while(m--){ cin>>l1>>r1>>l2>>r2; if(get(l1,r1)==get(l2,r2))cout<<"Yes"<



