【SA】[NOI2016]优秀的拆分

tech2022-12-05  125

题目

如果一个字符串可以被拆分为 \text{AABB}AABB 的形式,其中 \text{A}A 和 \text{B}B 是任意非空字符串,则我们称该字符串的这种拆分是优秀的。 例如,对于字符串 \texttt{aabaabaa} aabaabaa ,如果令 \text{A}=\texttt{aab}A=aab,\text{B}=\texttt{a}B=a,我们就找到了这个字符串拆分成 \text{AABB}AABB 的一种方式。

一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。 比如我们令 \text{A}=\texttt{a}A=a,\text{B}=\texttt{baa}B=baa,也可以用 \text{AABB}AABB 表示出上述字符串;但是,字符串 \texttt{abaabaa}abaabaa 就没有优秀的拆分。

现在给出一个长度为 nn 的字符串 SS,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。这里的子串是指字符串中连续的一段。

以下事项需要注意:

出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被记入答案。 在一个拆分中,允许出现 \text{A}=\text{B}A=B。例如 \texttt{cccc}cccc 存在拆分 \text{A}=\text{B}=\texttt{c}A=B=c。 字符串本身也是它的一个子串。

思路

hash有95分,然后剩下5分要费很大劲 显然 AABB 是由两个 AA 串拼起来的 考虑令 f ( i ) f(i) f(i) 表示以 i i i 结尾的 A A \rm{AA} AA 数量, g ( i ) g(i) g(i) 表示以 i i i 开头的 A A \rm{AA} AA 数量,答案就是 ∑ f ( i ) g ( i + 1 ) \sum f(i)g(i+1) f(i)g(i+1) 枚举 A \rm{A} A 的长度 L L L ,每隔 L L L 就设置一个关键点,对于长度等于 L L L A \rm{A} A A A \rm{AA} AA 一定经过相邻的恰好两个关键点 画图可以发现,对于两个相邻的关键点 x , y x,y x,y,如果 A A \rm{AA} AA 经过了其,那么一定满足 l c s ( x , y ) + l c p ( x , y ) ≥ L lcs(x,y)+lcp(x,y)\geq L lcs(x,y)+lcp(x,y)L ,这里 l c s ( x , y ) lcs(x,y) lcs(x,y) S t r ( 1 , x ) Str(1,x) Str(1,x) S t r ( 1 , y ) Str(1,y) Str(1,y) 的最长公共后缀长度,这里 l c p ( x , y ) lcp(x,y) lcp(x,y) S t r ( x , n ) Str(x,n) Str(x,n) S t r ( y , n ) Str(y,n) Str(y,n) 的最长公共前缀的长度 这样的话建两个 s a sa sa 分别存原串和原串的反串即可 因为 l c s ( x , y ) + l c p ( x , y ) lcs(x,y)+lcp(x,y) lcs(x,y)+lcp(x,y) 可能大于 L L L ,所以对 f , g f,g f,g 的贡献其实是一段区间,差分实现区间加就好 对于每个 L L L ,关键点的下标是 x L xL xL ,关键点的个数是 L L L [ 1 , n ] [1,n] [1,n] 内的倍数个数,处理 l c s , l c p lcs,lcp lcs,lcp s t st st 表,询问复杂度是 O ( 1 ) O(1) O(1) ,因此这一部分时间复杂度是 O ( n log ⁡ n ) O(n\log n) O(nlogn)

代码

#include<bits/stdc++.h> #define ll long long using namespace std; const int inf=0x3f3f3f3f; const ll INF=0x3f3f3f3f3f3f3f3f; const int N=3e4; int n,f[N+7],g[N+7]; struct SuffixArray{ char s[N+7]; int m,c[N+7],tp[N+7],rk[N+7],sa[N+7]; int h[N+7],st[N+7][20]; void csort(){ for(int i=0;i<=m;i++) c[i]=0; for(int i=1;i<=n;i++) c[rk[i]]++; for(int i=1;i<=m;i++) c[i]+=c[i-1]; for(int i=n;i>=1;i--) sa[c[rk[tp[i]]]--]=tp[i]; } void build(){ memset(c,0,sizeof c); memset(tp,0,sizeof tp); memset(rk,0,sizeof rk); memset(sa,0,sizeof sa); memset(h,0,sizeof h); memset(st,0,sizeof st); for(int i=1;i<=n;i++) rk[i]=s[i],tp[i]=i; m=128,csort(); for(int w=1,p=1,i;p<n;w<<=1,m=p){ for(p=0,i=n-w+1;i<=n;i++) tp[++p]=i; for(i=1;i<=n;i++)if(sa[i]>w) tp[++p]=sa[i]-w; csort(),swap(rk,tp),rk[sa[1]]=p=1; for(i=2;i<=n;rk[sa[i]]=p,i++) if(tp[sa[i]]!=tp[sa[i-1]]||tp[sa[i]+w]!=tp[sa[i-1]+w]) p++; } for(int i=1,j,k=0;i<=n;h[rk[i++]]=k) for(k=k?k-1:k,j=sa[rk[i]-1];s[i+k]==s[j+k];k++); for(int i=1;i<=n;i++) st[i][0]=h[i]; for(int w=1;w<=18;w++) for(int i=1;i+(1<<w)-1<=n;i++) st[i][w]=min(st[i][w-1],st[i+(1<<(w-1))][w-1]); } int Lcp(int a,int b){ int l=rk[a],r=rk[b]; if(l>r) swap(l,r); l++; int k=log2(r-l+1); return min(st[l][k],st[r-(1<<k)+1][k]); } }a,b; void KonnyWen(){ memset(f,0,sizeof f); memset(g,0,sizeof g); scanf("%s",&a.s[1]),n=strlen(&a.s[1]); for(int i=1;i<=n;i++) b.s[i]=a.s[n+1-i]; a.build(),b.build(); for(int i=1;i<=n;i++) f[i]=g[i]=0; for(int w=1;w<=(n>>1);w++) for(int i=w;i<=n;i+=w){ int l=i,r=i+w; int lcp=min(w,a.Lcp(l,r)); int lcs=min(w-1,b.Lcp(n-(l-1)+1,n-(r-1)+1)); if(lcp+lcs>=w){ int cov=lcp+lcs-w+1; f[r+lcp-cov]++,f[r+lcp]--; g[l-lcs]++,g[l-lcs+cov]--; } } for(int i=1;i<=n;i++) f[i]+=f[i-1],g[i]+=g[i-1]; ll ans=0; for(int i=1;i<n;i++) ans+=f[i]*g[i+1]; printf("%lld\n",ans); } int main(){ int t; scanf("%d",&t); while(t--) KonnyWen(); return 0; }
最新回复(0)