「ZJOI2018」树

「ZJOI2018」树

前言

置换同构计数真是令人头大,感觉依然不是特别懂

\[ \ \]

分析与初步构想


设按照题意生成的 \(n\) 个节点有标号有根树族为 \(\mathcal{T}_n\) ,对于某种树形 \(T\) 的生成方案数为 \(c(T)\)

则答案显然是 \(\cfrac{\sum _{T\in \mathcal{T}_n} c^k(T)}{(n-1)!^k}\)

\(k\) 的量级意味着我们无法完成有关 \(c^k(T)\) 的展开,因此要在最开始的计算中就将 \(k\) 这个幂次加入

为此定义 \(F_{i,n}=\sum _{T\in \mathcal{T}_n} c^{ik}(T)\)

则我们要计算的答案就是 \(\cfrac{F_{1,n}}{(n-1)!^k}\)

容易发现有意义的 \(F_{i,j}\) 规模为 \(O(\sum \sum [ij\leq n])=O(n\ln n)\)

关于为什么 \(F_{i,n}\) 会有第一维,会在下面出现

ps: 我的两个维度好像和别人是反的



计算过程分析


考虑递推计算 \(F_{i,n}\)

容易发现对于任意一个 \(F_{i,n}\) 的计算只需要令 \(k\rightarrow ik\)

为了简化描述,我们先以计算 \(F_{1,...}\) 为例

对于同构树计数,子树的叠加是无序的背包问题,树形之间存在着置换同构

而每棵子树的编号之间可以任意归并,因此需要 \(\text{EGF}\) 的背包合并每棵子树

显然同构仅出现在同种大小的子树中,因此可以对于不同大小的子树分离

假设对于大小为 \(n\) 的子树,出现了 \(m\) 种不同的树形 \(T_1,T_2,\ldots T_m\) ,每种出现了 \(a_i\)

则答案应该为 \(\displaystyle \sum_{T_i\ne T_j} \frac{1}{(n!)^m}\prod \frac{c^{a_ik}(T_i)}{(a_i!)^k}\)

其中 \((a_i!)^k\) 除去同构树之间无排列序的方案数

普通的背包计数难以处理 \(T_i\ne T_j\) 的限制

因此考虑用 \(\text{Burnside}\) 引理解决置换同构问题



同构出现于 \(m\) 棵树之间,因此我们置换群为对于 \(m\) 的排列置换群

显然任意一个排列置换的的结果是若干个置换环,环上的树树形相同

则对于一个置换 \(f\) ,设其生成了大小分别为 \(b_1,b_2,\ldots, b_m\) 的置换环

理想情况下其不动点的式子计算如下

\(\displaystyle \text{fix}(f)=\frac{(n\sum b_i)!}{(n!)^{\sum b_i}}\cdot \frac{F_{b_i,n}}{(b_i!)^k}\)

(这就是为什么要给 \(F\) 添加第一维)

其中 \(\cfrac{(n\sum b_i)!}{(n!)^{\sum b_i}}\) 处理了 \(\sum b_i\) 棵树的点编号,实际上这两个权值可以在计算的最后加入,因此下面忽略掉

而实际上,在不动点中直接加入 \(\cfrac{1}{(b_i!)^k}\) 是错的

原因在于让这样的 置换环权值 带入 \(\text{Burnside}\) 引理之后

最终的 同构类权值 并不是我们想要的 \(\cfrac{1}{(a_i!)^k}\)



考虑 待定求解 一个置换环系数的 \(\text{EGF}\) ,设其为 \(A(x)\)

相较于上面的枚举 \(f\) 的式子,这里的计算中系数还需要考虑对于每种 \(b_i\) ,等价的置换 \(f\) 个数

这同样需要对于每棵子树的 \(\text{EGF}\) 合并,系数为 \(\cfrac{1}{b_i!}\)

而一个环上的点存在一个环排列 \((b_i-1)!\) ,两者合并即 \(\cfrac{1}{b_i}\)

注意这一部分并未被加入 \(A(x)\)

然而这也恰好使得 \(\text{Burnside}\) 引理的系数 \(\frac{1}{m!}\) 和置换元素的 \(\text{EGF}\) 系数相抵消

不妨设添加环系数 \(\text{EGF}\) 的变换为 \(\hat A_i=\cfrac{A_i}{i}\)

所以,则最终的计算中 \(\text{Burnside}\) 引理的答案就是 \(\text{exp}(\hat A(x))\)



我们希望最终一个 合法的同构类 的权值为 \(\cfrac{1}{(a_i!)^k}\)

而容易发现实际上 最终的同构类 是由我们初始枚举的置换环\(\text{exp}\)

因此 \(\cfrac{1}{a_i!}\) 应当是置换环系数经过环元素 \(\text{exp}\) 叠加的结果

\(B(x)=\cfrac{x^i}{(i!)^k},C_i=\cfrac{A_i}{F_{n,i}}\)

\(B(x)=\text{exp}(\hat C(x))\) ,对于 \(B(x)\)\(\ln\) 得到 \(\hat C(x)\)

加入系数得到我们前面所待定的 \(A(x)\) ,即可进行最后的 \(\text{exp}(\hat A(x))\) 计算

ps:

你会发现可以直接忽略环 \(\text{EGF}\) 变换,全程只有 \(\hat C(x),\hat A(x)\) ,在过渡中这个变换的系数直接消失了

在这里提到这个系数是为了避免不必要的误解,同时也强调其他时候使用 \(\text{Burnside}\) 引理需要添加这个系数



算法实现简谈


倒序枚举 \(F_{i,j}\)\(i\) ,正序枚举大小 \(j\) ,边界条件自然是 \(F_{i,1}=1\)

确定了一个 \(i\) 后,就可以预处理 \(\ln\) 求出置换环系数,这里有 \(\frac{n}{i}\)

按照每个 \(i\) ,上面式子中的 \(k\rightarrow ik\)

按照 \(j\) 从小到大计算 \(F_{i,j}\) ,每次得到 \(F_{i,j}\) 之后

计算关于大小为 \(j\) 的树的背包系数,这里系数的个数为 \(l=\frac{n}{ij}\)

将先前的系数补上 \(F_{d,j}\) ,再做 \(\text{exp}\) ,最后把前面扔掉的 \(\cfrac{1}{(n!)^{\sum a_i}}\) 补上,( \((n\sum a_i)!\) 直接作为后面 \(\text{EGF}\) 合并的系数)

然后将它补进前面累和的背包里,就能得到这一项的值

注意前面算的式子都是计算儿子的,最后还要加上自己的大小1

当然,计算 \(\text{exp},\ln\) 需要下面的帮助


\(\text{exp}\)\(O(n^2)\) 方法

\(F(x)=\text{exp}(G(x))\)

\(F'(x)=\text{exp}(G(x))G'(x)\)

\(F'(x)=F(x)G'(x)\)

先计算出 \(G'(x)\) ,然后 \(O(n^2)\) 依次得到 \(F'(x)\) 的第 \(i\) 项,就能知道 \(F(x)\) 的第 \(i+1\)


\(\ln\)\(O(n^2)\) 方法

\(F(x)=\ln G(x)\)

\(F'(x)G(x)=G'(x)\)

边界 \([x^0]G(x)=1,[x^0]F(x)=0\)

暴力推 \(F'(x)\) 的每一项即可



进一步优化

上面的计算时,每次求得一个 \(\hat A(x)\) ,都做一次 \(\text{exp}\) ,然后背包合并

但是实际上,我们可以先将 \(\hat A(x)\) 放在一起,然后一起做 \(\text{exp}\)

具体的,每次得到 \(F_{i,j}\) 之和,我们就可以确定 \(\sum \hat A(x)\) 的第 \(j\)

那么在维护 \(\sum \hat A(x)\) 的同时,也依次递推 \(\text{exp}(\sum \hat A(x))\)\(j\)

这样不仅去掉的背包的过程,也少了很多次 \(\text{exp}\)

Montegomery

最后是喜闻乐见的套板子时间

\[ \ \]

复杂度分析


未优化

相对于 \(\text{exp}\) ,求 \(\ln\) 的复杂度可以忽略

\(\text{exp}\) 每次大小是 \(\frac{n}{ij}\) ,即 \(O(\sum \sum \cfrac{n^2}{i^2j^2})=O(n^2)\)

最后的复杂度反而在于背包合并 \(\text{EGF}\) ,为 \(O(n^2\ln n)\)

优化后

同步求 \(\text{exp}\) 的复杂度为 \(O((\cfrac{n}{i})^2)=O(n^2)\)

Code1:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
const int N=2010;

int n,k,P;
ll qpow(ll x,ll k=P-2) {
ll res=1;
for(;k;k>>=1,x=x*x%P) if(k&1) res=res*x%P;
return res;
}
int F[N][N],T[N],H[N],C[N];
int I[N],J[N],Inv[N];
void Exp(int *a,int n){
static int b[N];
rep(i,1,n) b[i-1]=1ll*a[i]*i%P;
rep(i,0,n) a[i]=0;
a[0]=1;
rep(i,0,n-1) {
int s=0;
rep(j,0,i) s=(s+1ll*a[i-j]*b[j])%P;
a[i+1]=1ll*s*Inv[i+1]%P;
}
}

void Ln(int *a,int n){
static int b[N];
rep(i,0,n) b[i]=a[i];
rep(i,0,n-1) {
int s=1ll*b[i+1]*(i+1)%P;
rep(j,0,i-1) s=(s-1ll*a[j]*b[i-j])%P;
Mod2(s),a[i]=s;
}
drep(i,n,1) a[i]=1ll*a[i-1]*Inv[i]%P;
a[0]=0;
}

int IK[N],JK[N];

int main(){
n=rd(),k=rd(),P=rd();
Inv[0]=Inv[1]=1;
rep(i,2,n) Inv[i]=1ll*(P-P/i)*Inv[P%i]%P;
rep(i,*I=*J=1,n) I[i]=1ll*I[i-1]*qpow(Inv[i],k)%P,J[i]=1ll*J[i-1]*qpow(i,k)%P;

drep(i,n,1) {
int m=n/i;
rep(j,*H=1,m) H[j]=0;
rep(j,0,m) IK[j]=qpow(I[j],i),JK[j]=qpow(J[j],i);
rep(j,*C=1,m) C[j]=IK[j];
Ln(C,m);
rep(j,1,m) {
F[i][j]=1ll*H[j-1]*JK[j-1]%P;

int u=m/j;
T[0]=0;
rep(x,1,u) T[x]=1ll*C[x]*F[i*x][j]%P;
Exp(T,u);
int t=1;
rep(x,1,u) t=1ll*t*IK[j]%P,T[x]=1ll*T[x]*t%P;
drep(x,m,1) rep(y,1,x/j) H[x]=(H[x]+1ll*H[x-y*j]*T[y])%P;
}
}
int ans=1ll*F[1][n]*I[n-1]%P;
printf("%d\n",ans);
}

Code2:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
#include<cstdio>
using namespace std;
typedef long long ll;
#define Mod1(x) ((x>=P)&&(x-=P))
#define Mod2(x) ((x<0)&&(x+=P))
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)
enum{N=2010};
int n,k,P;
ll qpow(ll x,ll k=P-2) {
ll res=1;
for(;k;k>>=1,x=x*x%P) if(k&1) res=res*x%P;
return res;
}
int H[N],F[N][N],T[N],C[N];
int I[N],J[N],Inv[N],Fac[N];
int IK[N],JK[N];
void Ln(int *a,int n){
static int b[N];
rep(i,0,n) b[i]=a[i];
rep(i,0,n-1) {
int s=1ll*b[i+1]*(i+1)%P;
rep(j,0,i-1) s=(s-1ll*a[j]*b[i-j])%P;
Mod2(s),a[i]=s;
}
drep(i,n,1) a[i]=1ll*a[i-1]*Inv[i]%P;
a[0]=0;
}


int main(){
scanf("%d%d%d",&n,&k,&P);
Inv[0]=Inv[1]=1;
rep(i,2,n) Inv[i]=1ll*(P-P/i)*Inv[P%i]%P;
rep(i,*I=*J=1,n) I[i]=1ll*I[i-1]*qpow(Inv[i],k)%P,J[i]=1ll*J[i-1]*qpow(i,k)%P;
rep(i,*Fac=1,n) Fac[i]=1ll*Fac[i-1]*i%P;

drep(i,n,1) {
int m=n/i;
rep(j,*H=1,m) H[j]=T[j]=0;
rep(j,0,m) IK[j]=qpow(I[j],i),JK[j]=qpow(J[j],i);
rep(j,*C=1,m) C[j]=IK[j];
Ln(C,m);
rep(j,1,m) {
F[i][j]=1ll*H[j-1]*JK[j-1]%P;
int u=m/j,t=1;
T[0]=0;
rep(x,1,u) t=1ll*t*IK[j]%P,T[x*j]=(T[x*j]+1ll*C[x]*F[i*x][j]%P*t%P*x*j)%P;
rep(x,1,j) H[j]=(H[j]+1ll*H[j-x]*T[x])%P;
H[j]=1ll*H[j]*Inv[j]%P;
}
}
int ans=1ll*F[1][n]*I[n-1]%P;
printf("%d\n",ans);
}

Code3:

Loj Submission

吐槽:实际上套了板子之后已经比loj上的所有人都快了

但是由于新旧评测机的问题~~~,总时间就显得慢了

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)

enum{N=2010};
int n,k,P;
using u32=uint32_t;
using i32=int32_t;
using u64=uint64_t;
using i64=int64_t;

static u32 m,m2,inv,r2;
u32 getinv(){
u32 inv=m;
for(int i=0;i<4;++i) inv*=2-inv*m;
return inv;
}
struct Mont{
private :
u32 x;
public :
static u32 reduce(u64 x){
u32 y=(x+u64(u32(x)*inv)*m)>>32;
return i32(y)<0?y+m:y;
}
Mont(){ ; }
Mont(i32 x):x(reduce(u64(x)*r2)) { }
Mont& operator += (const Mont &rhs) { return x+=rhs.x-m2,i32(x)<0&&(x+=m2),*this; }
Mont& operator -= (const Mont &rhs) { return x-=rhs.x,i32(x)<0&&(x+=m2),*this; }
Mont& operator *= (const Mont &rhs) { return x=reduce(u64(x)*rhs.x),*this; }
friend Mont operator + (Mont x,const Mont &y) { return x+=y; }
friend Mont operator - (Mont x,const Mont &y) { return x-=y; }
friend Mont operator * (Mont x,const Mont &y) { return x*=y; }
i32 get(){
u32 res=reduce(x);
return res>=m?res-m:res;
}
} H[N],F[N][N],T[N],C[N],I[N],J[N],Inv[N],IK[N],JK[N];
Mont qpow(Mont x,ll k=P-2) {
Mont res(1);
for(;k;k>>=1,x*=x) if(k&1) res*=x;
return res;
}
void Init(int m) {
::m=m,m2=m*2;
inv=-getinv();
r2=-u64(m)%m;
}

void Ln(Mont *a,int n){
static Mont b[N];
rep(i,0,n) b[i]=a[i];
rep(i,0,n-1) {
Mont s=b[i+1]*(i+1);
rep(j,0,i-1) s-=a[j]*b[i-j];
a[i]=s;
}
drep(i,n,1) a[i]=a[i-1]*Inv[i];
a[0]=0;
}

int main(){
scanf("%d%d%d",&n,&k,&P),Init(P);
Inv[0]=Inv[1]=1;
rep(i,2,n) Inv[i]=(P-P/i)*Inv[P%i];
I[0]=J[0]=1;
rep(i,1,n) I[i]=I[i-1]*qpow(Inv[i],k),J[i]=J[i-1]*qpow(i,k);

drep(i,n,1) {
int m=n/i;
rep(j,1,m) T[j]=0;
rep(j,0,m) IK[j]=qpow(I[j],i),JK[j]=qpow(J[j],i);
C[0]=H[0]=1;
rep(j,1,m) C[j]=IK[j];
Ln(C,m);
rep(j,1,m) {
F[i][j]=H[j-1]*JK[j-1];
Mont t=1;
rep(x,1,m/j) t=t*IK[j],T[x*j]+=C[x]*F[i*x][j]*t*(x*j);
H[j]=0;
rep(x,1,j) H[j]+=H[j-x]*T[x];
H[j]=H[j]*Inv[j];
}
}
Mont ans=F[1][n]*I[n-1];
printf("%d\n",ans.get());
}