文章目录

      • 1.质数
        • 1.1 质数的定义
        • 1.2 质数的判定
      • 2. 筛质数
        • 2.1 Eratosthenes 筛法
        • 2.2 线性筛法
      • 3. 分解质因数
      • 4.约数
        • 4.1 试除法求约数
        • 4.2 求1~N每个数的约数
      • 5.最大公约数、最小公倍数
        • 5.1更相减损术
        • 5.2欧几里得算法
      • 6. 欧拉函数
        • 6.1 求2~N中每个数的欧拉函数

1.质数

1.1 质数的定义

  • 规定1不是质数也不是合数,n为质数的前提条件为(n >= 2&& n∈N+n∈N+nN+
  • 若n为质数,那么它只有1和它本身两个因子
  • 特殊的,质数中只有一个偶数2,其他都是奇数

其他相关知识

  • 对于一个整数N,[1,N]的质数大约有NlnN{N\over lnN}lnNN个,即每lnNlnNlnN个数中有一个质数

1.2 质数的判定

试除法判定质数

  • 1.暴力做法:
  • 根据质数定义出发,暴力枚举区间[2,n-1]是否有其他因子,时间复杂度为O(n)O(n)O(n),这里不再赘述

  • 2.优化做法:
  • 若一个合数为n,一个因子d∣n,那么一定有nd∣n若一个合数为n,一个因子d|n,那么一定有{n\over d}|nndndnn
  • 因此,我们用只需要枚举最小的那个因子d就可以,d<=nd,d2<=n,d<=nd <= {n\over d},d^2<=n,d<=\sqrt{n}d<=dn,d2<=n,d<=n
  • 枚举区间[2,n][2,\sqrt{n}][2,n],时间复杂度为O(n)O(\sqrt{n})O(n)

代码如下:

bool is_prime(int n){if(n < 2) return false;for(int d = 2; d <= n/d; d ++ ){//如果d能整除n,那么n为合数if(n % d == 0) return false;}return true;
}

其他相关知识

  • 有一些效率更高的随机性算法,例如“Miller-Robbin”等,有较小的概率把合数错误判定为质数,但多次判定合起来的错误趋近于零

2. 筛质数

问题:

给出一个整数N,求1~N之间所有质数

2.1 Eratosthenes 筛法

定义

  • 任意整数x的倍数2x,3x,……都不是质数任意整数x的倍数2x,3x,……都不是质数x2x,3x,
  • 枚举[2,N],从小到大扫描每一个数,设这个数为x,则它的倍数2x,3x,……[N/x]∗x都不是质数,标记为合数(这些合数就没有用了,遇到就跳过),当扫描到一个数x的时候,它前面[2,x−1]都已经扫描过了,如果当前这个数x没有被标记,这个数一定是质数枚举[2,N],从小到大扫描每一个数,设这个数为x,则它的倍数2x,3x,……[N/x]*x都不是质数,标记为合数(这些合数就没有用了,遇到就跳过),当扫描到一个数x的时候,它前面[2,x-1]都已经扫描过了,如果当前这个数x没有被标记,这个数一定是质数[2,N],x2x,3x,......[N/x]xx[2,x1]x
  • 小于x2的x的倍数在扫描更小的数已经被标记过(例如,前面(x−1)能筛掉(x−1)∗x)小于x^2的x的倍数在扫描更小的数已经被标记过(例如,前面(x-1)能筛掉(x-1)*x)x2x(x1)(x1)x
  • 因此减小枚举区间,从x2开始,筛去x2,(x+1)∗x,……,(N/x)∗x因此减小枚举区间,从x^2开始,筛去x^2,(x+1)*x,……,(N/x)*xx2x2,(x+1)x,......,(N/x)x

时间复杂度计算

  • 首先,引入一个概念:调和级数f(n)=1+12+13+14+……+1n,当n趋于∞时,f(n)=ln(n)+γ(γ为欧拉常数)调和级数f(n)=1+{1\over 2}+{1\over 3}+{1\over 4}+……+{1\over n},当n趋于∞时,f(n) = ln(n)+γ(γ为欧拉常数)f(n)=1+21+31+41++n1nf(n)=ln(n)+γγ
  • 素数:n/2+n/3+……+n/n=n(f(n)−1)=n(f(n))−n筛素数:n/2+n/3+……+n/n = n(f(n) – 1) = n(f(n)) – nn/2+n/3++n/n=n(f(n)1)=n(f(n))n
  • 由于,不超过N的质数大约N/lnN个,所以时间复杂度为O(NlogNlogN)≈O(N)由于,不超过N的质数大约N/lnN个,所以时间复杂度为O(NlogNlogN)≈O(N)NN/lnNO(NlogNlogN)O(N)

代码如下:

int primes[N],cnt;//存储质数
bool v[N];//标记合数void get_primes(int n){for(int i = 2; i <= n; i ++ ){if(v[i]) continue;primes[++cnt] = i;for(int j = i; j <= n/i; j ++) v[j * i] = true;}
}

2.2 线性筛法

思想

  • 使每一个合数只会被它最小质因子筛取,时间复杂度为O(n)使每一个合数只会被它最小质因子筛取,时间复杂度为O(n)使O(n)

问题引入:

  • 通过上面埃氏筛法可以看到,时间复杂度接近线性,但是即使在优化后(从x2开始筛),也会重复标记合数通过上面埃氏筛法可以看到,时间复杂度接近线性,但是即使在优化后(从x^2开始筛),也会重复标记合数线使x2

Solution

  • 从小到大枚举已经存储的质数,用一个数组存储每个数的最小质因子从小到大枚举已经存储的质数,用一个数组存储每个数的最小质因子

代码如下:

int primes[N],cnt;//存储质数
int v[N];//存储每个数的最小质因子void get_primes(int n){cnt = 0;for(int i = 2; i <= n; i ++ ){//如果v[i]=0,表示当前数为质数if(!v[i]) v[i] = i,primes[++cnt] = i;//从小到大枚举所有已经存储过的质数,让i乘上这些质数for(int j = 1; j <= cnt; j ++){//如果当前质数大于i的最小质因子或者i*primes[j]>n就终止if(primes[j] > v[i] || primes[j] > n/i) break;//i*primes[j]的最小质因子就是primes[j]v[i*primes[j]] = primes[j];}}
}

3. 分解质因数

算数基本定理

  • 任何一个大于1的正整数都能唯一分解为有限个质数的乘积,可写作:N=p1c1p2c2p3c3……pkck,其中p1<p2<p3<…<pk,ci均为正整数任何一个大于1的正整数都能唯一分解为有限个质数的乘积,可写作:N =p_1^{c_1}p_2^{c_2}p_3^{c_3}……p_k^{c_k},其中p_1<p_2<p_3<…<p_k,c_i均为正整数1N=p1c1p2c2p3c3pkckp1<p2<p3<...<pk,ci
  • 同样依据上面的试除法,枚举区间[2,n],但如果d为n的质因子,同样依据上面的试除法,枚举区间[2,\sqrt{n}],但如果d为n的质因子,[2,n]dnnd也属于n的质因子,这个区间就不够,而这种情况只会出现一次。{n\over d}也属于n的质因子,这个区间就不够,而这种情况只会出现一次。dnn因此,需要特判一下,n是否有这个大于n的质因子因此,需要特判一下,n是否有这个大于\sqrt{n}的质因子nn
  • 反证法:如果出现两次,就会有两个质因子大于n,相乘大于n反证法:如果出现两次,就会有两个质因子大于\sqrt{n},相乘大于nn,n
  • 区间里面枚举的n的因子都是n的质因子,因为n的合数因子也是由这些质因子构成的,区间里面枚举的n的因子都是n的质因子,因为n的合数因子也是由这些质因子构成的,nnn在枚举到合数因子之前它包含的质因子已经筛掉了。在枚举到合数因子之前它包含的质因子已经筛掉了。

代码如下

int primes[N],cnt;//存储质数
int c[N];//存储质因子的次数void divide(int n){cnt = 0;for(int d = 2; d <= n/i; d ++ ){//这个d就是n的质因子if(n % d == 0){primes[++cnt] = d;//筛掉所有的d,并记录d出现的次数while(n%d == 0) n/=d,c[cnt]++;}}//如果n大于1.那么这个数就是唯一一个大于根号n的质因子if(n > 1) {primes[++cnt] = n,c[cnt] = 1}
}

拓展:PoLLard’s Rho算法

一个比试除法效率更高的质因数分解算法,暂不讨论

4.约数

约数的定义

  • 若一个d能整除n,那么称d是n的约数,n是d的倍数,记为d∣n(d∈Z,n∈Z)若一个d能整除n,那么称d是n的约数,n是d的倍数,记为d|n(d∈Z,n∈Z)dndnnddn(dZnZ)

算数基本定理的推论

  • N>1且N∈Z,N的正约数集合为{p1b1p2b2pkbk},其中0<=bi<=ciN>1 且 N∈Z,N的正约数集合为\{p_1^{b_1}p_2^{b_2}p_k^{b_k}\},其中0<=b_i<=c_iN>1NZN{p1b1p2b2pkbk},0<=bi<=ci

一、计算N的正约数个数一、计算N的正约数个数N

  • 根据推论可以得出,N的每一个质因子的次数可以出现0到ci次,那么N的正约数个数为(c1+1)∗(c2+1)∗…∗(ck+1)=∏i=1k(ci+1)根据推论可以得出,N的每一个质因子的次数可以出现0到c_i次,那么N的正约数个数为(c_1+1)*(c_2+1)*…*(c_k+1) = \prod_{i=1}^{k}(c_i+1)N0ciNc1+1(c2+1)...(ck+1)=i=1k(ci+1)

代码如下:

unordered_map<int,int> primes; 
//first:质因子 second:质因子的次数for(int i = 2; i <= n/i; i ++ ){while(n % i == 0){n/=i;primes[i]++;}
}
if(n > 1) primes[n]++;int res = 1;
for(auto prime:primes) {res *= (prime.second + 1);}

二、计算N的所有正约数之和二、计算N的所有正约数之和N

  • 每个正约数都是由质因子组成,所有组合的约数之和可以表示为:(p10+p11+p1c1)∗(p20+p21+p2c2)∗…∗(pk0+pk1+pkck)每个正约数都是由质因子组成,所有组合的约数之和可以表示为:(p_1^{0}+p_1^{1}+p_1^{c_1})*(p_2^{0}+p_2^{1}+p_2^{c_2})*…*(p_k^{0}+p_k^{1}+p_k^{c_k})(p10+p11+p1c1)(p20+p21+p2c2)...(pk0+pk1+pkck)
  • ★这里的公式很特别,用代码写的话,用一个变量t=pi0(一次都没出现的情况),t=(t∗pi+1),可以写循环,时间复杂度O(n)★这里的公式很特别,用代码写的话,用一个变量t = p_i^0(一次都没出现的情况),t = (t *p_i + 1),可以写循环,时间复杂度O(n)t=pi0(),t=(tpi+1)On

代码如下:

unordered_map<int,int> primes; //first:质因子 second:质因子的次数for(int i = 2; i <= n/i; i ++ ){while(n % i == 0){n/=i;primes[i]++;}
}
if(n > 1) primes[n]++;int res = 1;
for(auto prime:primes) {int p = prime.first,c = prime.second;int t = 1;while(c --) t = t * p + 1;res *= t;
}

4.1 试除法求约数

求N的所有正约数

  • 若d为n的约数,那么nd也是n的约数,所以约数总是成对出现,若d为n的约数,那么{n\over d}也是n的约数,所以约数总是成对出现,dndnn求质数一样,只需要枚举最小的约数d,1<=d<=n(注意这里从1开始),如果d=n,我们只需要特判一下,只要一个求质数一样,只需要枚举最小的约数d,1<=d<=\sqrt n(注意这里从1开始),如果d=\sqrt n,我们只需要特判一下,只要一个d,1<=d<=n(1)d=n,
  • 推论:一个整数N的约数个数最多2N个推论:一个整数N的约数个数最多2\sqrt N个N2N

代码如下:

int factor[N],cnt;//存储约数void get_factor(int n){for(int d = 1; d <= n/d; d ++ ){if(n%d == 0){factor[++cnt] = d;//如果d*d!=nif(d != n/d) factor[++cnt] = n/d;}}
}

4.2 求1~N每个数的约数

  • 若使用上面的试除法,时间复杂度为O(NN)太高若使用上面的试除法,时间复杂度为O(N\sqrt N)太高使ONN

  • 这里采用倍数法,一个数的所有约数不好算,那么反过来思考,求1N的每个数d的倍数,d,2d,3d…,[N/d]∗d它们的约数都是d这里采用倍数法,一个数的所有约数不好算,那么反过来思考,求1~N的每个数d的倍数,d,2d,3d…,[N/d]*d它们的约数都是d1 Ndd,2d,3d...,[N/d]dd
  • 时间复杂度为O(N+N/2+N/3+…+N/N)≈O(NlogN)时间复杂度为O(N+N/2+N/3+…+N/N) ≈ O(NlogN)O(N+N/2+N/3+...+N/N)O(NlogN)
  • 1到N每个数的约数个数的总和大约为NlogN个。1到N每个数的约数个数的总和大约为NlogN个。1NNlogN

代码如下

vector<int> factor[N];for(int i = 1; i <= n; i ++ ){for(int j = 1; j <= n/i; j ++ ){factor[i * j].push_back(i);}
}for(int i = 1; i <= n; i ++ ){for(int j = 0; j < factor[i].size(); j ++ ){printf("%d ",factor[i][j]);}puts("");
}

5.最大公约数、最小公倍数

最大公约数的定义

  • 若d∣a,d∣b,则d是a和b的公约数,在所有公约数中取最大那个,称为a和b的最大公约数,记为gcd(a,b)若d|a,d|b,则d是a和b的公约数,在所有公约数中取最大那个,称为a和b的最大公约数,记为gcd(a,b)da,dbdababgcd(a,b)

最小公倍数的定义

  • 若a∣m,b∣m,则m是a和b的公倍数,在所有公倍数中取最小那个,称为a和b的最小公倍数,记为lcm(a,b)若a|m,b|m,则m是a和b的公倍数,在所有公倍数中取最小那个,称为a和b的最小公倍数,记为lcm(a,b)am,bm,mabablcm(a,b)

三个数及以上,同理

公式
一、
∀a,b∈N,lcm(a,b)=a∗bgcd(a,b)\forall a,b\in \mathbb{N}, lcm(a,b) = {a*b\over gcd(a,b)}a,bN,lcm(a,b)=gcd(a,b)ab

  • 证明:设d=gcd(a,b),a0=a/d,b0=b/d,则gcd(a0,b0)=1,根据最小公倍数定义,lcm(a0,b0)=a0∗b0,lcm(a,b)=lcm(a0,b0)∗d=a0∗b0/d设d=gcd(a,b),a_0 = a/d,b_0=b/d,则gcd(a_0,b_0) = 1,根据最小公倍数定义,lcm(a_0,b_0) = a_0*b_0,lcm(a,b) =lcm(a_0,b_0)*d=a_0*b_0/dd=gcd(a,b),a0=a/d,b0=b/d,gcd(a0,b0)=1,lcm(a0,b0)=a0b0,lcm(a,b)=lcm(a0,b0)d=a0b0/d

5.1更相减损术

公式
一、
∀a,b∈N,a>=b,有gcd(a,b)=gcd(b,a−b)=gcd(a,a−b)\forall a,b \in \mathbb{N},a>=b,有gcd(a,b) = gcd(b,a-b)=gcd(a,a-b)a,bN,a>=b,gcd(a,b)=gcd(b,ab)=gcd(a,ab)
二、
∀a,b∈N,有gcd(xa,xb)=x∗gcd(a,b)\forall a,b \in \mathbb{N},有gcd(xa,xb) =x*gcd(a,b)a,bN,gcd(xa,xb)=xgcd(a,b)

证明
a>=b,对于任意公约数d,因为d∣a,d∣b,a=[ad]∗d,b=[bd]∗d,a−b=([ad]−[bd])∗d,所以d∣(a−b).因此,a,b公约数集合与b,a−b公约数集合相同,a,a−b同理a>=b,对于任意公约数d,因为d|a,d|b,a = [{a\over d}]* d,b = [{b\over d}]*d,a-b =([{a\over d}] – [{b\over d}])*d ,所以d|(a-b).因此,a,b公约数集合与b,a-b公约数集合相同,a,a-b同理a>=b,d,da,db,a=[da]d,b=[db]d,ab=([da][db])d,d(ab).a,bb,aba,ab

5.2欧几里得算法

公式
∀a,b∈N,b≠0,gcd(a,b)=gcd(b,amodb)\forall a,b \in \mathbb{N},b\neq 0,gcd(a,b) = gcd(b,a\mod b)a,bN,b=0,gcd(a,b)=gcd(b,amodb)

证明
这里需要分类讨论a和b的大小情况这里需要分类讨论a和b的大小情况ab

  • 若a<b,那么amodb=a,gcd(b,amodb)=gcd(b,a)=gcd(a,b)若a<b,那么a\mod b = a,gcd(b,a\mod b) = gcd(b,a) = gcd(a,b)a<b,amodb=a,gcd(b,amodb)=gcd(b,a)=gcd(a,b)
  • 若a>=b,这上面更相减损术已经讨论过了,gcd(a,b)=gcd(b,a−b),因为a−b=amodb,gcd(a,b)=gcd(b,amodb)若a>=b,这上面更相减损术已经讨论过了,gcd(a,b) = gcd(b,a-b),因为a-b=a\mod b,gcd(a,b) = gcd(b,a\mod b)a>=b,gcd(a,b)=gcd(b,ab),ab=amodb,gcd(a,b)=gcd(b,amodb)

关于两种求最大公约数的方法

  • 首先,我们清除的知道,求出gcd也就能算出lcm首先,我们清除的知道,求出gcd也就能算出lcmgcdlcm
  • 一般情况下,使用欧几里得算法,时间复杂度为O(log(a+b)),若遇到高精度就用更相减损术(暂时没用过)一般情况下,使用欧几里得算法,时间复杂度为O(log(a+b)),若遇到高精度就用更相减损术(暂时没用过)使O(log(a+b))

欧几里得算法实现

int gcd(int a,int b){//当b=0时,gcd(a,0)=aif(!b){return a;}else{return gcd(b,a%b);}
}

6. 欧拉函数

前置知识:互质
∀a,b∈N,若gcd(a,b)=1,则称为a和b互质,对于三个及以上个数,gcd(a,b,c)=1叫做a、b和c互质,gcd(a,b)=gcd(b,c)=gcd(a,c)叫a,b,c两两互质。\forall a,b \in \mathbb{N},若gcd(a,b) = 1,则称为a和b互质,对于三个及以上个数,gcd(a,b,c) = 1叫做a、b和c互质,gcd(a,b) = gcd(b,c) = gcd(a,c) 叫a,b,c两两互质。a,bN,gcd(a,b)=1,abgcd(a,b,c)=1abcgcd(a,b)=gcd(b,c)=gcd(a,c)a,b,c

欧拉函数的定义
1~N中与N互质数的个数叫欧拉函数,记为ϕ(N)1~N中与N互质数的个数叫欧拉函数,记为\phi (N)1NNϕ(N)

公式:
依据算术基本定理,若N=p1c1p2c2…pkck,则依据算术基本定理,若N=p_1^{c_1}p_2^{c_2}…p_k^{c_k},则N=p1c1p2c2...pkck
ϕ(N)=N∗p1−1p1∗p2−1p2∗…∗pk−1pk=N∗∏质数p∣N(1−1p)\phi(N) = N * {p_1-1 \over {p_1}} * {p_2-1 \over {p_2}} *…*{p_k-1 \over {p_k}} = N *\prod_{质数p|N}(1 – {1\over p})ϕ(N)=Np1p11p2p21...pkpk1=NpN(1p1)

证明:
用到了容斥原理,参考《算法进阶指南》上的证明,设p、q是N的质因子,1到N中p的倍数有[N/p]个,用到了容斥原理,参考《算法进阶指南》上的证明,设p、q是N的质因子,1到N中p的倍数有[N/p]个,pqN1Np[N/p]
同理,q的倍数有[N/q]个,剩下的有N−[N/p]−[N/q]个,但是这里把p和q的倍数减去两次(p的倍数一次,q的倍数一次),需要加上那么结果为N−Np−Nq+Npq=N∗(1−1p)∗(1−1q),同理得出全部与N互质的个数。同理,q的倍数有[N/q]个,剩下的有N-[N/p]-[N/q]个,但是这里把p和q的倍数减去两次(p的倍数一次,q的倍数一次),需要加上那么结果为N-{N\over p}-{N\over q} + {N\over pq} = N*(1-{1\over p})*(1-{1\over q}),同理得出全部与N互质的个数。q[N/q]N[N/p][N/q]pqpqNpNqN+pqN=N(1p1)(1q1),N

代码如下:

int phi(int n){int ans = n;for(int i = 2; i <= n/i; i ++ ){if(n % i == 0){ans = ans/i*(i - 1);while(n % i == 0) n/=i;}}if(n > 1) ans = ans/n*(n - 1);return ans;
}

6.1 求2~N中每个数的欧拉函数

  • 根据欧拉函数的公式,我们可以先求出所有质数,前面有两种:埃氏筛法、线性筛法根据欧拉函数的公式,我们可以先求出所有质数,前面有两种:埃氏筛法、线性筛法线
  • 显然,质数p的欧拉函数:p−1,合数欧拉函数就先找到它的质因子,依次得出显然,质数p的欧拉函数:p-1,合数欧拉函数就先找到它的质因子,依次得出pp1

埃氏筛法求欧拉函数

int primes[N],cnt;//存储质数
int phi[N];//phi[i]:表示i的欧拉函数void euler(int n){//1的欧拉函数是1phi[1] = 1;for(int i = 2; i <= n; i ++ ) phi[i] = i;for(int i = 2; i <= n; i ++ ){//i是质数if(phi[i] == i){//对于j,多个i质因子for(int j = i; j <= n; j += i){phi[j] = phi[j]/i*(i - 1);}}}
}

线性筛法求欧拉函数
若imodpj==0,ϕ(i∗pj)=ϕ(i)∗pj若i\mod pj == 0,\phi(i*pj) = \phi(i)*pjimodpj==0,ϕ(ipj)=ϕ(i)pj
否则,ϕ(i∗pj)=ϕ(i)∗pj∗(1−1pj)=ϕ(i)∗(pj−1)否则,\phi(i*pj) = \phi(i)*pj*(1-{1\over pj}) = \phi(i)*(pj – 1)ϕ(ipj)=ϕ(i)pj(1pj1)=ϕ(i)(pj1)

int primes[N],cnt;//存储质数
int st[N];//st[i]:i的最小质因子
int phi[N];//phi[i]:表示i的欧拉函数void euler(int n){for(int i = 2; i <= n; i ++ ){if(!st[i]) st[i] = i,primes[++cnt] = i,phi[i] = i - 1;for(int j = 1; j <= cnt; j ++ ){if(primes[j] > st[i] || primes[j] > n/i) break;//i*primes[j]的最小质因子primes[j]st[i*primes[j]] = primes[j];//如果primes[j]是i的最小质因子,说明i*primes[j]已经有这个质因子if(i % primes[j] == 0){phi[i*primes[j]] = phi[i] * primes[j];}else{//primes[j]是新成员phi[i*primes[j]] = phi[i] * (primes[j] - 1);}}}
}

后记:以上笔记是本人参考《算法进阶指南》书籍以及之前所学总结而得,如果知识不完善或者有误,请各位指点。如果对您有帮助,点赞,关注共同进步