百科问答小站 logo
百科问答小站 font logo



如何判断这两份代码的时间复杂度? 第1页

  

user avatar    网友的相关建议: 
      

老年人,越来越口胡了。应该是n^(ln4/ln10) / n × n^1.5 ~ n^1.1。

比线性复杂度高,但是这是个很松的界, 0.1 阶在 n<10^10 时也显然小于 logn。

—————— 下面是原口胡

上面调和级数近似是 nlogn,下面因为纯素数每位只有4/10的概率,sqrtn 判断的前缀和阶是 1.5,ln4/ln10x1.5<1,复杂度不高于线性。


user avatar   s.invalid 网友的相关建议: 
      

因为写程序是要动脑子的。


这个题目的要求是“找出所有纯质数”;而纯质数本身是非常特殊的。


第一种做法事实上完全没有利用“纯质数”这个知识点,而是去硬算,硬检查每个数字是否质数。

那么,这个复杂度就是O(N)水平,其中N等于20210605.

而每次检查的代价则是O(M),M是小于当前数字n的平方根的所有质数个数——我不清楚质数分布状况究竟如何,但根据下面的数据,可以认为素数数量和自然数数量近乎成正比,也就是O(M)->O(M/K)。在算法理论上,这等于说算法复杂度仍然是O(n)。

换句话说,你的确可以通过一定的优化降低素性检验的消耗,但从算法理论上说,并不能改变复杂度级别。

素数分布_百度百科 (baidu.com)

下表是大约107亿以内的个位为3的素数分布情况,可以看到自然数增加一倍,素数个数增加也越来越接近一倍。当自然数趋向无穷时,其应与自然数增长比率相同。

当然,你可以在这个基础上做一点小小的优化,比如跳过所有的偶数、5结尾的数字等;但每次检查的复杂度最好也就是O(M/100)这个级别了。


而第二种做法就要聪明的多:我们可以先筛选“疑似纯素数”;那么,什么是“疑似纯素数”呢?

说白了,“疑似纯素数”实际上就是小于20210605的四进制数;这个四进制数字允许使用的4个数字符号是2、3、5、7;而且,2和5结尾的数字还可以直接剔除。

仅仅8位四进制数字(还只能2开头),再加上禁止2、5结尾,那么这实际上仅仅相当于7位四进制数字,也就是4的7次方。

相比8位十进制数字(10的8次方),待搜索空间是不是一下子缩小了很多?

换句话说,过去,检查所有小于20210605的整数是否素数,待检验的数字总量大约是10^8,大于2^24;现在这么先筛一下呢?待检验数字总量降低到了4^8,等于2^16——这显然是一个极大的优化。

当然,这样一来,素性检验就没有办法优化了,因为我们并没有找出“小于当前数字n的所有素数”;但前面提到过,这个优化并不能明显降低算法复杂度(算法理论上甚至认为相同的)。

尤其是,我们可以准备一个小于20210605的平方根的数组,预先把2、3、5、7、11等素数的倍数剔除;然后使用数组中的数字做素性检验。那么,最终,哪怕单次判断的消耗也不会比筛法高多少。

事实上,针对题目条件,你真把小于20210605的平方根的所有素数剔除,反而可能是得不偿失的。因为较大素数的重复使用率可能并没有想象的高——你可以把程序写出来,统计下每个数字的使用率,然后计算一下筛掉那些靠后的数字的消耗,得不偿失的就放弃吧:这个应该也能算,但我是懒虫……


换句话说,素性检验双方基本打平(第一种做法小胜,但不足以改变战略格局);但后一种做法直接筛掉了绝大多数“不可能是纯素数的候选数字”,这个做法是足以改变战略格局的——那么,后者大胜自然就不奇怪了。


所以说这™还是得喂到嘴里是吧?

喏,8位十进制数字时,尾数为3的素数数量低两个数量级。也就是计算消耗可以除以100(实际不足100)——注意这里仅仅统计了尾数为3的素数,尾数为7、9的都被忽略了。也就是真实消耗还得继续倍增;且越到后期,数值范围加倍后,素数增加越趋向于加倍,也就是素数会更多。

而2^24比之2^16,小了2^8,也就是计算消耗除以255(实际大于255);且随着n的增长,符合要求的数字会更少——因为随着10进制数字位数N的增长,前者需要考察的数字量是O(10^N),后者需要考察的数字量仅有O(4^N)。


尤其注意,前者优化的是“每次素性检验”的消耗,而后者优化的是“需要做素性检验的数字”;因此我在上文中用N和M做了个区分,也就是提到N时就是在讨论“需要考察的数字量”,而提到M时就是在讨论“一次素性检验的消耗”——你当然可以把它们都写成N,但两者是不能随随便便乘起来的,含义都不一样。




  

相关话题

  哪本《数据结构与算法》最好? 
  矩阵链相乘的时间复杂度为什么末尾是dn呢,是那么算的呢? 
  为什么 Google 翻译只重算法不重语言学的语法结构和规则? 
  算法导论求有向图强连通分量:按拓扑排序,求反向图的DFS。若改成按拓扑排序倒序,用原图做DFS,错在哪? 
  你遇见过什么当时很有潜力但是最终没有流行的深度学习算法? 
  如何利用群论的知识解决三阶魔方? 
  有没有必要把机器学习算法自己实现一遍? 
  很多高效排序算法的代价是 nlogn,难道这是排序算法的极限了吗? 
  非CS背景,如何快速上手机器学习? 
  很多高效排序算法的代价是 nlogn,难道这是排序算法的极限了吗? 

前一个讨论
怎样避免活在信息茧房之中?
下一个讨论
俄罗斯在乌克兰的拉胯表现是不是苦肉计?





© 2024-11-05 - tinynew.org. All Rights Reserved.
© 2024-11-05 - tinynew.org. 保留所有权利