我其实现在强烈的怀疑部分深度学习研究学者就是计算机民科。包括宣称要实现自动驾驶的某些公司。还有就是一些打着智能制造的机器人公司。
尽管很多国内外业内专家都明明白白的告诉大家。5级自动驾驶二十年之内无法实现。人机协作无法适用于很多柔性环境。但是不介意这些人继续用什么人工智能,2025忽悠国家投资。
在北师大读书的时候,在实验室接待过2位计算机民科。CS并不是师大的传统强势专业,本人见识有限,而世界又很大,所以综合来看,全国的计算机民科数量应该不容小觑。
================
很意外的是,这两个人的个人特质和研究方向却有某种一致性,下面来具体讲讲。
第一位大概六七十岁,带着一本厚厚的文件来到实验室,希望我们能给他开发一个程序。这一本文件是他自己发明的一个“汉字编码方案”。类似于汉语词典的“偏旁部首检字表”,有很多个分区,每个分区里有一些汉字。他声称这个分区是根据某些中国传统典籍总结归纳出来的,汉语拼音使用拉丁字母表示汉字,是西方文化对中国文化的入侵。而他发明的这个方案,脱胎于中国古代经典,有利于传播中华传统文化。
他还声称这个方案可以表示出汉语拼音以及任何汉字输入法都无法输入的汉字。可是他的那份文稿是电脑打印的,我就问他既然无法输入,那这些打印的汉字是如何到电脑里,才打印出来的呢?他似乎无法听懂我的问题。
我想他也许是在学习使用拼音输入汉字的时候遇到了麻烦,他强烈地抨击了使用拼音输入汉字的不合理性,并声称只有年轻人才学得会用拼音打字。他坚定地认为,在北师大,那些跟他同龄的教授专家,也无法熟练地使用拼音打字。我对他的这种想法感到惊讶。虽然没有调查,但我还是相信师大的教授们应该还没水到那个程度,就算不写论文了,用拼音发个短信聊个QQ应该不至于有障碍。
我花费了很多口舌试图让他清晰地定义自己想要干什么。他想做的是输入法吗?那他应该定义电脑键盘上的按键和汉字的对应关系,就像五笔字型那样。他想做的是汉字编码吗?那他应该定义二进制与汉字之间的对应关系,就像GB2312或者Unicode那样。而这些他都没有,他只是根据某种规律对汉字进行了分类,我无法理解这个东西有什么用,也无法让他明白他应该做的是什么。无奈下我只能终止了与他的沟通,他在抨击了中国大学生视野狭窄、不懂创新等等之后离开了实验室。
================
这第二位也是六七十岁,带来的东西也是汉字输入法。也许学习拼音输入法真的伤害了这个年龄的一些人……
相比于第一位奇幻型的“中国传统文化”民科,这第二位则务实得多。他来的时候真的开发出了一个可以工作的输入法。在Windows系统中,有一个叫做“输入法生成器”(imegen.exe)的系统自带工具。在这个工具中,给出键盘字母和汉字的对应关系,即可产生一个自制的输入法。这个工具大概在Windows 95时代就有,直到Windows XP。我大概在很小的时候(小学?)就见过它,但从来没有使用过。在我问他是如何开发这个输入法时,他提到了这个工具,所以我很快明白了他干了什么,打算解决什么问题。有了上次的经历,这位老先生让我感觉靠谱很多,我决定仔细听他介绍他的这个输入法有何高明之处。
他的输入法在本质上是一个双拼输入法。他主要解决的问题是拼音输入法的重码问题。他对双拼的改进是,让韵母带上声调。规定某个按键为某韵母的一声,往右的三个键是这个韵母的二三四声,有了声调之后会一定程度上降低重码。其实设计这样一个方案应该也不算容易,这么多韵母又带上声调,大概会很容易互相冲突。他应该也是费了一些功夫减少这种冲突。而且双拼都会面临零声母、零韵母等一些问题,他应该也都需要进行处理。他似乎在组词的情况下设计了更多降低重码的方案,但时间久远我有些记不清了。
遗憾的是,他的这个输入法试图解决的问题在今天的意义已经不是很大了。现代的输入法利用现代计算机更强大的计算能力,可以在本地包含更大的词库和更精确的模型。而基于互联网,更是可以实现海量的云端词库和热词实时更新,甚至还有上下文联想等功能。在日常输入中,需要我们停下来选字、解决重码的情况已经比较少见了。在当前的背景下,提高打字速度的更好方法其实是降低按键次数。例如搜狗输入法,只要输入“bjsf”即可在候选字中得到“北京师范大学”、“北京师范大学珠海分校”等选项。bjsf3这5次按键,即可完成“北京师范大学珠海分校”10个字的输入。这完全依赖于庞大的词库,而不是“bjsf”这四个字重码少。(想自己尝试一下的朋友请使用最新版本的搜狗输入法在Windows或Mac操作系统的电脑上尝试,手机不行,别问了【捂脸】)
我提出这个观点后,他似乎还不太相信,于是我在我的笔记本电脑上向他演示了现代输入法的词库。他要求我输入“我家住在伍佑镇”,我直接全拼整句输入,按空格上屏,就得到了准确的结果。他非常惊讶于我的电脑为何知道“伍佑镇”这个地名。我又向他演示了“今晚去巴依老爷吃新疆菜”、“头疼吃对乙酰氨基酚片”等比较生僻和拗口的词组,利用云候选都可以自动排在候选词的第一名。他似乎也意识到了现代输入法的先进程度,放弃了对他的输入法先进性的坚持。后来我祝他好运并礼貌送走了他。
评论里说这个人不能算民科,因为他至少拿来了能用的东西。但我想他至少还是具备了一些民科的特质。首先,他能带着作品来到大学,显然是认为这个作品具备了科研成果的独创性和先进性。他跟我的开场白大概是“20年前xx国家领导人号召我们xxx,20年过去了,我完成了这个成果”。从我跟他的交流中,也可以感受到他起初对这个作品的定义就是一个二十年磨一剑的“重大创新”,对他自己所做的事情就是“推动科技发展”,我想在他心中的自己,大概算得上科研人员。而他没有对市场上现有的产品有所了解,也不具备检索科研文献的能力。他来时蓬头垢面,身上散发着难闻的味道,衣服应该也是很久没洗过了。想必是沉迷于他的“科研”,以至于影响了他的正常生活。其实民科在我这里算不上什么特别贬义的词,也没有冒犯意。如果有网友觉得不妥,那我就姑且称他是一位落伍的爱好者吧。
这就是我的经历。
话说回来,要宣称解决了问题,就需要先发现问题。发现的问题至少应该是真实存在的。哥德巴赫猜想是真实存在的,光速无法被超越是真实存在的,拼音输入汉字对老年朋友不友好这个问题也是真实存在的。推翻冯诺依曼架构大概不算是个问题,现代处理器也有很多采用了哈佛架构,技术选择不同,并没有推翻一说。
现代互联网产品都在极尽所能优化用户体验,没有计算机科学素养的民科大概也被这些友好的软件们惯坏了,发现不了问题大概就不会有民科了吧~
这个问题其实最主要的原因是中国在基础教育阶段没有普及计算机教育。民科的源头就在于在基础教育阶段学了点皮毛开始自我膨胀,又没有合适的高等教育来给他们泼凉水。然而绝大部分国人在基础教育阶段只学过数学物理,没学过计算机。
怎么就没民科了?上个被挂城墙的就是被一巴掌扇去github比赛写tokenizer了啊?
验证成本太低的东西都不适合民科存活。起码来点高端的,像我这种真民科就有一个设想,当堆积在我家后院的美金达到一千万亿的时候,这些美金将会产生智能。
不信?不信你倒是试试啊,小规模的说不定也有效,无效那就是你心不诚
有的,比如这位。
中国人发明的一种独特有趣的新排序法 — 张仰彪第二排序法
去年,我曾经在CSDN的论坛里发表了我写的第一种排序法:“张仰彪排序法”,没想到就像捅了马蜂窝,在论坛里引起一场渲染大波,赞同的几乎没有,扔板砖的倒是不少,至今够盖一座楼的了。各色人等纷纷粉墨登场,说啥的都有,归纳起来就是一句话:“不许革命!”
平心而论,倒也不能把这些唱反调的人统统与赵举人之流划为一类,因为他们说的也有一定道理,用两个数组排序确实是一个缺点,尽管瑕不掩瑜,但人家就是揪住这一点不放,唯一让他们改变观点的办法就是拿出更好的东西来。
皇天不负有心人,经过近一年的潜心研究,我还真的写出了一种新的排序法,这次是用一个数组排序,其原理和算法过程非常独特有趣,而且我在网上搜索到了很多排序算法,与我的新排序算法都截然不同,甚至不用仔细看代码,搭眼一看它们的运行例图就可以知道它们之间差距很大。因为我的新排序法在排序时几乎始终守着数据队列的头部,就像我们中国的舞龙,始终抓着龙头就把整条龙排好了,仅这一点就与其他任何一种排序法不同。
我原来写的那个“张仰彪排序法”确实有点逗乐的成分在里边,一方面活跃一下气氛、和大家认识一下,另一方面可以起到抛砖引玉的作用,为我现在写的这款新的排序法做个铺垫。
至于此新的排序法究竟如何,请看下文,各位看官您见仁见义,欢迎发表高见,无论鲜花还是板砖,在下随时恭候,统统笑纳。而且保证物尽其用:鲜花送美,板砖盖房。
张仰彪第二排序法
张仰彪第二排序法的原理与目前非常流行的反恐类网络游戏有些类似,它将待排序数组内放错位置的数据视为隐藏在节日游行队列里故意站错位置的恐怖分子,并自动地将这些恐怖分子按照它们相互之间的内在关系而分成几个不同的小组。排序时反恐队员首先从游行队列的最前头开始清查,若遇到的人是好人,就快速通过去查下一个。如果查到一个站错位置的恐怖分子,就停下来在这个位置上连续地排查运作,直到将这个恐怖分子及其所在小组的全部成员都清理到正确的位置上,然后才继续前行去查下一个位置。直到清查的次数比队列的长度小1时,尽管此时反恐队员可能仅沿着游行队列前行了很短的一段距离,还处在队列的头部,但队列中所有站错位置的恐怖分子都已被清理到了正确的位置上,排序完毕。
下面给出张仰彪第二排序法的C语言代码:
……(代码略,有兴趣可以看CSDN原版)
可以看出,此排序法的空间效率和时间效率都与冒泡排序法相当,而且此排序法也具有一定的智能。对于排列非常混乱的数组,此排序法要进行很多数据比较和数据交换,比较费时。但当待排序数组基本有序时,此排序法只进行数据比较,而数据交换操作则很少,时间效率将大幅提高。
同时,此排序法的原理非常独特有趣,并且富含中国古老文化的精髓和神韵。在排序时它几乎很少沿着待排序数组的数据队列前行,而是守着数据队列的头部,犹如姜太公稳坐钓鱼台,将队列里站错位置的乱臣贼子逐个擒过来、推出去,吐故纳新、收放自如,象极太极推手,又象中国的舞龙,不经意间,一列混乱的数据已成清一色一条龙。而且此排序法在运作时,可以将数组里所有放错位置的数据自动分组,一次清理完一组才继续前行,又恰似西游记里的三藏师徒,刚踏上西行路就遇到老妖怪,于是师徒几人便停下来降妖捉魔,直到将这老妖怪及其洞中所有的小妖全部剿灭,才继续西行,而没走几步,又遇到一股妖魔鬼怪,于是又停下来与妖怪大战一番......
可见,在排序原理上张仰彪第二排序法极为独特,与现有的任何一种排序法都不相似,它应当是一种全新而有效的排序法,信不信由你。
至于为什么此排序法具有将数组里放错位置的数据自动分组、按组排序的功能,老纳作了如下分析:
首先,在任何一个待排序数组里,所有放错位置的数据都可以按照它们之间的内在关系而被分成很多小组,小组有大有小,但任何一个小组都不能再被分成更小的组。
例如:有100个人按年龄(有同龄的)顺序坐成一排照相,若其中只有两个人发现自己坐错了位置,这两个人必然相互坐到了对方的位子上,只要两人对调即可,与别人无关。如果只有三个人甲、乙、丙发现自己坐错了位子,那么这三个人必然是相互轮错,例如甲坐到了乙的位子上,乙坐到了丙的位子上,丙坐到了甲的位子上,此三个人构成了一个错位三角,也可以说构成了一个错位环。如果有四个以上的人发现自己坐错了位置,情况就变得比较复杂,此时所有坐错位置的人将被分成一个个小组,每个小组里的人都是相互间轮流坐错了位子,与组外的人无关,整个小组构成一个封闭的错位环,此环不可再分,这个错位环就是前边所说的某些错位数据之间的内在关系,也是将数组内所有错位数据分组处理的唯一依据。
既然待排序数组内的错位数据具有可以分组的特点,那么本排序法在排序时每遇到一个错位数据其实就是遇到了一组错位数据。所以将一个数据放到正确的位置上后交换过来的一定仍是一个错位数据,于是再将它放到正确的位置上,而交换过来的可能又是一个错位数据,只有将这一组错位数据全部清理到正确的位置上,排序位置才继续前移,直到又遇到另一组错位数据 ......。而此过程中无论怎样交换数据都不会移动原本就在正确位置上的数据,也不会移动刚刚排好位置的数据,这一点至关重要。
而整个排序过程中排序位置究竟可以从数组头部前移多远,取决于待排序数组里原来有几个没有错位的数据。
----------------------------------------------------------------------------------------
这就是张仰彪第二排序法,爱咋咋地。
编自己的程,下自己的蛋,让别人说去吧。
< 完 >
因为计算机领域的民科已经融入到我们生活了,以至于在你眼皮底下却发现不了。他们就是天天借着大数据,云计算,人工智能指点江山,吸引关注度的媒体。他们什么都懂,但又什么都不懂。
(本人并不是否认以上技术,并期望以后能从事相关工作)
———————更新———————
从今天开始加上区块链
---------------更新---------------------
相反,计算机科学是一个民科远远多于官科的学科。
民科混的好的办了大企业,如比尔盖茨,g胖等,或者建立了去中心化经济系统,如中本聪,李笑来等,
民科混的差的也当了黑客,靠勒索病毒横行互联网,
官科如Linus,方滨兴等也创造了很好的作品,但数量和质量都远远不及民科。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有