之前做全面战争mod时我就发现,真正要查有用的资源时,俄文网站内容远比中文网站丰富。无论是关于修改教程、历史讨论、资料搜集还是各方面的电子书,都是如此。前段时间写东南亚相关的回答,查资料时也发现,维基上一些东南亚历史的相关词条,内容最丰富的却是俄文版词条。
想象一下,一个中国mod制作者,竟然要去俄国网站上搜辽、金、蒙古铠甲兵器的资料……
我们来看看统计数据——
https:// w3techs.com/technologie s/history_overview/content_language/ms/y
题目中的数据来自W3Techs,2021年12月24日,最新一期的排名如上图所示。可以看到,在最近的排名中,中文网页的占比甚至被越南文超越了,而俄文则维持了第2的位置。
W3Techs的统计是根据Alexa前1000万或Tranco前100万的站点得出的,去掉了仅有默认页面的站点、重定向的域以及大网站下面的子域名。从2011年至今,每年统计数据如图所示——
可以看到,在2011年时,德文网站的占比排名第2、日文第3、中文第4、俄文第5。从2011年开始,俄文网站的占比逐年提升,并在今年1月达到顶峰,中文和德文网站的数量则逐年递减。至于土耳其文、波斯文和越南文的网站占比,主要是在2015年之后迅速提升的。观察中文网站的占比,可以发现,其占比是在2013到2016年间迅速下降的,这段时间发生了什么,有经验的都知道。
https:// en.wikipedia.org/wiki/L ist_of_Wikipedias
全世界最大的在线百科维基,在许多国家都是浏览量前10的网站。维基百科上有关于各种语言百科词条的统计,按总页面数量统计,排名最多的是英文(没有任何疑问),接下来分别是越南文、法文、宿务文、阿拉伯文、西班牙文、德文、意大利文、中文、俄文(总页面数量包括词条、讨论、分类、重定向等各种页面)。
按照词条数量统计,排名前10分别为:英文、宿务文、瑞典文、德文、法文、荷兰文、俄文、西班牙文、意大利文、波兰文。
*.维基上的宿务文、瑞典文、Winaray词条大多是由瑞典人Sverker Johansson创建的Lsjbot自动编制的,所以数量有些虚高,去掉后,前10可以加上埃及阿拉伯文和日文。
按浏览量统计,排名前10分别为:英文、日文、西班牙文、德文、俄文、法文、意大利文、中文、葡萄牙文、波兰文。
按照编辑次数统计,排名前10分别为:英文、德文、法文、西班牙文、意大利文、俄文、日文、中文、越南文、波兰文。
按照编辑者数量统计,排名前10分别为:英文、西班牙文、法文、德文、中文、俄文、葡萄牙文、意大利文、阿拉伯文、日文。
按照活跃编辑者数量统计,排名前10分别为:英文、法文、德文、西班牙文、日文、俄文、葡萄牙文、中文、意大利文、阿拉伯文。
按照上传图片数量统计,排名前10分别为:英文、俄文、意大利文、德文、罗马尼亚文、乌克兰文、波斯文、希伯来文、芬兰文、法文。
按照维基百科的统计数据,俄文的维基社区,活跃度至少排在前6,而且俄国用户可能更专注于条目的完整和丰富,因此上传图片的数量高居第2。维基上波斯文、土耳其文、越南文社区也比较活跃,这些语种的网站,在前100万网站中占比也不低。
除了维基以外,俄文互联网上还有许多别的百科网站——
俄罗斯大百科全书的网络版。
一个基于纸质百科,根据学科分类整理词条的线上百科。
网站基于Cyril and Methodius的各种百科全书创建,用户也可以自建词条。
这两个都是整合了数十上百本传统纸质百科的聚合型网络百科。
关于百科全书的“百科全书”。
在互联网出现之前,纸质书是人们主要的知识载体。根据维基上面的统计,目前,俄罗斯每年出版的图书数量约为11.5万种,排名世界第5。虽然每年出版的中文书数量高居世界第2,但根据国家新闻出版总署的数据,2016年后,我国每年新出版图书呈现出逐年下降的趋势,这两年限制书号,情况也不乐观。
综合上面的数据,可以看到,在当今世界的知识生产方面,俄文还是非常有影响力的。虽然比不过英文,但基本和法文、德文、西班牙文、中文、日文在一个档次。考虑到日文、德文使用区域有限,法文和西班牙文占据优势的西非和拉美地区,教育基础、计算机技术、互联网发展水平可能不如俄罗斯和前苏联地区,那么俄语网站能有这么高的占比,还是可以理解的。
另外,如果你有搜索国外论文、电子书和各种版权资源的体验,应该也能感受到俄文区大佬的互联网共享精神。
比如说,著名的免费学术论文下载网站Sci-Hub,它的创始人来自前苏联加盟共和国哈萨克斯坦。
再比如,我平时下载国外电子书用的创世纪图书馆(Libgen),也是俄国人做的,其历史可以追溯至苏联时期的самиздат文化。
所以俄文区的人们,是真的乐于输出,且乐于分享啊。我们现在之所以能有那么多免费共享的高质量资源,ta们功不可没。
但问题是,为什么中文网站的占比,在整个世界上显得如此之低?
要知道,这可是一个有14亿人口,十多亿网民的国家,经济总量可以匹敌世界任何一个大洲,基础教育和高等教育水平不低,历史悠久,文化多元,互联网产业蓬勃发展……从任何一个角度看,中文互联网的比重都不该如此之低。
很多答案都提到了移动互联网的因素。的确,各大厂商跑马圈地,筑建护城河,发展出一系列大而全,却禁止搜索引擎抓取内容的内部生态。将人们的注意力吸引到自家手机APP而不是网页,确实大大挤占了传统网站的空间。
但这并不是全部原因。
记得在我读初中时(那是十几年前的事了)对古生物感兴趣,当年有更新及时,分类清晰的恐龙网,对天文感兴趣,有牧夫天文论坛等各种天文网站。
读大学时,想要讨论全面战争,找mod教程,有黄龙骑士团;要找文明系列资源,有塞爱维论坛;关注世界局势和军备动向,有超级大本营等等军事论坛。
那时百度的贴吧还很热闹,刷贴吧不用登录手机,没那么多xx词,更没有那么多广告贴,是真的有内容且活跃的讨论空间。
那时中国的互联网虽然没有现在那么普及,但各种小众话题都有自己的讨论空间。
到后来,就是各种回帖可见、用网站积分购买……
之后,是网站自带下载器,扫码关注公众号,回复提供解压码……
接着,是您所打开的资源已被删除,网站论坛无人问津……
最后,是各大平台争相抢占流量,首页无数美女教穿搭分享生活,熟悉的网站接二连三因备案、规则改变或难以运营而陆续关闭或限制讨论……
互联网是最能打破阶层、地域、时间界限的工具之一。闭塞之地的人们能借助网络看到外面的世界;身无分文的人们能通过网络找到赚钱的机会,一无所知的人们能通过网络找到各个领域的学习资源。
但是如今,我们的互联网发展了,流量增加了,但真正可供学习、分享、讨论,能够沉淀下来的内容,也许还不如以前。不同的群体有不同的需求,大而全的平台并不能替代小而美的社区。
所以有时会幻想,能有一个网站,可以把知识按照一定的分类和体系组织起来,围绕知识树建立收藏夹,让大众能够更容易的检索并接触到优质信息。
就算不能随意讨论,至少收集整理还是可以的吧?
希望这个回答不会被删。
我前段时间发现一个现象,老家的很多人,用抖音做为社交工具。
微信没人用,对他们来说使用微信太困难了。首先你要找到你要联系的人,然后你要打字,很多人都不会打字。如果发语音,那为什么不打电话呢?为什么要发语音呢?要发朋友圈的话,很多人不看朋友圈,何况朋友圈的东西不一定都能刷到。
抖音就简单多了,比如我姑父发现一只野猪陷在池塘里了,经过村里同意把野猪打死拖上来。发了一个抖音说捉到野猪一头,想吃野猪肉的快来,很快他的亲戚朋友都刷到了这条抖音,一会就来了一大帮人。
很多你认为很简单的事情,在广大人民群众那里存在巨大障碍。我妈现在有一个重要的日常活动,就是帮那些退休老人们弄手机,什么健康码行程码,充话费,买火车票机票,他们操作都有巨大障碍。
浏览器这种完全是为拉丁字母使用者开发的软件,就是中国人使用电脑的巨大障碍之一。你要使用任何功能,首先要会打字,打地址或者打汉字搜索,这一点起码劝退70%的中国人。而且浏览器本身就让使用者不认识,比如公司的出纳大姐,我说你把浏览器打开,她说什么浏览器?我说edge,她说哎什么?我说Chrome,她说哭什么?我说360这下她才明白,现在你们明白为什么360全家桶普及率这么高了吧。
触屏机不用键盘,这才提高了中国的电脑渗透率和互联网渗透率,当然不止是中国,很多国家都是靠智能手机渗透。
新文化运动的前辈们要抛弃汉字彻底拉丁化,就是因为看到了拉丁字母在现代文明当中的垄断地位,如果汉语书写方式和其他语言相差太远,就会给中国人构成巨大的新技术学习成本。
最后,知道为什么越南语网页这么多,甚至多于阿拉伯语、意大利语和韩语吗?好像这两句标语能读懂。
中文互联网内容质量太差
第一,在财政预算相关的知识产品可获取性上面,俄国秒中国十条街。
这句话的意思是,凡是吃财政饭的人,所产出的知识产品,除了出版社出版的特定版权类,其他的按照俄国法律规定都是必须公开的。公开=搜索引擎直接抓取,点开直接下载
也就是说,哪些大佬写了哪些东西,如果不涉及重大敏感事项或者保留版权,都是网上可以搜可以随便下的。当然,我也必须要指出一点,就是苏联时期有很多著作非常有价值,但是无奈列图规模太大而人员太少,有大量书本电子化还没有完成。
但是我也必须吹一句,俄国的госуслуг上线后大量列图的电子化产品也可以通过认证后在桌面自由访问(但仅限俄国公民)
一些俄国教授自己搭网站,退休之后直接把自己撰写的教案课纲全部丢网站上
第二, 俄国有自己的免费文献系统,cyberleninka。
也就是说,cyberleninka上的文献你可以随便下,CC-BY-4.0
第三,俄国自己的免费文献系统,和semantic scholar之类的算法驱动全球学术作品搜索引擎数据是打通的,可以直接一次性搜索英语和俄语文献
第四,俄国吃财政饭的事业单位,按照一些政策要求是设立了大量的工具书页面,比如俄罗斯大百科全书,科学院哲学所自己还设了哲学词典之类的
呵呵,百度百科还装模做样请个专家审核,费这个事情干什么,百科全书辞海字典词典直接官方上线不就完了?
第五,在兴趣驱动的类别下,俄国网站是爹的真的多。比如魔改寨板BIOS超频就最先是俄国人大规模铺开的。有一大批俄国爱好者的BIOS编程水平比深圳寨厂的程序员都高。还有一家专门的俄语军事文献网,正在以惊人的速度更新苏联时期的专著、期刊、报纸、画报、地图等各类产品
第六,也是最关键的一点,俄国的政务信息公开做的非常规范。经常关注硬件信息的大概都知道EAEU注册公示系统是全球最大的官方3C产品leak渠道,剩下的法律、命令、决议之类的文件也是基本能做到随过随更。
我就不吐槽某巨国吃皇粮事业单位80年代national congress报告一半以上都是残缺的,这不摆明了让境外势力垄断报告的外语解释权吗?俄国这边连苏联时期的法令,从1917年的都给你ocr校对好放网上,随搜随有。
最后,俄国老师上课的时候有时候会直接甩给你电子版的pdf,哪怕是他们自己写的书,整个一个去他娘的资本主义知识产权!
总之一句话,有些人以为移动互联网是好文明,却根本不知道某大国的移动互联网都是什么信息垃圾集散中心,逼得学界都看不下去了
你必须承认几个事实:
中国虽然网络终端多,但是电脑用户少,绝大多数都是手机用户,看网页极少,看手机App多;
中国虽然网民多,但是绝大多数都是内容消费者,极少数是生产者,生产也是往手机App里生产(x音、x手、x乎、微博),这里面相当一部分内容你用网页都打不开;
中国虽然互联网公司多,但是极少提供完整的web端全部功能、信息和服务,大部分web端都是阉割版,前几天我想看看闲x,结果发现闲x的网页版直接彻底下架了。
中国互联网生态就是“流量为王”、“封闭为王”、“手机App为王”、“就是不给你看网页”——连当年人人在IE浏览器里玩得不亦乐乎的百度贴吧都逼你下App才能顺畅观看完整内容——为的就是获得你的通信录、GPS、手机IMEI、手机存储权限,为了十几个流氓App每小时互相唤醒,为了保证月活,为了让你绑定手机号身份证和姓名地址抢红包,为了往你手机里缓存开屏广告和储存用户信息以便删掉后还留在内存里,为了后台保持一个进程随时接受消息每天24小时把吸引眼球的标题推送到通知栏里。
这个大环境的前提下,“中文网页”就是中国移动互联网的最大障碍——让你拿个浏览器就能白嫖就看到信息,不用付出任何权限和隐私作为代价——这就是从根本上阻碍资本家割韭菜了啊!
中文互联网的封闭和山头林立决定了中文互联网的匮乏与混乱。
搜索引擎不像搜索引擎,硬要做什么内容什么百家号,新闻网站不像新闻网站,没有自己获取新闻的能力。百科不像百科,内容混杂而凌乱。论坛?已经是老黄历了,被新媒体挤压到了边缘。
是网友们不愿意分享内容吗?我觉得并不是。像过去的CSDN和博客园,有数不清的人贡献自己的经验与成果,维基百科虽然内地存在访问问题,但是内容并不匮乏。实际上我们的互联网是不乏优质内容的。
但是随着资本的跑马圈地,带有偏向性内容推荐对公众关注点随意操纵,以耸人听闻和抄袭为主的部分自媒体的野蛮生长,随之而来的是中文互联网的日益封闭与极端。
这也就是我们眼中的互联网,中文互联网,越来越不像是互联网了。
现在中文互联网上,你还能搜索到任何有价值有意义的信息吗?
打开搜索,整个中文互联网到处都是信息垃圾,专门针对关键字对搜索引擎做优化,想把自己排在前面,一打开全是同一内容的反复转载,新闻也是对外网内容的翻译,原创几乎彻底崩盘,稍微有一点原创性的都转私人公众号了。
知乎这样一个浑身都是G点的垃圾网站,也算是国内最有原创性的地方了,可见整个中文互联网基本已经僵死了。什么都是流量第一, 流量为王, 有流量就有一切, 什么最能带来流量?
就像@纳米酱 说的, 国内互联网公司主要就是做如何更好地向用户推荐黄赌毒的.
补充:
1. 数据是"全球点击量最高的1000万个网站使用的语言".
2. 这不是百度的问题, 百度已经不值得批评, 这是整个中文互联网生态的问题.
看到有人说wiki,就说知识吧。
人总有很多陌生领域,想粗略了解陌生领域,最直接办法就是查百科和论文。国内的百科基本属于浮光掠影,只能满足中小学生需求。这里有三个原因;
第一,百科的性质。百科属于不挣钱的东西,而中国是公有制为主体,如果没有政府的投入,仅靠私人企业,那注定有心无力。
第二,行业特性。知识是没有国界的,更没有公司企业的间隔。所以百科无需一个公司搞一个,这一个百度百科,那一个搜狗百科,这种重复建设,完全是对资源的浪费。百科不需要大战,也不存在击垮谁,就能独占市场,因为本就没“市场”。
第三,有百科,先要有写百科的人。中国能不能短期内提升百科质量,当然可以,百科本质不复杂,大量内容可以翻译,只不过需要一个整理过程。但如果没有专项资金,靠创作者为爱发电,那这个过程会非常非常缓慢。
主要原因大家不是心知肚明的么?
给大家看个具体的例子,一个曾经还算活跃的论坛是怎么突然悄无声息的。
俄罗斯黑客是真的多。相对的红客应该也不少。
俄罗斯不能说全体大学生都会,但我见过的研究生博士生,不管啥专业,最低的都能python给你现场写个程序,鬼知道是不是必修课。
scihub相信很多人听过,毛子干的,这点我很服气,分分钟解析付费论文,养活了不知道多少人。这类盗版网站很多,音乐电视剧电影全免…
这个统计不知道算没算暗网,没算的话可能更多。有幸领略过毛子暗网,zbc就完事了。
他们虽然网络硬实力不行,但软实力还是强的一批。
(独联体国家15个退俩,过去大都发达一时,现在是有些落魄,不过从科研领域来说,到今天仍然不容小觑,比如最近的一次听到毛子搞事不是疫苗,而是新冠病毒基因测序,那是疫情刚开始的时候。)
所以网站数量大还是有依据的,不论组织还是个人,搭建网站的门槛不高,而且掌握技术的人也很多。虽然配套设施比不上国内,但单就互联网发展程度,不逊于国内,依我感觉可能高于国内。你在国内可以用网上处理的东西,在俄罗斯也完全可以,甚至品类更多(吃饭洗澡唱k蹦迪书店商店,一般都有自己的网站,国内除了大型连锁,可能都没有)。计算机专业本科毕业,学得好一点的程序员在俄罗斯也可以赚到合人民币两万多,挺正常的。这种经济下赚这么多其实足以说明问题了。
举个例子,我楼下小打印店仨人开的,非连锁,人家都有个官网,邮箱也是org。所以这个统计是有一定可信度的。
俄罗斯年轻人基本上完全西化了,更想接触外面的世界,有好多英文网页实则俄罗斯域名,这一点上更加能感到他们网站多。如果不基于语言搜索,只看网址,那简直是多到爆炸,你可能根本找不到你要的结果…
汉语网页少,也有情可原,网站维护成本某些小店撑不起来。况且还有墙,自己玩自己的。
但这越南我就不懂了,是河内胡志明芽庄业务项目拓展了???泰国要加把劲了啊。
上面不是写了嘛......全球点击量最高的前1000万个网站使用的语言占比,可以理解为俄语使用者的点击率很高。
或者说俄语网页的信息价值高,所以能够拥有这么高的点击量,就像英语网页占比也高到完全不正常(超过一半)。
汉语与越南语网页的信息价值相当呗。
可以看到在网民里的英语使用者占总数的25%,但点击量最高占了60%,显然其中许多点击量是其他语言的网民贡献的,所以核心就是语言价值的高低。
汉语网页只有汉语使用者看,而俄语网页至少对欧洲有很强的吸引力。
更何况有8亿使用者的印地语,网页排名与600万使用者的挪威语相当。
你说印度人又该找谁说理去......
工信部备案制功不可没。
我还记得零几年的时候大小网站遍地开花,个人网站是一个产业,个人站长是一个职业。在那个年代建站成本比现在高很多,我还记得自己每个月用自己几乎所有收入供养一台服务器的经历。但是现在建站成本越来越低,个人网站却越来越少。
备案制出来之前我有点小想法就建个站玩玩,哪怕倒贴钱也无所谓,我觉得有成就感。有了备案制出来以后渐渐就没了热情。建个网站还得走行政手续备案,而且早期备案系统很落后,效率极低,等备案下来我热情也过去了。
其实随着年龄的增长,国家很多管理政策慢慢的都理解了,有时候觉得确实有一定的优势。但是备案制一直想不通。真想干坏事的人可以轻易绕过备案,不想干坏事的平头你管他干嘛。这就导致坏蛋畅通无阻,平头百姓却被折腾。侧面上导致了网页数量下降。
俄语使用者这么多的原因是因为俄国人为全世界人民提供了数不清的盗版资源。
说明中国互联网进步速度之快,远远把其他国家甩在了后面。
web这种F12就能看到全部前端源码,看到所有流量走向,无法盗取硬盘信息,无法强制推送广告的技术早就过时了。
你没看到中文所有的大型网站都在强推app吗?包括知乎在内,使用手机UA访问web必须强制下载app才能继续浏览已经成了常态,强制扫码登录也成了常态,还有更狠的直接不做web只做app。
app是好文明,apk经过强力混淆和插桩,让你无法获取前端源码。
证书双校验,反模拟器,反hook,系统内置反代,让你无法获取流量走向。
权限泛滥盗取信息到甚至要国家下场整改。
开屏广告,切换app广告,模仿系统弹窗广告,虚假的跳过和关闭按钮,混淆在真实内容中的广告。app把广告也发掘出了web绝无仅有的潜力。你还没法像web一样用反广告插件进行对抗。
所以web早就该被淘汰了,app才是未来。
占全球网站数1.5%的中文网站,服务了全球19.7%的互联网用户
先问是不是,再问为什么。
下面具体分析下数据:
问题中的W3Techs里数据是这样的:
在各语言网站占全球网站数量的最新排名中,英语仍然一骑绝尘,占接近六成(59.8%),俄语第二名(8.7%),西班牙语第三(4%)。排在其后的是土耳其语(3.2%)、波斯语(2.8%)、法语(2.6%)、德语(2.6%)、日语(2.2%)、葡萄牙语(2%)、越南(1.5%)语、中文(1.5%)、阿拉伯语(0.9%)等。
根据这个网站的数据,2020年,中文网站数量全球占比排和越南并列第10。五年是第7。
我们国内自己的数据是这样的:
第45次《中国互联网络发展状况统计报告》数据显示,截至2019年12月,中国网站数量为497万个, 比2018年底下降了5.1%,连续三年呈下降趋势。
2020年全球网站数量近20亿个,由此计算出中国网站数量约占全球总数的0.25%,甚至低于国外网站给出的1.5%这个数据(其中一个原因是,497万这个数字只包括了域名注册者在中国境内的网站)。
可见,抛开各种测量误差,中文网站数量和英文等确实存在数量级的差距。
与此形成鲜明对比的是, 2019年,全球中文网民数量为8.63亿人,与英语用户的11.05亿相差无几。也就是说,占全球网站数1.5%的中文网站,服务了全球19.7%的互联网用户。中文网站从数量上看确实是相对匮乏的。
那么,为什么中文网站数量比较少?个人认为可能有如下一些原因。
中文网站的覆盖人群有限
相比较于英文网站,中文网站主要是以中国为主、加上东南亚一些国家的华文群体创建的。而英语几乎世界各国通用,且众多网站都默认有英文版。
关于语言的影响力,华盛顿邮报曾刊登过一群学者根据UNESCO数据得出的全球语言网络关系图清晰展示出了各语言的枢纽地位。从中可见,除了英语的绝对霸主地位外,俄语排名第二也和它“枢纽”语言的地位有关——众多前苏联加盟共和国,即现在的独联体国家都普遍使用俄语,使得俄语网站数量众多。同理,法语、西班牙语、葡萄牙语等因为殖民历史,使用人数也比较多。
然而,考虑到土耳其语、波斯语各自仅有不足一亿母语人口,越南也只有一亿人,他们2倍于中国网站数或与之持平,似乎难以解释了。可能的原因是这几个国家网民较多,且与英语等强势语言相对脱钩,也比较独立于国际互联网,因此催生了许多本土的网站。
互联网巨头形成马太效应
不过,按照上文的逻辑,既然中国互联网专业相对比较独立,为什么没有催生出很多的网站呢?第一个可能的原因是,中国的互联网已经被少数几个网站垄断了。大部分中国网民日常访问的都是腾讯、阿里、头条、百度系等网站。
大家购物就上淘宝、京东、拼多多、美团;聊天用微信、QQ;搜索用百度;看视频上爱奇艺、优酷、腾讯、b站、抖音、快手等。网民,似乎没有太多时间去理会其他网站,大部分的用户访问都集中在这少数几个域名里。
以微信和知乎为例,个人内容是从属于平台的。因此即便微信有2000万个公众号,相当于2000万个私人博客,由于域名都是微信(http://weixin.qq.com),因此只能算作是一个网站。
由此导致的结果是,小的网络平台在竞争中迅速落败、流量转移到巨无霸平台上。中文网站数量减少的同时,网页数量却增加了。
独立建站的门槛和成本较高
中外网站数量的差异也可以从建站和维护的成本上来分析。
对于个人来说,由于中国互联网相对比较后发,具有计算机编程能力的人相对比例较低,因此个人建站的能力相对较弱。仅以Wordpress建站为例,国内建站的人数就相对较少。从企业角度来讲,欧美商户也有独立建站的传统。似乎连小城镇的餐馆、发廊等都会有各自的网站,帮助小商户建站的资源也比较丰富,门槛相对较低。
同时,由于国内网站需要备案等,不论是个人还是中小型商户,独立建站都具有一定的困难。朋友杨同学就分享过他的经历:曾经因为兴趣使然,打算创建一个健身网站,被告知需要登记、备案,交钱并且参加相应培训班,通过考核后才会颁发许可。这些时间和金钱成本让很多像杨同学这样以兴趣为导向的人放弃创建个人网站。
由于建站成本和门槛过高,而互联网巨头提供了非常方便的博客、托管等功能,许多个人不再独立建站写博客等,转而使用成熟的平台,从而实现提高流量、曝光率和盈利等目的。
小型企业和商户也不再创建网站。比如国内的餐厅可能倾向于直接在美团上投放自家信息,不再像众多欧美同行一样建立独立的网站。
从这个层面来说,除了小型网络平台“牺牲”外,个人和商户以一定自由度为代价,降低了诸多注册和维护等的成本,有所获益。
移动互联网时代网站式微
移动互联网时代,人们的在线活动被分割在一个个app中,发布的内容也具有封闭性。传统网站的时代逐渐落幕。中国企业抓住了移动互联网的浪潮,传统网站的遗产又相对较少,很容易大刀阔斧地“代谢”掉大量网站。
互联网企业为了实现自己的流量和盈利目的,纷纷建起了“护城河”,将内容限制在“自留地”内。直观感受就是,使用搜索引擎的次数减少了。淘宝等网站完全屏蔽了百度搜索的抓取,用户只能去淘宝内搜索。久而久之,用户也被培养了在各平台内部进行搜索:比如购物去淘宝,提问去知乎,看视频去爱优腾、b站和短视频网站等。
资源和内容的分割,一方面体现在垂直化加深:这可以帮助用户迅速满足需求、获得专门化的信息与服务。但另一方面,从内容生产上来说,由于信息可检索程度减低,不同平台内容的互动交流减少,传播度降低,内容的价值和创作的意愿也降低了。举个例子,前几天写了一篇关于“拍一拍”的文章,在微信里只有几百阅读,发到b站专栏居然有数万阅读。因为微信的生态更加封闭、检索更加困难,文章时效性非常短,哪怕是头部大号,去年的文章也不会有人再翻看。知乎、b站等乃至传统的博客情况似乎要好一些。
总而言之,多重因素导致了中文网站数量的全球占比与中文网民数量占比明显不匹配。移动互联网浪潮下,传统网站式微是一个全球性的现象,只是在中国体现得比较显著。
虽然不能说中文互联网内容枯竭了,但中文内容目前确实只是全球互联网中一个巨大的孤岛。希望这座孤岛能不断“填海造陆”,也希望中文能成为“枢纽语言”,让更多个体和群体易于和乐于创造优质的内容,提升中文互联网世界的活力、质量和声量。
参考资料
[1] W3Techs. Usage statistics of content languages for websites
[2] 中国信息网. 第45次《中国互联网络发展状况统计报告》
[3] Hosting Tribunal. How Many Websites Are There? How Many Are Active in 2020?
[4] Internet World Stats. Internet World Users by Language - Top 10 Languages
[5] Ronen, S., Gonçalves, B., Hu, K. Z., Vespignani, A., Pinker, S., & Hidalgo, C. A. 2014. Links that speak: The global language network and its association with global fame. Proceedings of the National Academy of Sciences, 111 (52, E5616-E5622.)
我的妈...终于看不下去了。
这个排名肯定有其问题,大家的反思也都可能略微不切中要害,但是至少还是切题的,中文互联网质量差是排名低原因之一。
但是,但是,看到另一位答主直接说这个统计是按照 Alexa Assistant 的“统计”出来的,先不说人家事实怎样,就回答一个问题:你都知道 Alexa Assistant 是一个语音助手了,那么你告诉我,一个语音助手怎么“访问”网站,并让这个网站知道这是语音助手的访问?
如果仅仅是出现这种错误也就算了,毕竟大部分人不是专业人士,犯各种低级错误也正常,犯错了就改就好了。
但是没有!该答主在别人指出这个错误之后还在嘴硬,还在认为这是语音助手的访问,并且认为别人把语音助手和音响混了,自己没有错。
然而他自己的资料里面也显示了,这个排名来自于 Alexa Bar,就是 Alexa 的一个浏览器插件的统计数据,而不是 Alexa Assistant。
并且还认为 alexa 的排名不准确,认为 alexa topsites 的排名和问题中的 alexa 1000w 排名分布不一致,所以一定是 Alexa Assistant 统计的渠道...
这...我改从何吐槽呢...
总结一下答主几个槽点:
以上这些普通人、非业内人都可以犯,但是实在不应该发生在一个有着 6w+关注者,输出了400+回答,并且跨平台开展业务的 悉尼大学信息科学硕士 身上。
这个身份真是诸多槽点,是真就澳洲水硕了?还是现在真就什么专业都往信息上面凑?不过也不对啊,自己的身份介绍里面有提到计算机啊。
以上言语,多有得罪,还望海涵,希望该答主不要介怀。
原本应该对事不对人,但是主要是实在是看不下去这么一个“大 V” 继续被打脸而不知道认错了,这种看起来有理有据但实际上南辕北辙的话很容易影响很多普通人的判断的。
如果有觉得过激的话可以跟我说,我修改措辞。
当然了,不破不立,不立不破,既然拆了一个论,还要立一个论,下面我就说明一下到底应该怎么解读这个。欢迎友好打脸,认真讨论。
首先这个问题问的是数量而不是质量,所以很多答主说因为质量不够而导致数量不够,这是不正确的方向,至少说不是核心方向。这只能是吐槽,当然这些槽我也会吐,只是和问题相关性没这么大。
首先要看怎么理解这个排名。
我看了下我司的一个没维护的网站,alexa 排名都有 200w+;我们一个内部管理系统的域名排名都有 60w+(只对内不对外,我司不到 20 人)。
所以基本可以认为,只要你稍微维护一下网站,获得一点点稳定访问,就可以进入这 1000w 的排名。
那这个时候比拼的,不是谁的用户规模大,不是谁的质量好,不是谁的头部互联网牛逼,而是哪个国家/语言的中小微 Web 互联网生态更好。
当然 5 年前的互联网和今日的互联网没办法直接相比,但是应该不会有数量级的差别。
那么影响这个排名的主要因素有哪些呢?以下几点按重要性排序。
一. 域名备案
域名备案应该为这个排名背起第一口大锅。
全球网站数量有超过 12 亿,而中国仅有 4000w 不到(均为2018 年数据),中国占全球总网站数量的 3% 不到。在整体大盘不足的情况下,1000w 排名分布也不会太过理想。
那么为什么域名备案会影响数量呢?
但凡走过域名备案的人,99%应该会对这个系统深恶痛绝(我是见过那 1% “甘之如饴”的用户的):
阿里云现在应该是备案流程体验最好的云服务商之一了,但是你看这流程描述,你懵不懵?
有人要说,“一个备案就影响了你建立一个网站了?你要真想搞这都不是事儿!”
这种言论就是典型的站着说话不腰疼,类似于“你长不高就是你不想长高/基因问题,和你小时候吃不饱穿不暖没半点关系。”
而国外建站有多简单的?
以最知名的 godaddy 域名商为例,我可以一站式地在 godaddy 上完成买域名+建站操作,全程只需要点点点和付款就行,熟手不超过 20 分钟,国外新手一上午也能搞定。
基本上上午想到一个 idea,下午就能完成建站上线发布了,连代码都不需要懂。
而这种差别,导致了国内外网站数量的绝对差别。
很多网站不是需要程序员去熬夜写代码才能上线的,可能就是一个简单的 idea,用通用模板套一下,改一下相关信息,先发布出去试试,看看反响。
如果反响 ok 就扩大规模、招人、重写;如果反响不 ok 就不用管,只要能服务好部分用户就好——而只要有每天5个稳定用户,就可以进 alexa 前 1000w 排名了。
至于域名备案的其他优缺点,因为有冲塔嫌疑,这里我就不讨论了。玩家朋友们可以参考下游戏审核制度对于中国游戏产业的影响。
二. Alexa 对于国外网站排名有天然加权,尤其英文
这里要设计到 Alexa 的数据是怎么来的了。
Alexa 的排名不是凭空而来的,也是需要统计的,而统计入口最重要的就是 Alexa Bar。
这是一个浏览器插件,经历过当年 IE 年代的用户应该都对自己电脑上一堆浏览器插件记忆犹新。什么百度工具条、雅虎工具条、3721(周鸿祎靠这个起家)统统塞在 IE 地址栏下面,有好的有坏的,蔚为壮观。
现在 Alexa 统计的主力是 chrome 的浏览器插件,但本质上和前面的 Alexa Bar 是一致的。
其原理就是统计安装了这个插件的用户的浏览情况,然后据此推测全球网站的排名情况。
注意:
首先这个插件的安装,除非流氓手段,不然一般用户是不会安装的。
其次这是个美国公司,中国大陆网友想要安装这个插件除了克服语言关,还需要克服伟大的墙这一关,因此大陆人很少安装这个插件。
这就导致了该插件统计的数据是和“真实”数据是由偏差的,总的来说是偏向欧美用户,偏向专业人士。
当然 Alexa 团队肯定有针对这个问题做的算法调整,并且还有其他的统计渠道,不过总归来说会对中国网站进行非有意降权。导致 1000w 网站排名靠后。
三. 中国移动互联网对 Web 互联网的流量拦截
我们都知道,中国的移动互联网普及程度是独一号儿的。基本上任何人都有手机,但是不一定有电脑。
而移动互联网本身就是依托于 App 而不是 Web,这就导致中国大陆的 App 流量份额与 Web 流量份额之比,要高于其他国家。
可以说我们直接从 Web 互联网时代跃进到了 App 互联网时代。
而中国移动互联网公司都倾向于将流量锁死在自己的应用内部。君不见各种小程序、打开 App 查看更多、复制到浏览器查看、等等骚操作,把移动端的 Web 互联网体验拉到了最低。
在移动端上,只能称之为Web 联网,而不能称之为移动 Web 互联网了。
当然这个影响对 5 年前统计数据影响没今天这么大,但是趋势依旧在。
四. 中国互联网对于头部流量的倾斜
如果单看 Alexa topsites 的数据,会发现中国排名靠前的网站能占到 20%~30%。说明中国头部的互联网公司其份额还是非常之大的。
这也可以理解,毕竟中国有着世界上最大的单一市场,14亿人口堆也能堆出几个世界顶级的网站出来。
但是国内互联网厂商都倾向于做得大而全,把自己能做的、不能做的,核心的、不核心的,赚钱的、不赚钱的,流量全都圈在自己的生态里面。
这就导致了大量的中小微厂商难以存活,只能委身于头部厂商,乃至被合并。
君不见,美团已经从团购延伸到外卖、打车、机票、酒店、电影等方方面面;而国外的 groupon 还在半死不活差点倒闭。
支付宝这样一个支付工具也嵌进去了外卖、理财、基金、黄金、团购、机票、电影等等;而国外的 PayPal 这么多年还是只能做收付款,还难用。
国内的微信,已经从一个聊天工具嵌进去了外卖、打车、理财、视频、游戏、新闻等功能,眼看要成为微信操作系统;而国外的 WhatsApp、Messenger、SnapChat、Skype、Telegram 都几乎只能聊天、语音、视频和一些辅助功能。
等等等等,不胜枚举。
看到没,每家和每家做的功能都差不多,都要在自己生态闭环,结果是生态闭环了,中小微产品消失了。
这是什么啊,这是内卷啊同志们。
这些每集成一个业务,后面对应的就是一堆中小微企业的存亡,忘了 10 年前《计算机世界》的一句怒吼:狗日的腾讯!为什么狗日的?不就是因为走了别人的路,让别人无路可走。
当然这种生态在整体上看是好是坏,这里不做讨论。硬币两面,好坏都有,有机会可以做进一步的讨论。
但是结论就是:中国的中小微互联网产品颇为艰难。
五. 俄罗斯文化底蕴犹在
苏联毕竟十多个加盟共和国,这些国家都有几百到几千万人口。每个国家都有自己的网站要服务本地人民。
每个国家都需要自己的美团、58、陌陌,十几个国家就是十几倍的本地网站。
别看人家人口不多,前面说了只要有个位数的稳定访问,这个网站就可以进前 1000w。
所以国家的数量和文化的辐射,导致了俄语的的比例提升。
另外俄罗斯的黑客文化,导致其在互联网领域的独特存在,其黑客水平是全世界独树一帜的,中美俄都在同一个档次上面。
很多盗版资源都是俄罗斯黑客们搞来的,你要查找领域相关资源,别的地儿要么不全,要么付费,唯有俄语的网站,整整齐齐、分门别类,比正版还期权。(这里不讨论盗版本身的对错)
同时很多互联网一手信源都是从俄罗斯出现的,君不见斯诺登都拿了俄罗斯永居了,这是对其黑客文化多大的赞美(手动狗头)
而有能力、有动力找到这些资源的都是谁啊,都是资深互联网人啊!前面有说过,资深、专业人士会天然给该网站在 Alexa 加权啊!
这些都为俄语网站贡献了极大的流量。
当然这些依然不足以完全解释俄语排名如此之高,期待有其他解释。
总结来看,就是以上五点造成了中国排名如此靠后,俄罗斯排名如此靠前。
至于中国的互联网质量问题,可以单开一个文章了。和本题关系不大,这里不再赘述。
林林总总,挂一漏万。欢迎大家友善打脸,和谐讨论。
居然还比越南语高啊?有时候我上网找东西,不会英语都不好找。
中文网页不仅提供不了任何信息,就算提供了点进去还已经删除。
网络上只有推荐算法,搜索只有“买美国?上淘宝!”
不得不说互联网行业天才真的多,搜索关键词和广告无关都能搜到。
俄爹的网站就像集散地,东西能找到,还能变成社区,下载的人能变成上传的人。良性社区,众人拾柴火焰高。
而中文网络就像赛博朋克2077,一大群人无尽伸手,莫辜负,拿到资源就淘宝开店赚钱,顺便举报无偿链接。信任只在交易达成之前。
大公司更是掌控了自己app的一切,因为相关法律产生的违禁词多到相关法律本身都搞不明白自己是怎么法律。封禁账号复活只需支付2200w。
哪怕用心分享的人,也只会被无情摧毁。
但是在这种环境下,唯一一种中文社区欣欣向荣,就是本身属于违法的颜色论坛。因为本身违法缺少监管,社区活跃程度仅次于俄爹。
国内绝大部分网站,都是seo们做出来的垃圾站。
就是那种嫖别人内容,请一堆3千块编辑手动复制粘贴修改文字的小破站。
有做下载的,有做资讯的,还有做各种不可名状内容的。
你百度一搜,全是这些东西,而且可笑的是,几百个站,内容几乎是一模一样……
有些站还是站群衍生出来的马甲,几百几千个站都是一套内容,封了一个我,还有千千万万个我。
国内互联网产出者极少,原创被抄袭搞死不是什么天方夜谭。
而且这群seo,一边白嫖别人内容,一边笑别人傻逼,这么累去做原创。
到现在,确实没啥原创内容给你嫖了,怎么办呢,那群seo又说,最近没什么机会了,没什么好项目了……然后一个个跑去做美女直播和菠菜了。
还就是这群哥。一个一个开口闭口谈格局,谈模式,谈内容。
能说什么呢。
国内经商环境是太好了,正向竞争几乎没有,不需要技术,谁够黑谁就能赚钱。
没办法。
明明是群扒在人身上吸血的虫,吸饱了以后倒是开始说起人话来,自己都把自己给骗了咧。
你说什么样的办法能瓦解美国互联网的大数据垄断体系?
是类似把百度打造成第二个谷歌呢?
还是直接“放任”APP各自围城来破局?
是做你的殖民地大平原,还是做我自己的主权群山。
能有大数据战争意识的人,应该知道孰轻孰重了吧。
你要个人或小团体方便,你可以搭梯子。但整体利益,是战略性思维的人们替你负重前行,摸着石头过河硬扛出来的。
一边享受着微信淘宝们的便利,一边嘲笑不自由。
舆论核辐射之大,令人叹息,催人奋进。
网页内容?
中国互联网生态现在是这样的。
这样的生态,网页内容能多才奇怪。
开始是什么都可以盗版
后来是什么都可以以盗版之名起诉
国内环境如此,一个个的强推app,
其实80%的应用我都更喜欢在网页端完成。
众所周知,中国网民所拥有的一项全世界网民都没有的技能,便是在搜索结果的前10条广告中找到真正的官方网站。
无论是下载东西,还是查询官网,还是咨询各种问题,你都会发现,广告的相关程度永远高于其他正经网站。
我在微软的Bing Relevance组,我之前一直不理解为什么Bing在中国的投入这么少。在百度不行的时候,我认为应该是我们很好的机会。
但渐渐地我发现国内的互联网环境实在是太差了。即使谷歌还在国内可用,也搜不出花来。我们缺少一大批高质量的网页,没有良性的互联网生态,有的只是各大app分割的阵地,以及各大所谓的高科技公司对互联网入口的你争我夺。例如各种公众号的存在已经严重阻碍国内互联网的健康发展。很难相信在2020年的中国,我们还需要首先下载好一批对口的app,一通搜索外加筛选后才能勉强获取一些相关的有用的信息。从某种程度上来说现在国内的互联网环境无异于封建社会的闭关锁国。如此以往,中国在经济,教育,文化,科技等几乎所有领域都难以取得长足进步。
我有志为中国的互联网做出一份微小的贡献。
越南扫盲只花了两个月就搞定了。因为越南文字罗马化之后,非常简单,会读就会写。汉语不难。但是汉字很复杂。所以汉语页面只有中国人自己看。其次呢,我们这里的建站成本太高。要备案。个人建网站很难。建交互网站更难,个人基本不用想。即使纯技术论坛,按法律的监管下来运营成本很高。所以论坛基本都消失了。尾巴没有了,只有微博等少数头部网站运作。这些头部网站也搞信息壁垒,不给公开搜索。所以我们的网络生态沙漠化了。
本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度,google,bing,sogou 等
© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有