首先就不清楚到底什么是错误内容,除非算法也能跟着()一起摇摆。
一句话:不讲政治的算法,越先进,越危险。
笔杆子,不能让任何其他人或非人掌握了去。
国家批判的不是算法推荐低俗,这低俗东西要屏蔽很简单,卸载 app 就行了,一劳永逸,不会对你产生家庭和财产产生任何影响。
看红头文件要看背后政府怕啥,网红靠穿丝袜攒了几百万粉丝,具有安抚电子厂打工人的强大能量,从政府角度来说,这种低俗是维稳的安慰剂,没必要做惩罚。
政府怕的是这百万电子厂工人,因为加班太狠,被女神嫌弃了,打工人集体迁怒到工厂老板,这种强大的工人组织背后,没有党的领导,这种事情特别犯忌讳。
你以为内涵段子是因为低俗被查封?
推荐系统最大问题是,你要个性,就要稀释人群对某件热点事情的聚焦,防止同质化,这是政治正确的事情,但是28定律告诉我们,好内容很少,大部分都是烂内容,系统很容易陷入三俗。
如果你想拉起用户生态粘性,就要受众去不断聚焦少数几个高质量热点,抖音貌似算法很牛,其实真的牛是人家运营,非常努力去挖爆点热点,如果只是穿丝袜引发爆点还好,要是哪天一个网红对政策评头论足,运营也强推出来,这尼玛短视频领域能直接嗝屁。
以前啥直播答题特别火。。据说是字节还是那个傻叉公司就犯了领土政治的傻逼问题(据说是台湾是哪个国家这种)。。然后一夜之间,整个领域都查封了。
总之,黄赌毒问题,背后不是文化精神问题,而是政治忌讳问题。
吃个桃桃能有32万粉丝
本身就说明问题了。还好现在已经被封号。
算法推荐最大的问题就在于它是用结果导出原因。有人看有人互动,我就认为他是更受欢迎的,我就向更多人推荐。而丝毫不在意这个,看这个互动是因为什么引起的。作为公众传播平台,只关心数据本身而忽略了什么是应该被推送的。夸奖出来的流量是流量,而骂出来的流量也是流量。受到众人夸奖的人固然可以被推送给更多人,但是被大多数人唾骂的人依然可以被推送给更多人,这本身就是算法的问题。
打开抖音满世界的教你怎么样去抓听众的注意力,怎么样标题的怎么样提升前三秒前5秒的完播率,怎么样通过上传视频时候的一个小技巧打开流量池………就是没有人和你说你要耐心用心做好内容,不要浮躁。或者说也不是没有,而是前面那种看似快捷急功近利的方法,有更多人去刷,有更多人去互动,因此它获得了更多的流量,而后面那些教你做好内容的反而没有人听,没有人互动从而沉底了,这种事实本身就说明算法推送是有问题的。算法本身没有问题,有问题的是被推送的东西,有问题的是他忽略了人会根据算法本身做逆选择。你卡前三秒完播率,我就标题的我就在前三秒说让你焦虑的话。
目标:
基于大数据,编制一套算法,能够从十亿人的网上发布内容中发现错误的内容,并自动删除。频繁发布的,自动定位,并通知相关部门。
关键:
如何定义错误的内容?
无。
无。
无。
先整治下软件权限的事情吧……
就这五个部门来说,我有点怀疑他说的“错误内容”和我想的“错误内容”是否一致。
算法需要公布到底是如何针对我个人推荐的。20%大长腿,20%婴儿,20%搞笑,20%严肃话题,20%新闻,我要能自己去调节。广告只能开关机有,不能在中间插入。
在我看来,算法推荐本身就是问题。
算法推荐,名义上是为了方便用户,让他们看到自己更感兴趣的东西,换一种角度,就是平台投其所好,吸引用户“上瘾”,将更多时间和资源,投入到自己的平台上。
留意过近年来互联网言论氛围的朋友,不难发现,现在的网络上,极端言论变得越来越常见,互联网上的人们,似乎变得越发充满戾气,失去了平和讨论的可能。
在这种舆论环境形成的过程中,算法推荐,功不可没。
平台谄媚地向用户推送直白刺激,能够吸引用户沉浸其中的内容,投其所好地让用户发现更多的同类和同质信息。世界原本丰富多彩,充满多元性,但是在这种相互训练和强化的机制中,人们的视野变得越发狭窄,陷入信息茧房之中,以为自己所知的一隅就是世界的全部。从茧房中得到的认同越是强烈,就越难以接受不同的意见。
人是主动的动物,算法推荐,终究只是一种工具,而工具本身,是为了方便人的主动操作而存在的。纵观近年来的互联网信息发展,从长篇的文章到图文,到视频,到短视频,从主动的搜索到有限制的搜索,到算法推荐。一步一步的,人的主动性逐渐丧失,整体而有联系的内容被打碎为一片片碎片,个人的思考,让位于平台和内容提供者的干预或引导。
所以理想的算法推荐是怎样的呢?
我理想中的算法推荐,应该是能更好的发挥人的主动性,并让人感受到知识连接和世界多元的工具。算法推荐的内容,应该是准确的,合乎主题的。同时,在结果展现的界面中能够体现知识的联系,引导人们发现与之相关的内容,认识更丰富的世界,比如搜索一种观点的同时,能够在旁边发现与之相关的其他见解。
现在的技术,能否做到呢?
Netflix有部纪录片叫做《监视资本主义:智能陷阱》(The Social Dilemma)
这部纪录片讲到了算法被滥用的危害。下图里显示的美国少女自残与自杀率率大大提升,尤其z-generation,他们生在数码时代,任由着算法操控他们成长。
算法缺乏约束甚至还能对社会产生负面影响。大家可以在推特、Facebook可以看到,两级分化很严重。例如美国的政治两级分化,在社交网络以及推荐算法的推波助澜下,达到了20年新高。
虽然把这些问题全部丢给算法确实有失公允,但算法确实起到了推波助澜的作用。而算法的使用者是人,是企业,治理算法推荐,本质上是治理某些企业唯利是图的毛病。
其实一个企业和算法很相似。算法里,有个概念,叫做「目标函数」,指算法所关心的目标与相关的因素的函数关系。例如在算法的输入为X,输出为Y,那么怎么衡量预测结果Y的质量呢?例如预测价格,我们可以用MAE(Mean Absolution Error)或者MSE(Mean Squared Error),则算法的目标就是去最小化MAE或者MSE。
不过搞算法的也知道,目标函数函数里可以加正则项,以防止过拟合。如果你不懂技术,没关系,所谓正则项,就是为了防止算法在当前数据集上达到最优,但在别的数据集上表现一塌糊涂。简单来说,就是为了让算法具有「泛化能力」。
企业也是一样。企业的目标是什么?赚钱。为了赚钱,企业会制定相关KPI,然后产品设计者会利用各种手段去刺激用户活跃度,粘性等等。如果没有「正则项」,企业则会「过拟合」,在最大化自身利润的同时,损害了未来企业发展的机会,甚至对社会有负面作用。那么企业的「正则项」是什么?
没错,企业的「正则项」就是各种法律法规。
这次五部门发布的《关于加强新时代文艺评论工作的指导意见》,就是其中一个重要的正则项。当然,其他正则项还包括《个人信息保护法》、《网络安全法》和《数据安全法》等等。
《意见》里说:
推动社会主义文艺健康繁荣发展。建立线上线下文艺评论引导协同工作机制,建强文艺评论阵地,营造健康评论生态,推动创作与评论有效互动,增强文艺评论的战斗力、说服力和影响力,促进提高文艺作品的精神高度、文化内涵和艺术价值,为人民提供更好更多精神食粮。
算法需要为健康的内容的服务,错误的内容的传播渠道要被切断。
当然,这样引来一个讨论:什么内容才是错误的。文艺作品是正确的,搞笑无厘头视频就是错误的吗?当然不,不过我认为,错误的内容从严重到轻微,可以分为这几种:
大概先写这些。