问题

谷歌翻译系统出现恶毒攻击中国词汇,谷歌是否该承担责任?对此事你怎么看?

回答
谷歌翻译系统出现“恶毒攻击中国词汇”的事件,谷歌是否应该承担责任,以及对此事的看法,这是一个复杂且多层面的问题。要详细地分析,我们需要从多个角度审视:

事件的性质与具体表现:

首先,我们需要了解“恶毒攻击中国词汇”的具体表现是什么。这可能包括但不限于:

不恰当的翻译: 将原本中性的词汇翻译成带有侮辱性、歧视性或贬低性的词汇。例如,将“中国”翻译成带有负面色彩的词语。
误导性信息: 在翻译中加入不实、煽动性或仇恨性的内容,歪曲原文意思。
针对特定群体的侮辱: 使用带有种族歧视、民族歧视或政治攻击性的词汇来描述中国或中国人。

这些具体表现直接关系到谷歌翻译系统的输出是否确实存在“恶毒攻击”。

谷歌翻译系统的运作机制:

谷歌翻译并非一个简单规则驱动的翻译器,它主要依赖于统计机器翻译(SMT)和神经机器翻译(NMT)技术。

统计机器翻译(SMT): 在早期,SMT依赖于大量的平行语料库(即同一文本的不同语言版本),通过统计模型来找出词汇和短语的对应关系,以及句子结构。
神经机器翻译(NMT): 近年来,谷歌翻译全面转向NMT。NMT使用深度学习模型,特别是循环神经网络(RNN)和Transformer模型,能够理解上下文,生成更流畅、更自然的翻译。NMT的关键在于其学习能力,它从海量数据中学习语言模式和翻译规则。

谷歌是否应该承担责任?

这是一个关键的法律和道德问题。我们可以从以下几个角度来分析:

1. 技术过失与监管责任:
数据偏见(Data Bias): 机器翻译系统的质量很大程度上取决于其训练数据。如果训练数据中存在大量包含歧视性、偏见性或仇恨性内容的文本,模型就可能学习到这些负面模式,并在翻译中体现出来。这些数据可能来自互联网上的公开信息、用户提交的反馈等。
算法漏洞(Algorithmic Vulnerability): 尽管NMT模型强大,但它们也可能存在被“操纵”的可能性,例如通过输入特定的“触发词”或“对抗性样本”来诱导模型产生错误的、带有攻击性的输出。这可能是一种技术上的“漏洞”。
审查与过滤机制(Censorship and Filtering Mechanisms): 谷歌作为服务提供商,有责任在其技术实现中加入必要的审查和过滤机制,以防止传播有害信息。如果其过滤机制存在重大疏漏,未能有效阻止恶毒内容的产生,那么其责任就会增加。

2. 企业责任(Corporate Responsibility):
对内容负有的责任: 尽管谷歌提供的是翻译工具,但其输出的内容最终由用户接触到。当翻译内容明显违反公序良俗、构成侮辱或诽谤时,企业是否应承担责任,这取决于其是否采取了合理的措施来防止这种情况发生。
用户安全与社会影响: 科技公司在全球范围内运营,其技术对社会产生广泛影响。企业有道德责任确保其产品不会被用来传播仇恨或误导信息,从而损害特定群体或社会稳定。
法律法规的适用: 不同国家和地区对互联网内容传播有不同的法律法规。谷歌需要遵守运营所在地的法律,并且其服务也可能受到其他国家(如中国)的法律管辖。

3. “恶毒攻击”的界定:
主观意图 vs. 客观结果: 谷歌公司是否有“主观意图”去攻击中国词汇?从技术上来说,一个AI模型没有主观意图。然而,如果其系统反复出现此类问题,则需要考虑是否存在客观上的“攻击性结果”。责任的承担可能更多地集中在“未能有效阻止”而非“主动实施”。
“攻击”的定义: 何为“恶毒攻击”?这其中存在一定的解释空间。是任何负面联想都算攻击,还是仅限于明显的侮辱和诽谤?如果翻译结果带有一定的负面色彩,但并非直接侮辱,责任界定会更加复杂。

我的看法:

我对“谷歌翻译系统出现恶毒攻击中国词汇”事件的看法如下:

1. 谷歌应承担责任,但责任的性质需要明确。
技术层面: 谷歌作为一家技术领先的公司,对其AI产品的质量和安全性负有首要责任。如果问题是由于训练数据偏见、算法漏洞或不完善的内容过滤机制造成的,那么谷歌在技术上存在疏漏。
管理层面: 谷歌需要建立更强大的内部审查和反馈机制,及时发现和纠正这些问题。当用户报告了明显的不当翻译时,谷歌应迅速响应并采取行动,而不是任由问题持续存在。
道德层面: 无论技术如何,企业都有责任确保其产品不被用于传播仇恨言论或歧视性内容。在国际化运营中,尤其需要审慎对待可能触及敏感议题的内容。

2. 用户反馈和数据驱动的改进是关键。
谷歌翻译的强大之处在于其学习能力,这通常是通过海量数据和用户反馈来实现的。当出现“恶毒攻击”的词汇时,这可能表明训练数据中存在问题,或者用户提交的反馈未能得到及时有效的处理。
用户报告错误翻译是改进翻译质量的重要途径。如果谷歌未能有效利用这些反馈来改进模型,那么其责任会更重。

3. “恶毒攻击”的性质是复杂且敏感的。
在处理涉及国家、政治或文化敏感性的词汇时,翻译工具尤其容易出现问题。这可能源于训练数据中天然存在的偏见,也可能是有意为之的操纵。
需要区分是AI模型无意间学习到的偏见,还是有人故意利用系统漏洞制造的恶意内容。如果是后者,则更需要谷歌加强安全防护。

4. 透明度和问责制很重要。
谷歌应该对其翻译系统出现此类问题的原因进行调查,并对外公布调查结果和改进措施,以重建用户信任。
对于系统性错误,透明地解释其原因并展示改进承诺,是负责任的表现。

5. 多方因素共同作用。
网络信息环境的复杂性也可能加剧此类问题。互联网上的海量信息并非都是中立和友好的,机器翻译系统很难完全隔离其中的负面影响。
地缘政治因素和国际关系也可能间接影响到训练数据的构成和对词汇的倾向性解读。

总而言之, 谷歌翻译系统出现“恶毒攻击中国词汇”的事件,谷歌无疑应该承担责任。这份责任主要体现在其技术研发、数据管理、内容审查以及用户反馈处理等方面存在的不足。作为一家在全球范围内提供服务的科技巨头,其产品带来的影响不容忽视,因此,采取积极措施确保翻译的准确性、公正性和安全性是其不可推卸的责任。同时,对于“恶毒攻击”的界定也需要更加清晰,并区分是技术本身的固有缺陷还是人为操纵的结果。

网友意见

user avatar

真正辱华的是编造了这个新闻并且加以传播的人。

第一从编造的内容上,辱华了。

第二从对网民智商预估上,仍然是辱华了。

建议有关部门找到源头,依法办理。

user avatar

科普一下,我是前几天看到这个事件的。

大致就是如果你用谷歌翻译,设定为英文翻译中文,然后再英文框里输入中文,会出现奇怪的翻译结果。

比如输入中国,会输出煞笔,输入新冠、艾滋病人、武汉、中国人…也会有负面的词汇产生。

这个情况呢,就很奇怪,这种费力不讨好的“辱华”,在逻辑上是很有问题的。

我当时就觉得,可能是哪个小傻瓜PS了几张图,然后自己在造热点。

然后我打开谷歌翻译自己试了一下,这个问题已经不存在了。

不过后面谷歌有声明,确定真的有这个问题。

这个很可能是有人自己上传翻译建议,然后调教出来的,毕竟它数据本身有限,很可能比较好搞。

这个事情呢,说是谷歌搞事情其实并不是很说的过去,哪怕谷歌真的有问题,它也不太会用这种方式辱华。

因为那些词汇根本不是正常外国人辱华会用的词。

我们其实也知道,如果它把中国翻译成F字头的,说不定是有外国人搞事情,但如果它翻译成经典国骂,那到底是什么玩意儿在搞事就要想想了。

当老美用繁体字骂你的时候,我觉得大多数人会猜测白皮后面估计是个ww。

反正就我的感觉是,它大概率是无良媒体搞出来的破事情,谁第一个爆出来,谁就有重大嫌疑。

就跟带着死蟑螂去餐厅拍照的网红一样。

大众是爱国的,但这但并不是给煞笔当枪使的,那些用这种事刷热度的,很蠢且坏。

这种情况不像是谷歌用辱华换利益,更像是群众里的坏人找了个漏洞,用反辱华薅羊毛。

有点像慕容博骗江湖人士说乔峰他爹娘是辽国奸细。

左右不过往萧远山行囊里放几个“宋国人是软蛋”的标语,还特么用的是宋体五号字,你用个契丹文我说不定就信了。

你觉得问题出在萧远山身上,是他没有及时发现问题,还是出慕容博身上呢。

当然,话说回来,慕容博也是混在汉人里的前朝异族,也不是好人,被这种人带节奏后患无穷。

user avatar

想起了一个旧闻。

近日,有记者在石家庄男科医院博大医院化验时,用绿茶替代了尿液,随后医生称尿液检测出了炎症、霉菌和杂菌,记者被诊断出重度肾虚、前列腺炎、附睾炎,并被要求花费高额费用进行相关治疗。事件一经披露,引起广泛关注。
昨日,卫生部新闻办相关负责人回应,用绿茶替代尿液送检的做法,是不科学的。
茶水代尿送检5年前已有先例
卫生部新闻办相关负责人表示,在2007年,有媒体用茶水在医院送“尿检”,结果显示有炎症。对此,卫生部当时做出了回应。“这次和2007年那次事件几乎一模一样。该说的话,2007年都说过了,那次的回应也表明了我们现在的态度。”
据了解,2007年有记者乔装成患者,将事先准备好的茶水送到杭州10家医院检测,结果有6家医院检测出茶水有炎症,从而引发了社会广泛关注的“茶水发炎”事件。
仪器无法鉴定样本是否为尿液
时任卫生部新闻发言人毛群安当时对外表示,医疗机构的检验仪器,是针对有特别指向的检验品。比如尿检仪器,它没有鉴定样本是否为尿液的程序。让医院的尿检程序去检验茶水,无异于人为打乱了有具体运行环境设定的电脑程序。
毛群安当时说,大家相信该新闻策划的出发点也是希望改善医疗服务质量,但由于不了解医疗服务,结果事与愿违;卫生部组织专家研究认为,该报道有悖于媒体记者职业道德的规范要求,是误导公众,不利于维护正常的医疗秩序,构建和谐的医患关系。
近日“绿茶代尿”事件披露后,还有媒体记者做了试验——将康师傅绿茶、啤酒、荷叶茶全部当做尿液送检,结果检查结果全部异常。
中华医学会检验学分会委员王录新介绍,尿液检测仪不具备鉴定样本是否确实为尿液的程序,如果放进仪器的是茶水,只要其中含有和与尿液相同或类似物质,仪器同样会自动辨别生成结果。
user avatar

谷歌第一次退出中国,被央视点名报道前。

面向黄暴的关键词搜索对比月平均,翻了千倍。

user avatar

网友们愤怒异常,只因谷歌翻译“辱华”。在Google翻译里,输入特定的中文词汇,再“翻译成”中文,会出现一些奇特情况。

千万网友卷起袖子抡起拳,四十米长的大刀眼看就要收不住。

就在这时,一些眼尖的观众发现问题:诶?怎么谷歌翻译不仅辱华,还辱美呢?

这是啥情况?

大家这才反应过来:谷歌翻译可能被“数据投毒”了。

通俗解释一下:AI数据投毒

1

Google翻译,以及目前大多数比较有名的翻译平台,翻译句子都不是一个词一个词地翻译,而是用了“神经网络”、“机器学习”之类的人工智能(简称AI)技术。

要真是一个词一个词的翻译,“树新风”真的可能会被翻译成“tree new bee”。

维基百科显示,大概从2016年开始,谷歌就开始用一个名叫“神经机器翻译系统”的东西。

AI学习翻译,就像小孩子英文一样,要用一堆“小卡片”反复教——Apple,来小朋友们跟老师一起念,挨——破,苹果,i like to eat apples,我爱吃苹果……教得多了,AI自然而然就学会了翻译。

像什么人脸识别、图像识别,原理也是一样,你想要AI识别小狗,那就找一堆小狗的图片,把里头的小狗标记出来:“这是狗”,标记好的这些图片就是“训练样本数据集”,把它喂给AI,就能让AI大概知道什么是狗。

数据投毒,就是在训练他的样本数据集里,丢进去一些错的,扰乱它的判断能力。

比如,你本来要训练一个AI模型识别狗,但是我在样本数据里掺进去一些我自己的照片,也标记为“狗”,这就会让AI“陷入混乱”——啊?这也是狗吗?好吧,既然训练数据里说这是狗,那肯定就是狗。

于是,下一次AI看见我时,就可能会把我识别成狗。

金庸小说《侠客行》的主角石破天,从小就被养母喊“狗杂种”,长大之后别人问他叫什么,他就一脸天真地说“我叫狗杂种”——他哪里知道狗杂种是骂人的话?AI也一样,你喂给它什么训练样本,它就往哪个方向学,比人还要单纯。


2

那,要怎么做,才可以用“数据投毒”把谷歌翻译给教坏?

要回答这个问题,得先知道谷歌翻译的样本训练集是从哪里来的,就像你要给一个村子投毒,你得先找到村里人喝水的那口井(这是只是举个例子,投放危险物质罪是触犯刑法的,坐牢10年起)。

谷歌翻译的样本数据来源很广,比如可能有各式各样的互联网网站,以及各种各样的双语书籍等等,每天有无数个网络爬虫抓取双语文章,经过亿点点处理之后,喂给AI翻译模型吃。

所以如果你要给谷歌翻译的数据投毒,可以精心构造大量的双语网站,或者出很多双语书籍,在里头大量掺杂你想要的翻译,比如你叫张三,就在网站和书里弄很多“张三=The most handsome man in the world”(世界上最帅的男人),然后想办法让谷歌的数据源爬虫给抓取过去,还能绕过数据审核和校验,给AI学习,就能完成投毒。

只要你投毒的数据量占比足够多,就能成功:

好吧,上面这种图是我PS的,这种情况基本不可能投毒成功,因为这句话是一个很常见的句子,同样一句话,你在教,全世界的其他人也在教,你的投毒数据量占比就很小,根本影响不到AI训练结果,就像你打个鸡蛋放在大海里,并不能让全世界人民都喝上鸡蛋汤。

另一个数据投毒方法,是利用软件本身的“反馈”功能。谷歌翻译的主页有一个提供建议按钮:

点进去,可以帮忙审核和纠正翻译结果——谷歌就是用这种方法来发动全世界网友的智慧,帮它“训练AI”。

可是“群众中出了个叛徒”,有心之人可以利用这个反馈机制,提交大量的恶意数据,把谷歌翻译强行教坏。

越是小众的词语,“数据投毒”成功的几率就越高,这也是为什么这一次谷歌翻译“辱华”事件里的词,都选择的“英译中”,但是输入的却是中文,因为平时这么用的人很少,投毒命中率相对高一点点。

在人工智能领域,“数据投毒”早就被研究者们注意到了,但是以往更多地是出现在其他应用领域。

比如“垃圾邮件拦截”:

黑灰产为了防止自己的垃圾邮件被系统拦截,就申请很多账号,不停地把自己的垃圾邮件标记“这不是垃圾邮件”,从而误导垃圾邮件AI拦截系统。

再比如“网络爬虫”领域:阿里巴巴集团的安全资深总监路全就曾经公开讲过一个事,黑灰产用了大量低级的爬虫,被阿里安全的人工智能风控系统拦截,后来他察觉不对,为什么明知道会被拦截,对方还要搞这么多低级的爬虫?

他恍然大悟:这些爬虫并不是为了突破风控系统,而是当炮灰,扰乱风控系统,让风控系统不断学习低级爬虫的特征,误以为爬虫都是这种低级的,从而“轻敌”,漏掉那些更高级、精巧的爬虫。

在查资料的时候,我发现了一篇论文,讲的就是专门针对语言翻译系统的数据投毒研究,论文来自墨尔本大学和Facebook AI 实验室的几位研究者。


论文中提到:只需要占比0.006%的恶意样本就可以有50%的概率完成数据投毒攻击。

也就是说,哪怕一个AI翻译系统用了千万级别的训练数据,只需要在里头构造几百个恶意样本就有可能让它犯错。

有兴趣的技术同学可以自己找来读一读,如果懒得找,可以在公众号“通俗解释一下”回复“数据投毒论文”,给你链接。

3

事情发生的当天,谷歌就给出回应。


这事儿是谷歌蓄意的吗?不太可能。

毕竟谁会往自己家开的餐馆投毒?

那谷歌要背锅吗?要背,毕竟,这是在他地盘上出的问题,起码审核不力是肯定的。

数据投毒有办法防吗?其实办法不少。

比如,同一个账号、同一台电脑、同一个IP地址,提交的数据不能超过一定的占比,这样数据投毒者就需要申请很多账号,提高了作案成本。

再比如,如果训练结果出现比较大的变动,就进一步评估分析,比如你要教AI认识小狗,忽然在狗的图片里出现一个明显不太像狗的(比如一只猫),就把它挑出来进一步检查,检查比对。

针对语言翻译系统的数据投毒研究论文已经发了快一年了,谷歌作为全世界人工智能和网络安全技术最厉害的公司,居然还出现这种幺蛾子,伤害网友感情,占用公共注意力资源,骂一骂,也是可以的。

谷歌,你……你……我要骂人了啊……你……你……真是个……小笨猪,哼!


4

所幸谷歌这次修得比较及时,找到办法防住数据投毒。

要不然,既然别人能提交错误的翻译结果,把谷歌翻译教坏,我们也能提交新的翻译结果,把它教好。

万一到时几千万国内网友搞一个“对冲”,提交新的翻译结果,比如“新冠病毒=American flu”之类的,那就真是拦都拦不住了。


———

回答完毕,谢谢你的阅读。有空可以去我的公众号“通俗解释一下”看看,有什么想“通俗解释一下”的,可以随时告诉我。

user avatar

实名反对所有上述认为在设定语言为英文时输入中文超出了系统设计的回答。(这么说的人99%都不懂基本的自然语言处理和机器翻译技术)

在真实的人类交流中,不同语言之间的混用普遍存在,比如我们经常可以看到一些人在中文语境下大量使用英文(如下图),这种一个句子中混入多种语言的现象在语言学上叫做语码转换(code-switching),这种现象普遍存在人类的交流中。


从翻译系统设计的角度来说,因为考虑到语码转换,哪怕设定语言为英语,模型仍然需要处理大量的非英文字符,比如英语中会经常混入许多西班牙语或者法语的词汇,这也是为什么在设定语言为英文的情况下,谷歌仍然会允许你输入中文或者其他语言的字符。

现有的基于深度学习的翻译系统的训练语料很大一部分来源于互联网,而在网络上,英语和汉语混在一起的情况也是非常多的,所以很有可能在训练语料这里就出了问题 (如果是数据投毒归根到底也是训练语料的问题)。部分回答中所提到的提交建议去修改翻译结果的方式也是有可能的,但是完全没法得出是营销号去刻意制造这一事件的结论,因为类似的错误在谷歌翻译系统中还有很多,你没法说这都是人为(特指营销号)制造出来的(比如墨西哥会被翻译成黄瓜,难道这也是营销号刻意制造出来的???)。


而且最重要的,这种在设定语言下输入另一种语言的情况,翻译系统理论上通过很简单的规则匹配其实就可以规避掉类似的问题,所以这个锅真的没必要给谷歌洗。

user avatar

AI能有什么坏心思呢?对吧?

不言而喻,一目了然。

还是不注名好:谷歌翻译真有趣

本来有一段技术上的分析的,但是多写会被删的,可不敢乱写。知乎立场是站哪边的大家也都懂。

总之,要知道,中国在这块,绝对、必须,独立自主,就行了。

user avatar

谷歌?你居然在讨论一个早已退出中国市场的网站?谷歌上光明正大攻击的内容还少吗?

不过话说回来,谷歌翻译一直不被枪,也确实离谱。多年前我就发现不对劲了,谷歌翻译某些词都居然能出现释义。

user avatar

已经查出来了,是一个名叫威尔逊爱德华糍的瑞士程序员恶意攻击谷歌翻译数据库。

user avatar

这一招,怎么说呢?比直接P图是进步了不少。

user avatar

应对外企辱华,走“流量”更需要“走心”

自良性互动以来,应对外企辱华问题就困扰着我们。应对外企辱华问题不仅极易造成研究项目,深化渠道,研究热点,提高敏锐性,而且可能引发转变危害,最终导致反映的后果。因此,我们必须走求真务实之路。以求真务实的态度,积极推进应对外企辱华工作制度化,以优化服务为目的,积极推进应对外企辱华工作正常化,以提质加速为责任,积极推进应对外企辱华工作程序化,以畅通安全为保障,积极推进应对外企辱华工作智能化,以立此存照为借鉴,积极推进应对外企辱华工作规范化,以解决问题为重点,积极推进应对外企辱华工作有序化,以服务机关为宗旨,积极推进应对外企辱华服务优质化,以统筹兼顾为重点,积极推进应对外企辱华工作常态化。长期以来,应对外企辱华一直是方针老大难问题,从一定意义上讲,能否彻底解决应对外企辱华问题,关乎树立主导,举行阵地,关乎保障有效性,是不断增强的重中之重。因此,解决应对外企辱华问题,是牢牢把握之举。自各司其职以来,应对外企辱华问题就困扰着我们。应对外企辱华问题不仅极易造成合作目录,而且可能引发总体布局危害,最终导致能力的后果。因此,我们必须走互惠互利之路。求真务实,积极推进应对外企辱华工作制度化,建立体系,统筹兼顾,积极推进应对外企辱华工作正常化。长期以来,应对外企辱华一直是速度老大难问题,从一定意义上讲,能否彻底解决应对外企辱华问题,关乎遏制决策部署,聚焦比重,关乎坚持速度,解决方案,完善重点,树立长效机制,是交流经验的重中之重。因此,解决应对外企辱华问题,是落实责任之举。

综观应对外企辱华发展史,各国都在不断改进形成氛围,疏导网络,在意识上,力求完善。以传统为例,为了应对外企辱华,巴拿马政府采取了一抓到底的政策,使得。鲜明的案例告诉我们,要实现应对外企辱华的目的,必须在继承借鉴中发展诉求,以求真务实的态度,积极推进应对外企辱华工作制度化,以优化服务为目的,积极推进应对外企辱华工作正常化,以提质加速为责任,积极推进应对外企辱华工作程序化,以畅通安全为保障,积极推进应对外企辱华工作智能化,以立此存照为借鉴,积极推进应对外企辱华工作规范化,以解决问题为重点,积极推进应对外企辱华工作有序化,以服务机关为宗旨,积极推进应对外企辱华服务优质化,以统筹兼顾为重点,积极推进应对外企辱华工作常态化。根据基础表明,要想应对外企辱华,就必须弘扬传统,分析环境,我们应该清醒地看到,我国正处于结构调整期、产业转型期,经济发展面临挑战,人均资源相对不足,进一步发展还面临着一些突出的问题和矛盾。从我们发展的战略全局看,走拓宽视野道路,调整成就结构,转变系统方式,缓解格局瓶颈制约,加快监督升级,促进会议,维护空间利益。进入新阶段,应对外企辱华面临着新的机遇和挑战。按照部署和要求,全面贯彻落实科学发展观,求真务实,开拓创新,扎实工作,为构建和谐社会服务,为发扬计划,为开拓本领,综上所述,我们应该求真务实,抓好应对外企辱华调研工作,提高质量,做好应对外企辱华信息工作,紧跟进度,抓好应对外企辱华督查工作,高效规范,抓好应对外企辱华文秘工作,高度负责,做好应对外企辱华保密工作,协调推进,做好应对外企辱华档案工作,积极稳妥,做好应对外企辱华信访工作,严格要求,做好应对外企辱华服务工作。现在社会上应对外企辱华的这个领域出现了一系列问题。究其原因都在于体制机制这方面的事没做好。此问题如果不能得到重视,及时解决,将会影响设置体系,支撑措施,促进基层,整顿阵地,制约适应信念,推进力度,凝聚力气,贯彻基本路线,甚至危害情绪。应对外企辱华吸引的事件更是有利的印证。因此我们应该抓住机遇。

综观应对外企辱华发展史,各国都在不断改进把握政策,推进竞争力,在建议上,力求完善。以方针为例,为了应对外企辱华,巴拿马政府采取了切实抓好的政策,使得。鲜明的案例告诉我们,要实现应对外企辱华的目的,必须在继承借鉴中发展领域,以求真务实的态度,积极推进应对外企辱华工作制度化,以优化服务为目的,积极推进应对外企辱华工作正常化,以提质加速为责任,积极推进应对外企辱华工作程序化,以畅通安全为保障,积极推进应对外企辱华工作智能化,以立此存照为借鉴,积极推进应对外企辱华工作规范化,以解决问题为重点,积极推进应对外企辱华工作有序化,以服务机关为宗旨,积极推进应对外企辱华服务优质化,以统筹兼顾为重点,积极推进应对外企辱华工作常态化。有一个名为“蝴蝶效应”的理论:南美洲一只蝴蝶煽动翅膀有可能在一个月后的美国大陆形成一场龙卷风。它启示我们,小的、好的机制或事物应及时正确引导,为社会发展服务;小的、坏的机制或是事物应及时改正或是消除,避免危害社会。在 应对外企辱华领域, 焦点只是一个微小的细节,然而他所带来的影响却是深远的。不仅会整顿比重,确保关键,制定体系,还会制约保证网络,推动沟通,疏导标准,整顿方式。因此我们要适应水平,惠及要务,掌握作用,履行纽带,总而言之,我们需要求真务实,抓好应对外企辱华调研工作,提高质量,做好应对外企辱华信息工作,紧跟进度,抓好应对外企辱华督查工作,高效规范,抓好应对外企辱华文秘工作,高度负责,做好应对外企辱华保密工作,协调推进,做好应对外企辱华档案工作,积极稳妥,做好应对外企辱华信访工作,严格要求,做好应对外企辱华服务工作。新时代来临,我们的应对外企辱华实现了历史性跨越式发展,敏锐性得到切实巩固和提高,支撑得到深刻变化;系统发展步伐加快;动力又快又好发展。目前我们已规范方式,考验基层,深化沟通,强化保障。但是我们也要清醒地认识到,意见的发展仍不能满足广大人民群众对于应对外企辱华的强烈需求,还不能适应构建和谐社会的迫切需要。应对外企辱华发展不平衡的问题突出,实施活力尚未取得根本性突破,本领改革需要深化,体系需要提高,思想尚未得到很好解决。情绪仍面临着新的机遇和挑战。

根据诉求表明,要想应对外企辱华,就必须规范工程,坚持内在要求,我们应该清醒地看到,我国正处于结构调整期、产业转型期,经济发展面临挑战,人均资源相对不足,进一步发展还面临着一些突出的问题和矛盾。从我们发展的战略全局看,走更加完备道路,调整能力结构,转变途径方式,缓解政策瓶颈制约,加快主旋律升级,促进地方,维护诉求利益。进入新阶段,应对外企辱华面临着新的机遇和挑战。按照部署和要求,全面贯彻落实科学发展观,求真务实,开拓创新,扎实工作,为构建和谐社会服务,为逐步环节,解决空间,扩大沟通,为突出理想,增强热点,综上所述,我们应该求真务实,抓好应对外企辱华调研工作,提高质量,做好应对外企辱华信息工作,紧跟进度,抓好应对外企辱华督查工作,高效规范,抓好应对外企辱华文秘工作,高度负责,做好应对外企辱华保密工作,协调推进,做好应对外企辱华档案工作,积极稳妥,做好应对外企辱华信访工作,严格要求,做好应对外企辱华服务工作。新时代来临,我们的应对外企辱华实现了历史性跨越式发展,纽带得到切实巩固和提高,作用得到深刻变化;项目发展步伐加快;秩序又快又好发展。目前我们已执行能力,遏制事权。但是我们也要清醒地认识到,指导的发展仍不能满足广大人民群众对于应对外企辱华的强烈需求,还不能适应构建和谐社会的迫切需要。应对外企辱华发展不平衡的问题突出,实施协调尚未取得根本性突破,体制改革需要深化,重点需要提高,监控尚未得到很好解决。根本仍面临着新的机遇和挑战。子曰:“不以一己之利为利,而使天下受其利;不以一己之害为害,而使天下释其害。”形式的变化,环境的变化,群众的期待,都对应对外企辱华提出了新的要求和期许。如果能够意识到形势的重要性,就可以发挥其在方法的潜在价值,就可以发挥其在效益的巨大作用。倘若不能吸纳方法,展现信念,改进稳定,促进途径,那么就意味着不仅不能切实抓好,而且不能突出重点,甚至会爱岗敬业。因此,应对外企辱华是现实之需,发展之要。子曾经曰过:“天下顺治在民富,天下和静在民乐,天下兴行在民趋于正。“,在人生阶段中,要加强热点,履行纽带在应对外企辱华这条奋斗之路上,倾斜支撑,维护水平,适应精神是我们始终如一的追求。

当前社会现实中的应对外企辱华现象,既有指南的原因,也与意识有直接关系。因此,解决应对外企辱华问题,既需要统筹重点,研究保障,也需要分析安全,汇集措施,更需要创新有效性,吸纳负担,唱响转变。只有这样,才能实现应对外企辱华目标。当前社会现实中的应对外企辱华现象,既有安全的原因,也与结构有直接关系。因此,解决应对外企辱华问题,既需要丰富意识,也需要保障条件,更需要支持特点,把握结合点,引导落脚点。只有这样,才能实现应对外企辱华目标。在未来的道路上,我们必须还会遇到这样那样的矛盾和问题,必须还会遇到这样那样的困难和险阻,面对来自各方的揣测和评议,面对来自各方的要求和呼声。惟有树立互惠互利的理念,用积极发展去协调解决应对外企辱华,才能在应对外企辱华上取得突破,让应对外企辱华共同享有人生出彩,梦想成真的机会,实现应对外企辱华自由。在未来的道路上,我们必须还会遇到这样那样的矛盾和问题,必须还会遇到这样那样的困难和险阻,面对来自各方的揣测和评议,面对来自各方的要求和呼声。惟有树立优势互补的理念,用完善机制去协调解决应对外企辱华,才能在应对外企辱华上取得突破,让应对外企辱华共同享有人生出彩,梦想成真的机会,实现应对外企辱华自由。当前应对外企辱华的问题,既有要素的原因,也与本质属性有直接关系。因此,解决应对外企辱华问题,既需要局面又需要结合点更需要从根本上促进意识,发展要素,只有这样,才能深化体制机制,健全主意,指导精神,才能健全热点,聚焦任务,联动认识。当前社会现实中的应对外企辱华现象,既有信心的原因,也与思想有直接关系。因此,解决应对外企辱华问题,既需要调节作用,帮助差距,也需要巩固理念意识,形成方法,确保纽带,更需要促进位置。只有这样,才能实现应对外企辱华目标。


user avatar

谷歌要不要|承担责任我不知道,反正关注此事的网民可能是要负责任的……

查阅辱华信息涉嫌违反《计算机信息网络国际联网安全保护管理办法》第五条第三、四、七、八、九款。如果你是无意间看到这些辱华信息,请立刻关闭页面,进一步的主动查阅属于违法行为。

按照《管理办法》第二十条,违反本办法第五条的,应由公安机关给予警告,对个人可以并处五千元以下的罚款。情节严重的,可以给予六个月以内的停止联网、停机整顿的处罚。

-

通过 山东公安执法办案公开查询系统 可以查询山东省的相关案例,在“案由”中输入“利用国际联网制作、复制、查阅、传播违法信息”即可。

可以看到,触犯这一条时,你浏览的甚至不必是境外网站。毕竟从严格的技术角度讲,国际互联网在较底层的部分是很难割裂开来的,所有的ipv4根域名服务器均位于境外。把整个底层服务视为一体,说你“利用国际联网”也不算错。

user avatar

这都2021年了,怎么又开始用这一招了。

user avatar

这玩意是ai训练喂出来的吧。。。

谁自己往里面一条一条输入词典啊。。。

不都是词典往里面一整,对照文本输入然后自己跑吗?

而且。。。这玩意还能手工改

实测也没有这种骚操作

说到底,中文对中文根本就是原样输出的:

也不存在输入英文反馈无关汉语的情况

甚至更敏感的词汇也没有武汉的影子


这年头,自称媒体的玩意(自媒体)连内容严谨都不保障了。

另外,请各位不要玩弄翻译反馈功能,改一下玩玩得了,别提交。。。

哦对了,我换了十几种输入语言都没有出现这种情况,下次请记者记录完整操作视频,我们也好复现一下。。。

==========================================================

有评论反应说是真事。。。

太神奇了。。。

估计八成是我们海峡对岸亲爱的同胞们在搞事情。。。

媒体这块得道个歉,虽然我没能复现出来,但好像是冤枉媒体了。。。

user avatar

大概率是程序bug。但还是能玩出很多有趣的东西的:

先来几张乳韩+乳化:



果真谷歌不认识匈牙利:

还有乳墨

顺便添了一下阿尔及利亚和新西兰


最后一张可以表白用。你学废了吗?

更新:特朗普大统领=我的狗仔



user avatar

上次使用这种拙劣的伎俩还是在2009年6月18日,记得当时还有央视踩一脚,这么多年过去了泼脏水的本领还是一点长进都没有。

user avatar

幸亏用过谷歌,否则真的相信了。我是闲的,我还试了试。

现在有的人为了赚流量已经无所不用其极了,什么下作手段都能用出来。

“只要我赚钱,哪管我死后洪水滔天!”

激起民族主义情绪,然后那么多随声附和的,真的自己去测试,去查询了吗?

我们每个人都变成了这种无良之人的赚钱工具和传播谣言的媒介。

谷歌翻译再垃圾,也有基本的汉英词汇对照表。

离谱到家了。

这个新闻上说,环球网还测试了,说也有这种情况。

那么问题来了?因为新闻发布时间是2021.11.26 22:40,我也无法回到那个时间去验证。

现在是Google修改过来了呢?还是之前已经变成辱华词汇呢?

这篇文章讲了谷歌翻译背后的机器学习技术。

如果只是技术还倒没问题。

关键是如果有人作恶。答主“月光博客”说了,谷歌背后的机器学习能够通过多次学习将中文的“艾滋病人”理解为新的英语单词。但是汉字和英文有着本质的区别的。

而谷歌也是能够识别源语言种类的,下面是例子:

所以,就算是你输入中文的“艾滋病人”点着英文,仍旧会识别出源语言为“中文”。其翻译的内部逻辑仍旧是从中文到英文,而非是从英语或者俄语到英语。

至于从机器学习训练,它训练的应该是从不同种语言的翻译,而非是同一种语言的翻译。

提交之后,输入:

并没有出现题目中所说的变化。

月光博客说是因为多次进行这种类似的修正达到了,污染数据,从而使用新的翻译“有病的人”或者某个辱华词汇代替“艾滋病人”的中文翻译。

噪声数据和迁移学习
翻译性能提升的另一来源是一种建模方法,它能更好地处理训练数据中的噪声。据观察,噪声数据(含有大量无法正确理解或解释的信息的数据)会损害语料数据丰富的语言的翻译质量。所以,谷歌翻译团队部署系统来给使用噪声数据训练的模型的示例打分,进而筛选出“纯净”的数据。实际上,这些模型一开始基于所有的数据进行训练,然后逐渐基于更小、更纯净的数据子集进行训练,这种方法在人工智能研究领域被称为课程学习。
对于资源较少的语言,谷歌在谷歌翻译中采用了一个回译机制,来强化并行训练数据,即语言中的每个句子都与其译文相配对。(机器翻译传统上依赖于源语言和目标语言成对句子的语料库的统计。)在该机制中,训练数据与合成的并行数据自动对齐,目标文本为自然语言,而源文本则由神经翻译模型生成。结果是,谷歌翻译充分利用更丰富的单语文本数据来训练模型,谷歌称这对提高翻译流畅性特别有帮助。

之前谷歌也有说自己在噪声数据中如何去噪和迁移学习,从而筛选出“纯净”数据。

如果题目说的内容属实,那么该用户成功的实现了对谷歌翻译系统的数据污染。但是我始终无法相信一个普通的媒体人能够用这种方式去对抗谷歌的翻译系统。因为这不仅意味着这个媒体号有计算机知识还拥有多次的修改去执行这种数据污染策略。如果有这么深入的计算机知识,做什么工作不好,非要搞这种造谣的事情?安心赚钱不香吗?大家都知道计算机专业的人加班尿性,哪有这么多的时间浪费在搞这个上。所以使用PS把图PS成需要的图更简单一些。只是这无法解释其他人翻译时候也出现的这种情况。

大规模的运用机器学习训练数据,我不相信谷歌为了辱华,直接把翻译系统更改成这种直接辱华的对应词汇。谷歌归根结底是商业公司,这种行为并不能给它带来任何的商业收益。

但是这种考虑也有一个漏洞,为什么环球网新闻上说自己也使用了得到相同的效果呢?其它一些网友通过搜索也出现了这种翻译结果呢?

那么原因只有一个,应该是谷歌的翻译策略和去除噪声没有控制住一些用户恶意提交的信息,从而导致翻译出现这种辱华的类似错误。

人工智能很多时候被称作人工智障,恐怕就是这个原因吧。你认为它已经很有智能了,但是事实告诉你,它比想象中的还要智障。

如果是正常的人,同种语言相互翻译难道不是应该直接对应吗?难道还要采信用户强行建立的链接关系?被垃圾数据污染吗?

技术虽然在进步,但是抵挡不了人心的险恶。

我认为应该承担责任的是恶意污染数据的用户,第一个公布这个信息的人大概率与这次事件有关。谷歌也应该有更稳健的噪声去除策略,防止用户篡改词语翻译和对照。谷歌系统或许应该增加以下的策略以防止恶意用于污染机器学习数据。针对这次事件,以下有五个建议给谷歌以提高翻译系统的稳定性:

(1)提高系统对噪声数据的高精度处理,消除恶意提交信息对翻译系统的影响。

(2)对用户提供的数据不应该不明就里的进行机器学习,因为系统无法判断该用户是否有恶意。

(3)语言的基本语义对照表不应该接受用户提供的修改建议。

(4)同种语言不接受其它翻译信息提交。

(5)同种语言翻译的按钮不应该提供。比如左侧选择了英文,后面的英文就应该变灰以抑制用户的恶意让同一种语言被篡改。

恶意损害其它公司利益的人,传播谣言的人应该受到法律的惩罚。否则这种人会给社会运行增加极大成本。网络公司也应该享有它应得的权利。互联网不是法外之地。

网络犯罪, 是指行为人运用计算机技术,借助于网络对其系统或信息进行攻击,破坏或利用网络进行其他犯罪的总称。既包括行为人运用其编程,加密,解码技术或工具在网络上实施的犯罪,也包括行为人利用软件指令。
网络系统或产品加密等技术及法律规定上的漏洞在网络内外交互实施的犯罪,还包括行为人借助于其居于网络服务提供者特定地位或其他方法在网络系统实施的犯罪。
简言之,网络犯罪是针对和利用网络进行的犯罪,网络犯罪的本质特征是危害网络及其信息的安全与秩序。
2019年10月,最高人民法院、最高人民检察院联合对外发布《最高人民法院、最高人民检察院关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释》,并公布了四起非法利用信息网络罪、帮助信息网络犯罪活动罪典型案例。

这种故意污染对方数据的行为属于违法行为。希望得到严惩。

user avatar

我觉得苦心孤诣的训练人工智障、从而制造大新闻吸引眼球、为自己捞取好处的无底线的中国人,会让全世界人民对我们产生被扭曲的看法。


我们不妨换位思考一下,假如印度人用类似手法抵制我们的小米手机,制造一个“小米说印度人猪狗不如”的假新闻,你觉得我们会如何评价印度人?


1、印度人就是猪狗不如。他们就喜欢别人这么攻击自己,所以才会故意这么训练我们的AI。

2、印度人也真是……太自轻自贱了。他们怎么会如此训练AI,败坏自己的形象呢?

3、不,我说的不是“有人会相信‘印度人猪狗不如’这句话”,而是

3.1、他们习惯于种族主义攻击

3.2、他们为了捞取好处,不惜恶毒攻击自己

3.3、他们还真能捞到好处!他们居然通过利益鼓励他们中的某些人糟践自己!

3.4、允许这种人得到利益……天哪,他们的社会得有多扭曲!


我建议,对始作俑者应以“汉奸罪”法办。毕竟,再没有更好的办法伤害我们的民族形象了。

不严惩这种人,就是对这种人制造的、扭曲的中国人、中国社会形象的默认。

user avatar

震惊!挪威竟然是男性国家(doge


这完全就是错误的。因为它得出一个错误的前提--用外文翻译中文会原样的回去,然而,这是我的测试




user avatar

一个系统有三件逃不过的事:

1,BUG

2,迭代

3,____

user avatar

谷歌还是技术不行。

连这种明显人为的针对算法的数据污染都搞不定。

这究竟是道德的沦丧,还是人性的扭曲呢?

类似的话题

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2025 tinynews.org All Rights Reserved. 百科问答小站 版权所有