百科问答小站 logo
百科问答小站 font logo



算法源于大数据,而大数据源于我们每一个人,那我们是不是应该拥有主导数据的权利? 第1页

  

user avatar   yao-dong-27 网友的相关建议: 
      

我们姑且认为每个人产生的数据属于个人财产,每个人拥有对自己的数据的所有权和使用权。

但是保管和使用财产不是零成本的,比如 你通过工作赚取了一些钱,这一叠叠钞票你要保管好,需要找个安全的地方,不能受潮,也不能有起火风险,更不能被别人偷了抢了,这都需要付出成本。

数据财产也一样,要存储,要备份,要保持完整性和正确性,都要成本。

你愿意支付这些成本才能拥有对数据的权利,零成本的权利在任何时候任何地点都不曾存在过。

那么我干脆不要这些数据好了,自己的财产总有自己抛弃的权利吧,对不起,抛弃数据也不是零成本的,就像现实中仍垃圾还要交垃圾清运费呢。

删除数据也要支付数据清点,确认,擦除的计算成本。

除了极个别的人,大多数人都会发现,自己拥有数据是亏本的,支付了存储和计算成本,但是无法产生收益。

未来大多数人都会选择出让数据的使用权给某个组织或公司,只保留所有权,以便在某个必要的时候删除或回收数据,但是出让的这部分使用权应该有权利获得一定的收益,就像存钱到银行应该有利息,因为存钱到银行就是出让钱的使用权,但是保留对钱的所有权,银行对获得的这部分所有权支付租金,也就是利息。

目前以BAT google facebook等为代表的互联网公司,他们相当于用少量存储计算的成本获取了很多人的数据的使用权,又利用这些数据去盈利,但是没有给数据的所有者分红。

未来合理的模式既不是禁止企业存储用户数据,也不是让用户放弃对数据所有权,而是把数据作为一种财产,用户有所有权,可以把使用权出出租给企业,然后从企业获取数据的租金。

实际操作中比较麻烦的就是给数据定价问题,但是这个可以交给自由市场,经过长期博弈最终会确定一个合理价格。谁给的收益高,就把数据给谁用,对于收益低的企业用户就行使被遗忘权回收数据的使用权,政府和执法机构只需要保障被遗忘权,以及用户获取合法数据收益的权利即可。

经过了长达数百年,银行和储户之间对于货币的使用权,所有权和利率的博弈已经达到了基本的均衡点,银行业的利润率基本在合理范围。互联网业甚至整个和数字财产相关的行业也要经历这样一个过程。


user avatar   eric314 网友的相关建议: 
      

财富源于劳动,而劳动源于我们每个人,那么我们是不是应该有权……

打住!年轻人,你的思想很危险啊!


user avatar   divinites 网友的相关建议: 
      

@王瑞恩 邀请。大数据所搜集的是一种特殊的信息,虽然它的生产者是垄断的——比如我在网上购书的记录显然只有我自己能够产生出来,别人产生的和我肯定是有区别的。但是生产者本身并没有多少讨价还价的能力——“我”因为需求而去购书,如果我拒绝把自己的偏好信息透露给网站的唯一手段,就是不去购买这本书,而这样的话,自己的需求又得不到满足。从这个意义上说,尽管信息是自己产生的,但是自己并没有天然的理由要拥有数据的主导权——毕竟是自己为了满足需求而主动做出的购买,而自己在购买的时候就应该知道信息会传递给商家。所以,声称“我的信息我做主”是站不住脚的,因为消费者如果愿意的话,完全可以不购买任何东西,不显示任何偏好,也就不会有任何的泄露了。所以这个答案,我主要从效率上来分析,到底谁来主导对社会更有利。


经济学其实就依赖于这种显示出来的偏好来决定消费者的“效用”大小。比如有两个选择:苹果和香蕉,都在我的预算所能达到的范围之内并且代价相同,那么我选择了苹果,而没有选择香蕉,就说明了苹果给我的效用,大于香蕉给我的效用。


也就是说,我购买苹果这个行为,就揭示了我内心的偏好苹果>香蕉,这就是经济学中的“显示偏好原理”。


在模型中,我们可以假定消费者这一次购买和下一次购买毫无关系,还可以假设每个消费者的偏好都是正态分布的,互相之间独立。如果是这样的话,大数据与否根本无所谓,因为所有的都是随机的,上一次的消费信息对下一次的消费信息没有任何的指导作用。


但是问题在于,这个假设是不符合现实的。事实上人们的消费具有时间关联性,人和人之间也有关联性。这样的话,大数据会根据这一次购买的所显示出来的偏好,而去推断消费者下一次购买所显示出来的偏好。这样的话,相当于商家获得了一点信息优势,故而可以在生产和消费所产生的总剩余中,拿到更大的份额。


但是商家真的能拿到更大的份额吗?其实还真未必!我们要看到,现在大数据所带来的红利,很大程度是消费者没有被市场充分教育的结果——也就是消费者其实还没有意识到自己数据被商家利用的后果。比如说,很多人经常谈到的“大数据杀熟”——如果我知道你喜欢吃草莓,那么你一次次买的越多,我就一次次增加一点单价来赚取更多的利润;如果我知道你特别想要从北京到上海的飞机票,那你搜索一次我就涨一点价格……诸如此类。


如果消费者充分认识到了这一点,消费者会怎么做呢?本来我想买10公斤草莓的,我可能就只买8公斤,这样下次可以便宜点;本来我想买一堆书的,但是怕书店知道我喜欢看书所以涨价,所以我会卖少一点…… 这样的后果就是消费者会主动的扭曲自己的消费,混淆自己的信息,让大数据分析出现误差,从而自己能从中谋一点利益;结果就是商家利用了扭曲的信息进行大数据分析,得到的是扭曲的结果所以无法最优定价;而消费者展示出扭曲的偏好,也没有达到自己的最优消费组合。


换句话说,消费者和商家通过商业交易而共同创造的这块饼变小了。也就是商家尽管利用了消费者的信息,但是结果反而让商家和消费者变得比以前更差了。


怎么来解决这个问题呢?有两个很直观的办法:一是商家主导信息,但是商家做出可信的承诺,不利用消费者的信息;二是让消费者主导信息。


这两种情况下,当“商家利用信息”本身一定会给消费者带来损失的情况下,达到的效果是一样的;而如果如果我们假设信息有好有坏,有些时候消费者可能希望商家去记住自己的一些偏好,那么显然,答案就很明显了:让消费者主导自己的信息,决定哪些暴露给商家,哪些不暴露,就是更好的选择。这样不仅对消费者有利,对商家也是有利的。


具体在隐私保护的架构上,淘宝模式——销售端和服务端分开的模式,其实要好过亚马逊模式——销售端和服务端整合的模式。因为在第一种模式下,淘宝平台和商家是独立的经济体,消费者的地址和偏好信息会被记录在淘宝上,但是淘宝本身可以作为用户隐私的防火墙,听从用户的指挥,决定是否把偏好披露给商家——比如如果消费者选择“匿名购买”,那么商家只会知道自己卖出了多少东西,但是并不知道具体是哪位消费者购买的。


而在亚马逊模式下,因为销售和服务是一个公司提供的,那么亚马逊就需要接受更加严格的监管,做出更加可信的承诺才能让消费者确认,自己没有也不会滥用消费者的隐私。


最后,在消费者隐私这一个领域,其实区块链这个技术还是有一些可贵的性质,有可能成为一种可行的解决方案的。因为无论把隐私托管给哪个中心化的提供商,无论是淘宝、京东还是亚马逊,都会存在一个道德风险和信任的问题;而区块链恰恰是解决了去中心化的信任,可以在一个无人做超级管理员的网络下,让消费者本人可以直接控制自己的隐私信息的披露。


user avatar   wang-xi-65-12 网友的相关建议: 
      

谢邀 @王瑞恩

回答问题之前,我要先吐槽一下问题本身。这个问题的描述对概念的混淆和滥用很严重,结论也没有任何道理。

  1. “大数据”的定义,一般认为是具有 5v 特性的数据(数据量大,速度快,多样性,真实性,价值密度低)。但互联网公司对客户的备案数据不是这样的,这是系统化的数据。
  2. 算法可以定义为表示成有限长列表的有效方法。也就是说,算法是一个序列,一个问题处理的方法。算法源于数学,有没有大数据对算法没有任何影响。
  3. 大数据的来源广泛,长江各流经地的水质也可以属于大数据,这也是来源于某个人吗?人类观察处理的数据里,人类产生的数据只是一部分。
  4. 数据来源于一个人,这个人就应该拥有主导的权利,这个逻辑也不通。
  5. 最后,一个互联网从业者没有必要信奉一个历史系教授在大数据和算法方面的论断。

其实这个问题归根到底,就是一个数据管理问题:

为了更好地为用户服务,企业需要获取用户的个人信息。但个人信息的泄露,可能会对用户带来安全隐患。因此用户是否应该有主导自己信息的权利。

下面我从密码学的角度试着回答一下上一段黑体字的问题。


在密码学早期,密码学家的研究重点是如何让加解密更高效,密文的长度和密钥的长度更短,破解的成本更高等。但近二三十年,使用者的便捷性和信息的保密性一起被考虑了。越来越多的密码学家开始探究:如何在不泄漏用户信息的情况下完成用户的要求?

试想一个简单的场景:你把一大堆文件存到了云盘。基于保密的特性,你会加密后再上传它们。现在你需要下载《哈利波特》,你应该怎么办?

如果是最原始的加密,那么你唯一能做的就是把所有文件下载下来,全部解密,再搜索“哈利波特”的关键词,找到你要找的文件,再删除其他文件。

似乎很麻烦吧?这个时候你就会想:能不能在一堆加密的文件中直接搜索特定的关键词呢?

答案是可以的,这就是搜索加密技术。自 2000 年这项技术被提出,很多密码学家在这个方向做了大量有价值的工作。

再想象另一个场景:你现在有一大堆数据,你把它们加密存储到了云盘。你现在要计算它们所有数的平均数,你应该怎么办?

以前,你只能全下载下来,解密,再计算。

这时候你就会想,如果云端有 a 和 b 的密文,就能算出 a+b 的密文,那这个加的过程岂不是可以让云帮我做?如果云端有了 a 的密文和 n ,能算出 a/n 的密文,那岂不是直接就可以传给我答案了?

答案是前者很容易,但同时能做到很难。能够直接通过密文计算明文的加或乘的技术,称为同态加密。支持其中一种运算的加密方式称为单同态加密,同时支持这两种运算的加密方式称作全同态加密。单同态加密很好实现,但目前为止,还没有高效且安全的全同态加密方案。

类似的场景还有很多,密码学家通过密码技术,设计出各种兼顾安全性和便捷性的密码方案和安全协议。在可以预见的未来,这些方案逐渐落地,信息的采集可以只包含密态的数据,而云端通过密态数据的特性为我们提供服务,这在很大程度上解决了个人数据管理的问题。


user avatar   wang-rui-en 网友的相关建议: 
      

法律工作者已经在试图回答这个问题了。

例如,欧盟《一般数据保护条例》明确了“被遗忘权”(Right to be forgotten)。当个人数据已经过时,不再属于满足一开始获取时的合法目的所必须,或者数据提供者撤回了最初提供数据的授权且无合法理由继续保留数据时,个人有权要求掌握数据一方删除或不再使用该数据。

可以想像一个场景:唐某十年前在某招聘网站上传简历,授权网站基于简历中的信息为自己推荐岗位,该简历中包含自己从事销售员的信息。后来,唐某前往美国名校深造,时来运转,摇身一变成为职业经理人。如果适用《一般数据保护条例》,那么唐某或许可以要求招聘网站删除自己所提供的信息。这样看来,唐某的确可以“主导”网站用于提供个性化服务的数据。

--

但类似的法律适用范围依然非常狭窄。每天,我们都在无意中产生大量数据,却既不知道数据被如何使用,也不知道自己能够主张何种权利。

例如,出行软件可能会使用我们的位置信息,来决定是否上调某一区域的叫车价格;类似地,地图软件也可能基于用户的位置,判断道路拥堵情况。这些使用方法,可能包含在软件使用协议里,但不具备专业知识的用户可能无法理解。

--

不理解,尚且可以通过合同法获得法律救济。如果服务提供商对数据的使用超过了用户协议所约定的范围,或者滥用格式条款、迫使用户接受显失公正的数据使用方式,那么可以基于合同法提起诉讼。

但有的时候,数据的使用方,或许和数据的提供方并不存在法律上的关联。

例如,某设计公司通过分析合法途径获得的街景照片,分析行人服装样式,判断当季流行趋势。路人和公司之间并不存在权利义务关系,无从在法律意义上“主导”设计公司对“衣着数据”的使用。

--

法律无法给出回答,可能是因为立法者是大数据时代的“移民”,法律制定所依赖的土壤,依然是我们更加熟悉的“小数据时代”。

何为“小数据时代”?再举个例子:年纪大一些的朋友可能还用过电话黄页,里面收录了商家和各类机构的联系方式。立法者对黄页中的数据并没有迟疑,可以很清楚地回答:黄页的编纂者并不享有著作权,因为整理收录公开信息并不能体现原创性。对于电话号码和地址这样的“小数据”,立法者在界定权利方面没有丝毫迟疑。

但到了大数据时代,问题就不这么简单了:有的网站,可以海量抓取公司的工商登记信息、涉诉信息、在媒体上的曝光记录等,基于算法对公司的的信用给出评分。对于这样的大数据版“黄页”,制作者是否享有著作权?基于算法给出的评分,能否体现独创性?这些问题,小数据时代的法律就难以应对了。

--

很遗憾,我无法给出明确的回答,只能和提问者一样,对未来继续怀有好奇与期待。

--

(注:回答中提到的人物和机构均为虚构,其中有的技术手段,以我的知识范围无法确定在现实中是否存在,仅仅是一种想象。)


user avatar   YJango 网友的相关建议: 
      

人类并非首次遭遇该问题,它在历史上循环出现,这次是大数据版本。

先理一下算法、数据、模型、财富、货币的关系。

设想:

某区域有独自生活的 4 个人,每人都面对着低效率和高不确定性。于是决定共同生活,分别负责采果实,搭住所,狩猎,打水。每人的技术因可累积更多经验而慢慢提升,繁衍成了村落。为解决以物换物的不便,大家用一堆贝壳代表所有人创造出的物资,通过贝壳来交换。


随后,采果实技术变成了种植,搭住所变成了造屋,贝壳成了金币。又产生了新的工作,也有了以偷金币来更“高效”获得物资的“巧取者”。大家对“巧取者”会进行惩罚。


人们也慢慢知道了技术的重要性,愿意为技术人员提供物资,让其专心研究高效技术。但巧取者也发现可以行骗。不过在大家意识到之后,也予以惩罚。

更丰富的物资让人们有了思考时间。除了从经验归纳得到的技术外,又产生了从理论推导的科学。也逐渐发现自己没那么神奇,身体机能都是为了更好的生存而进化出来的。

  • 恐惧保持人们远离未知
  • 好奇心让人们有获取经验的动力
  • 性欲让人们繁衍
  • 食欲让人们获取能量

于是,

  • 巧取者发现了一种叫做大麻的天然植物,作为商品,跟大家交换物资。既没偷,也没骗,但却利用了人脑的愉悦。大家意识到之后,禁止并严惩。
  • 巧取者也制作爱情动作片,作为商品,跟大家交换物资。既没偷,也没骗,但却利用了人脑的性欲。大家意识到之后,禁止并严惩。
  • 巧取者也创办黑心培训机构。没有教师资格,只骗来学生再送走,也没偷没骗,却利用了人脑对未知的恐慌。城里人不上当,但不富裕的家庭却难以意识到,饱受其害。
  • 可查看 什么是商业模式? 中的详细列举。

如今,

  • 物资变成了财富
  • 经验变成了大数据
  • 技术变成了模型
  • 部分技术人员变成了算法

不过人类都是在让从经验中获得知识,巧取者也一样。为什么会被禁,被惩罚,不劳而获了吗?没有,他们付出了劳动,还从经验中总结各种知识。区别在于大家是用从经验中提取的知识向大自然那里获取物资,而巧取者是用知识从别人那里获取物资。做的是单纯的财富转移。如果 4 个人组成的村子里都是“巧取者”,都想着怎么从别人手里把金币骗来,没人创造物资,所有人都会饿死(有些财富的转移是为了创造更大的财富,和单纯的财富转移不同,比如银行投资)


数据本身无法创造财富。算法+大数据可获得知识,知识可提升效率,可用相同能量创造更多财富。我们一直都在积累从数据中所提取的知识,也一直都在共享着知识带来的财富。但知识却也分很多种。开锁知识,针对人类行为特点盗取密码的知识,这种知识没有创造财富,只是把财富从某人手里转移了出来,有人变富,必有人变穷。


人们无法阻止巧取者去研发新转移财富的技术,他们总会有办法获得数据。电信诈骗总能获得精准个人信息。这是一场永恒的战争,双方都在提升技术,彼此过招。但巧取者被发现了之后,总会被禁掉,因为曾经巧取者都是小群体,是人见人打的过街老鼠。


而如今最让人担忧会变成巧取者的,恰是超级大公司。

因为只要他们想,就能轻而易举的用算法从人们日常生活的大数据中提取针对人脑特性(好奇心、懒惰)设计出“产品”跟大家“交换”物资,让大家毫无察觉之下自愿交出自己劳动所创造的财富。既然是转移底层人民劳动所创造的价值,当被发现时就可以采取巨额罚款,这也是欧盟颁布 GDPR,在政策上的做法。


不幸的是,虽然识别哪些公司利用了人脑的特性、人类行为特点来进行单纯的财富转移并非难事。可以识别出来后就给予巨额罚款。但困难的就是当太多人已经吃到了甜头,利益链条错综复杂的时候,很多人不愿意去改变现状。这时,单从政策上,技术上采取措施是难以改变什么的,因为没人想要推动。

这就是很多人都清楚的,这个问题的答案:争取主导数据的权利?当然应该,但无效,想用数据坑你还是坑你。


然而这并不是说无解了,克制巧取者至关重要的一点就是让大家意识到。在大家未意识到之前,行骗,鸦片,动作片,非法集资,洗脑传销,庞氏骗局,电信诈骗都曾明目张胆的出现在市场上。只有意识后才被禁掉的(仍然有些无法被人们意识到)。然后我们会告诉所有人不要相信陌生人所说,不要轻易给别人转账(仍然有人深信传销)。


过去巧取者利用天然鸦片,但现在的巧取方式越来越高明,都不需要天然植物,直接就可以人工制造出个性化的精神鸦片,根据人类进化出的特性来精准攻击。


除了政策和技术(传销被政策打击也仍然猖狂),最有用的还是提高大家的认识,让大家知道AI 可以做什么,能够识别哪些 AI 产品是有益的,哪些会利用 AI 为你设计精神鸦片。只有当大家都意识到之后,巧取者才会被禁掉。然后我们在大喊“不要乱给别人数据”时,大家才会听。


看完尤瓦尔·赫拉利的书后,想了很久该如何应对该局面。于是就想,可以提升所有人的意识,让大家都懂 AI 能做什么,如何做,分享我知道的一切,不仅仅是机器学习知识。很多人觉得蠢,没钱,没用,别人学会了反而来竞争,我非常清楚这些,但也依然这么做。因为我知道整个村子是由所有人支撑的,我的寿命不过几十年,此后还有人要在村子里生活。

巧取者不是大数据时代才有的,公平也是人们创造的名词。有些人也根本不担心,因为他们是那 1%,与其相信别人会想出完美的政策保护自己,不如努力让自己成为那 1%。




  

相关话题

  现在有厂商给企业做安全培训吗? 
  从杭州走的时候你是怎么想的? 
  出租人租房给承租人,算不算出租人为一种处分行为? 
  山西一老板为 252 名货车司机伪造核检报告获刑 1 年半,如何从法律角度分析这一判决结果? 
  有哪些法官的遭遇,没有做过法官的人不会相信? 
  腾讯、阿里巴巴、字节跳动、小米、快手等多家企业捐赠驰援河南,有哪些值得关注的信息? 
  HTML模板放在国外服务器,API服务器放在国内,这样可以在不备案的同时提高国内用户的访问速度吗? 
  「女医生遭网暴自杀」案宣判:三人煽动网暴致人亡,分别以侮辱罪获刑一年半、一年、半年。哪些信息值得关注? 
  国内为什么没有好的 Stack Overflow 的模仿者? 
  上海市消保委约谈「加拿大鹅」,此举将会对「加拿大鹅」产生何种影响?消费者遇到类似事件该如何维权? 

前一个讨论
藏獒价格为什么断崖式下跌,有的地方据说都被端上了餐桌?
下一个讨论
跳伞和蹦极哪个更令人感觉害怕?





© 2024-05-16 - tinynew.org. All Rights Reserved.
© 2024-05-16 - tinynew.org. 保留所有权利