百科问答小站 logo
百科问答小站 font logo



只需4组数据,还原你的购物模式,具体算法是怎么实现的? 第1页

  

user avatar   Ivony 网友的相关建议: 
      
其中包括了来自某个经合组织国家的110万人在1万个商家的消费记录。这份数据集很简单,只有用户ID、支付数额、精确到天的支付时间和精确到商家的地 点,而没有明显的身份信息,没有电话号码,没有姓名,也没有住址。但是即便如此,通过对消费空间、时间和消费能力的对比,他们还是能够将消费记录和某个用 户ID对应起来。

这种问题只要多搜搜,多看看自然就明白了。

虽然我一看到这种媒体哗众取宠的标题就已经猜到是怎么回事儿了。


简单说就是如果我有一个很大的消费记录,其中记录了用户ID、支付数额、支付时间和商家,然后我只需要知道你这个具体的人几笔准确的消费记录(包含数额、时间和商家),我就可以从这个大数据中间把你和某个用户ID对应出来,从而得到你全部的消费记录。

看吧,没有任何神奇的算法,只是一个事实的阐述,而且这个事实我老早就知道了。




  

相关话题

  数据分析师(非数据挖掘,偏业务)是青春饭吗? 
  如何证明快速排序法的平均复杂度为 O(nlogn)? 
  为什么同样是解决一个问题,别人就能想出算法,而我却绞尽脑汁,百般尝试也不得其法? 
  正负样本极不平衡的问题? 
  什么是 hash? 
  阿里巴巴等互联网公司利用用户隐私做大数据调查是否合法? 
  如何理解马氏距离,多维Mahalanobis距离是否要用到“互相关张量”来进行描述? 
  在知乎你见过哪些明显抱团点反对的问题,对社区有怎样的影响,你有什么好的建议? 
  国内目前的量化交易是否很少涉及到机器学习? 
  怎么避免写Java风格的Scala代码? 

前一个讨论
外国人会给手机套壳、贴膜吗?
下一个讨论
如果人民币兑美元汇率下跌,普通人如何保护现金?如何保护持有资产价值?





© 2024-05-19 - tinynew.org. All Rights Reserved.
© 2024-05-19 - tinynew.org. 保留所有权利