这个问题算是社交网络研究的一个热点,从用户的文本信息去判断用户的性格已经比较热了,加入图片的信息相信可以使最终的判断更加准确。而用户的性格研究可以使商家更加精确的针对用户画像,从而个性化的定制产品。我就从数据挖掘的角度来分析下如何处理这个问题吧,多多指教,大致的框架如下:
处理这个问题所需要的数据主要分为两部分,第一部分是咱们的主角:用户的头像图片信息,第二部分是用户的性格信息,这部分信息现在绝大数的paper显示主要是用问卷调查的方式从用户侧收集信息从而判断用户的性格。当然也有比较创新的直接收集用户的社交网络信息,包括文字,分享等等来判断用户的性格,因为这一块儿领域相对图片判别性格较为成熟和直接。
现在主流的图像特征提取包括下面这几类:
前三种feature的好处是比较粗犷,效率较高,而且深度学习的表现也确实很牛,但是短板的是解释性较差,最后一种需要手动的去创造feature,例如人物的表情识别还需要额外的算法(例如Face++ )去做,但是好处也显而易见:最终模型的解释性较好,可以清楚图片中的哪些因素与人物性格的关键点相关。
用户的性格模型,现在大多数的paper主要是使用了人格五因素模型(McCrae and John 1992),将人物的性格在以下5个维度中展开:
接下来不妨从最近的一篇paper看看这个领域的研究吧:paper《Analyzing Personality through Social Media Profile Picture Choice》。
数据来源是6.6万个推特用户的头像图片和他们发送的1.04亿条推文,用户的性格是用模型从他们发的推文中推断出来的。
以下是一些有意思的结论,使用户头像去推导性格成为可能,而且这块儿还可以做得更好。
用户头像的对比度,饱和度和锐度与用户的开放程度以及友善程度有关。
而用户头像越亮,色彩越丰富的用户可能更加友善。
头像图像中没有人脸的用户可能更内向,非友善。
用户头像中人物表情与性格的相关性。图像中人脸反应微笑和开心的表情与人物性格中的友善度,外向以及责任感息息相关。
最后是所有预测因子对预测结果的贡献,用户头像图片的类型(有人物与否和几个人)以及人物的面部表情是贡献最大的预测因子。
参考文献
你要是问我神舟坑毕业生的行径对不对,那肯定是不对。但你要问我为什么这种公司还能活下来,不涉及道德评判的说,就pc这种夕阳产业,越是黑心,越是不把员工当人的公司,才越有可能活下来不是吗。现在战神系列算是站稳了脚跟,神舟也算是个1.5线游戏本厂商了,再顺带压榨员工开源节流,有什么理由活不下去?