当前位置:极速赛车在线计划 > 电子科技 >

科学家用大数据探究行为背后的机理和因果关联

发布时间:2017-12-03 阅读:

  科学家利用大数据来探索行为行为背后的机制和因果关系

  我们发现大部分用户使用的手机壁纸软件都一样,一般浏览到第七页就会退出,这是通过大量的用户浏览时间,页面数据分析的七个规则。因此,如何让用户花费第七页的审美疲劳,继续留在软件中?软件开发人员需要思考的东西。最近,中国科学院计算研究所副研究员罗平在中国计算机学会青年计算机技术论坛组织的一次关于社交网络和大数据的重要学术会议上说。

  随着微信,微博,脸书,微博等在线社交平台的普及和广泛应​​用,用户可以随时随地在网络上共享内容和进行交互,产生大量的用户数据。用户在社交平台上的行为数据在一定程度上构成了现实世界的投影。因此,对社交网络和大数据挖掘的研究具有广泛的应用场景和深远的现实意义。

  目前,社交网络的研究和数据挖掘还处于相对较早的阶段。许多基本问题需要探索。有效的工程方法还有待解决。大数据背景下的罗平行为机制与解释挖掘报告这是一个尝试。

  探索行为背后的机制和因果关系

  社交网络分析和研究涉及广泛的领域,包括对社交网络本身演变的研究;社会网络结构分析,关系链挖掘,群体发现等;通过用户数据挖掘的多维三维用户肖像;并与社会学,传播学,行为科学,心理学等学科研究和分析社区的运作规律。

  社交网络研究的应用范围非常广泛,从事个人用户精确营销,个性化推荐以及新兴的社交AI(人工智能)研究。

  由于完整的用户行为数据通常是分布式的,因此可用于分析的用户行为只能反映一些碎片。因此,鉴于行为数据的不确定性和不完备性,我们更需要探索行为背后的潜在机制,探索可解释的行为因果关系。罗平解释了他的研究领域。

  什么是深度学习?这是通过将复杂的映射从输入转换成大规模的非线性实数来完成的。罗平说。目前的深度学习方法已经成功应用于自然语言建模的多种场景,如机器翻译,智能对话,关系抽取等。

  然而,随机变量的离散序列数据相同,人的行为也受到社会,心理,沟通等复杂因素的影响,但也表现出较大程度的不确定性。因此,罗平用不同的分析方法深入学习社交网络。

  深度学习不适用于所有情况,并且不适用于某些分析视角。仍然缺乏深度学习,特别是在语言和行为分析方面。罗平说。

  语言和行为都属于离散随机变量的序列数据,但有本质的区别。罗平说,比如,你一个人吃午饭就算了,即使缺少话语,机器也可以识别这个词的意思,而且准确性也很高。但是,不确定性的行为非常高,比如购买行为,很难从用户购买这个购买中推断下一个购买需求。

  消费者的行为是由一些复杂的因素决定的,包括心理学,交际学,社会学等因素,而许多消费者的行为是冲动消费的,与以前的行为没有逻辑关系,这是行为的第一个特征,就是非常高不确定性。罗平说。

  同时,行为数据还有另一个不完整的特征。消费者可能会使用很多购物软件。当我们分析行为数据时,我们可能只能得到一个网站提供的数据,但从上帝的角度来看,我们将无法学习到整个行为,罗平说。

  他说,数据散布在网络的各个角落,我们只知道所有数据的一个片段,这就增加了预测行为的难度,一方面我们只能对这些不确定性和不完整的数据进行分析,挖掘行为另一方面,在概率图模型的框架下,线上和线下行为的联合建模以及可解释行为之间因果关系的挖掘。

  七条规则

  通过用户在手机壁纸软件页面的时间长度,点击次数,喜好数字等数据序列分析,罗平发现用户浏览到第七页时,留下的可能性最大。

  什么决定了用户离开?罗平解释说,使用信息的整个过程是积累的过程,当信息积累到一定的门槛时,用户对信息的胃口就满意了,大脑下令终止浏览。就是用数学的方式来描绘这种看似主观的行为理解。

  用户在网上浏览的长度服从逆高斯分布,解释了用户是否继续浏览心理阈值模型的随机决策过程,罗平解释说。

  那么问题来了,提高图片内容和质量能否刺激用户,延长浏览时间?如果答案是否定的,则数据显示当用户点击五张图片时,翻页概率总是达到峰值。当他点击更多的图片时,翻页的概率会降低,但是高质量的内容确实可以增加转折点的页面概率,但是也有无与伦比的效果。罗平说。

  七条规则在高质量内容的前提下,应用程序设计师如何利用这些规则来设计内容?我们建议设计师特别注意内容位置的敏感点,用户离开的几率会增加几十倍,不要在这里放置平淡的内容和令人反感的广告,推送用户喜欢的内容,吸引用户。罗平说,不同的应用敏感点不一定在第七页,但这个位置必须存在。

  建议的SMS值可以增加30%

  在另一项工作中,罗平在分析用户的线下购物和在线搜索行为时发现,购买牛仔裤和耳环的人大多与游戏,大学等内容有关。搜索内容和购买意向的相关性确实很大。罗平说。

  尽管网购热,但据统计,目前中国90%的零售仍然在线下。罗平认为,行为分析的意义在于可以得到用户的一些在线购物搜索意向购买,然后强调品牌推荐。

  其中一个挑战是数据来自许多不同的模式。我们需要创建一个解释性的模型。数据不能是黑匣子。为了用于企业,也有推荐它的理由。罗平采用概率图模型的方法联合进行在线搜索和离线行为建模,并将其推理引发。

  通过品牌聚类和关键词聚类,我们可以知道购买母婴用品的用户也喜欢寻找减肥练习和钟汉良的电视剧,购买户外产品的用户也是儿童的主要消费者的产品。针对用户推荐产品,每个短信的价值可以提高30%。罗平说。

关键词: 电子科技