分享到微博 分享到人人 分享到LinkedIn 分享到Email
谢幸:寻找人工智能研究中的结构洞

在社会学中有一个著名的理论叫“结构洞理论(structural holes theory)”[1]。对这个理论不了解的读者可以先看看下面这两张图(来自维基百科)。

想象这是两个社交网络,网络中每个节点是一个人,每条边代表两人之间存在的朋友关系。在左边这张图,节点A链接了三个群体,而这三个群体之间不存在其它的链接,因此,如果A消失了,那么这张图也将分裂成三个互不连通的子图。在右边这张图就不存在这样一个节点,比如节点B虽然和A一样,也有自己的三个朋友,但如果把B移走,这张图的连通性完全不会受影响。提出结构洞理论的芝加哥大学教授Ronald Burt认为, 与B相比,A在社交网络中具有显著的位置优势,A不仅可以在不同的群体之间传递信息,还有机会结合来自不同群体的想法以产生自己的创新。

我们能不能将这个理论应用于自己的工作呢?

其实这也不是什么全新的概念,因为在历史上经常可以看到学科之间发生交叉,从事交叉学科研究的学者就像图中的A,在学术网络中占据了一个有利的位置,他们做出的研究工作也往往具有较大的影响力,甚至能开创一个全新的领域。当然,随着研究的深入,曾经的结构洞可能会逐渐消失、节点A演化为节点B,但同样可以预见的是,这时一定会出现新的结构洞和新的节点A。

近年来人工智能的发展如日中天。作为人工智能的早期开拓者之一,Herbert A. Simon(中文名是司马贺)就是一个著名的跨界学者,他的研究工作横跨了心理学、认知科学、计算机科学、经济学和社会学等众多领域。深度学习的知名学者Geoffrey E. Hinton同时也是一位心理学家。

回到我们自己的研究。在过去十年,我的团队一直在计算机科学、社会学、心理学、地理学和经济学等领域的交叉地带展开研究。这一方面是研究兴趣所致,另一方面也是由于计算和数据技术的高速发展给整个社会带来了巨大的变化,计算机科学通过和传统学科交叉产生了大量新的研究课题。

从2015年底开始,我们就频频和心理学家接触,这并不是我的同事们发生了心理问题,而是我们最近几年一直在做用户画像的研究[2],做着做着我们发现,若要深入的理解一个人,还是要去请教心理学家。

通过用户产生的大数据,我们可以去猜测一个人的年龄、职业、兴趣爱好,也可以去描绘一群人的生活规律和移动模式,那我们能不能进一步走到人的内心深处,去了解他们的性格和情感呢?这些问题在心理学领域已经被思考了上千年,但我们发现计算机科学和心理学的联系非常少,这就像前面描绘那样,存在一个结构洞。

为了更深入地理解心理学领域的研究成果,我们邀请了剑桥大学心理学系博士生陈彦桦(Fiona Chan)来我们组实习,她对心理测量和人格心理学的深刻理解让我们受益匪浅。我们还拜访了著名的心理学家、目前任香港中文大学副校长的张妙清教授,她在1996年提出了针对中国人特点的中国人个性量表(CPAI, The Chinese Personality Assessment Inventory)。

基于和心理学家的合作讨论,我们组里的同事张富峥从猎奇心理、消费者冲动性到大五人格,做了一系列研究,研究成果连续发表在WWW 、UbiComp和WSDM 等顶级会议上。在他最新的WSDM 2017工作[3]里,他提出了一个异构信息集成学习框架,通过综合头像照片、语言使用习惯、表情符使用习惯和回应模式等多元数据,来预测用户的性格,将准确性提高到0.75。(这个研究的详情可以参见张富铮撰写的《也许没有人比人工智能更懂你?》一文,即将在本平台发布。)

在人工智能领域,聊天机器人是一个很火的应用,微软也提出了“Conversation as a Platform(对话即平台)”的概念,认为未来所有人机界面都将转变为对话界面。联想到两年前我看过一部电视剧,至今记忆犹新,是英剧“黑镜(Black Mirror)”第二季第一集“be right back”[4]。这部电视剧描述了一家人工智能公司,能够通过一个人的社交媒体和在线聊天数据合成一个虚拟人,而这个虚拟人可以模仿那个人的性格特点和他的女友进行对话。这看起来很科幻,但实际上离我们已经并不遥远:2016年10月一篇新闻报道[5]中就提到,来自俄罗斯的创业者Kuyda为了纪念去世的朋友Roman,用他的8000条短信数据训练了一个聊天机器人,并于2016年5月正式发布。

不过,尽管技术已经前进了一大步,但就算是目前最好的聊天机器人也还无法让人感觉他是一个具有稳定性格和情感、活生生的人。类似“黑镜”里提到的技术是否能在近期实现,这就涉及到如何让机器人的语言和行为更具有个性。

这样的研究在过去是很难开展的,主要的瓶颈是缺乏用于训练的数据。现在,随着社交网络盛行,带有用户标签的语言数据变得容易获取。就像前面提到的新闻报道描述一样,如果我们有足够的关于某个人的数据,就有可能训练出一个和他个性一样的聊天机器人。当然,我们还可以通过一群人,例如儿童、学生、甚至诗人的数据来训练出具有一类人特点的机器人。但是,随着研究的深入,我相信最终我们还会遇到瓶颈,例如到底如何才能让机器人具备更加真实的人类性格与情感,这还是需要和心理学家合作。

我们组的另一位同事宋睿华就在这个方向进行研究。最近,她已经通过让聊天机器人学习大量文学作品,成功地让机器人的语言更像诗人,甚至武侠小说作家。(接下来她也会在这个平台分享她的研究心得,题为《好玩的文本生成》。)

我们还在想,聊天机器人是否有能力最终演变成为一个心理学家,至少是接近一个心理咨询师?这就有了我们的DiPsy项目[6]。这个项目的目标是让机器人能够和人聊天,帮助他们克服心理上的问题。在这个项目中,我们借鉴了心理咨询中常用的认知行为疗法(Cognitive Behavior Therapy) 和正念疗法(Mindfulness)。在2016年初的微软技术节上,我们展示了DiPsy的原型。在未来,我们期待这个项目能帮助解决实际的社会问题,例如农村留守儿童的心理疏导。

此外,在最近举办的微软亚太教育峰会2016 上,我们组织了一个分会,专门探讨人工智能与心理学的交叉合作。在这个分会中,我们邀请了三位年轻的研究员来介绍他们正在从事的跨界研究工作,分别是:来自南开大学社会心理学系的陈浩,具有心理学背景而从事社交网络数据挖掘的研究;来自“中央研究院”的杨得年,具有电子工程背景,目前在研究心理疾病检测与治疗的问题;以及来自中科院心理所的朱廷劭,毕业于中科院计算所,正宗的计算机专业博士,却在心理所担任研究员。在这次研讨会上,他们都从自己的研究项目出发,和听众分享了如何在人工智能与心理学的交叉地带开展研究。对这次研讨会内容感兴趣的读者可以去访问我们在微软网站上分享的视频[7]。

总体而言,这些研究项目很多都还在起步阶段,期待各位看完这篇文章以后,也能发现更多人工智能研究中的结构洞,从中找到适合自己的课题,做出有影响力的学术成果。最后,我想提一下微软的普及人工智能(Democratizing AI)战略,这一战略致力于开发更好用的产品,让更多人能轻松使用人工智能技术,以更好地解决我们共同面临的各种严峻的社会和经济问题——从某种角度来看,这也是在帮助更多人能站到本文最开始图中的节点A位置上来。

[1] Ronald S. Burt. Structural Holes: The Social Structure of Competition. Harvard University Press. 1995.

[2] LifeSpec: Learning the Spectrum of Urban Lifestyles, https://www.microsoft.com/en-us/research/project/lifespec-learning-spectrum-urban-lifestyles-2/

[3] Honghao Wei, Fuzheng Zhang, Nicholas Jing Yuan, Chuan Cao, Hao Fu, Xing Xie, Yong Rui, and Wei-Ying Ma, Beyond the Words: Predicting User Personality from Heterogeneous Information, the 10th ACM International Conference on Web Search and Data Mining (WSDM 2017), Cambridge, UK, Feb. 2017

[4] https://en.wikipedia.org/wiki/Be_Right_Back

[5] http://www.theverge.com/a/luka-artificial-intelligence-memorial-roman-mazurenko-bot

[6] DiPsy: A digital psychologist, https://www.microsoft.com/en-us/research/project/dipsy-digital-psychologist/

[7] https://www.microsoft.com/en-us/research/video/asia-faculty-summit-2016-ai-psychology/ 

作者简介

谢幸博士于2001年7月加入微软亚洲研究院,现任社会计算组资深研究员,并任中国科技大学兼职博士生导师。他分别于1996年和2001年在中国科技大学获得计算机软件专业学士和博士学位。他在国际会议和学术期刊上发表了200余篇学术论文,并拥有50余项专利。他是ACM、IEEE高级会员和计算机学会杰出会员。他参与创立了ACM SIGSPATIAL中国分会,并曾担任ACM UbiComp 2011大会程序委员会联合主席。