分享到微博 分享到人人 分享到LinkedIn 分享到Email
精选|Marti A. Hearst:驱动创新的在线学习

“二十一世纪的计算”学术研讨会是微软亚洲研究院自成立之初便开始举办的年度学术盛会。作为中国及亚太地区规模最大、最具影响力的计算机科学教育与研究盛会之一,迄今为止该大会已在中国、日本、韩国、新加坡等多个国家和地区成功举办了17届,参会人数累计超过40,000人。

11月3日,以“Human and Machine Working as a Team”(人机协作)为主题的第18届“二十一世纪的计算”学术研讨会于韩国首尔举行。包括2002年图灵奖获得者Adi Shamir、微软全球资深副总裁Peter Lee、微软全球资深副总裁,微软亚太研发集团主席兼微软亚洲研究院院长洪小文博士在内的众多计算机领域顶级大师,分享了他们各自独特且深远的见解。

以下是加州大学伯克利分校Marti Hearst教授的演讲精选,由微软亚洲研究院首席研究员刘铁岩博士担任现场点评。其他演讲亦将陆续发布,敬请期待。

点评人简介

刘铁岩博士,微软亚洲研究院首席研究员,美国卡内基梅隆大学(CMU)客座教授、英国诺丁汉大学荣誉教授、中国科技大学、中山大学、南开大学博士生导师。刘博士的研究兴趣包括:人工智能、机器学习、信息检索、数据挖掘等。他的先锋性工作促进了机器学习与信息检索之间的融合,被国际学术界公认为“排序学习”领域的代表人物,他在该领域的学术论文已被引用万余次,并受Springer出版社之邀撰写了该领域的首部学术专著(并成为Springer计算机领域华人作者的十大畅销书之一)。

近年来,刘博士在博弈机器学习、深度学习、分布式机器学习等方面也颇有建树,他的研究工作多次获得最佳论文奖、最高引用论文奖、研究突破奖,被广泛应用在微软的产品和在线服务中,并通过DMTK、Graph Engine等项目开源。他曾受邀担任了包括SIGIR、WWW、NIPS、KDD、AAAI、WINE等在内的十余个顶级国际会议的组委会主席、程序委员会主席或领域主席;以及若干顶级国际期刊的副主编。他是美国计算机学会(ACM)杰出科学家、国际电子电气工程师学会(IEEE)和中国计算机学会(CCF)的高级会员,中国计算机学会的杰出演讲者和学术工委。

微软亚洲研究院:Marti Hearst是加州大学伯克利分校信息学院和计算机科学系教授。 在1997年加入伯克利作为教授之前,她是施乐 PARC研究所的成员。 她是《搜索用户界面》的作者,这也是关于该主题的第一本学术着作。她在计算语言学、信息可视化、搜索用户界面、人机界面以及如何改善大规模学习方面撰写了超过一百篇研究文章。

2007年夏天,她以访问研究员的身份访问了美国雷德蒙的微软研究院。

Marti Hearst博士目前是计算语言学协会副主席和美国计算机协会院士。她从加州大学伯克利分校获得了计算机科学博士学位。

今天,Marti教授的演讲标题是Learning at Scale as a Driver of Innovation

刘铁岩博士:Hearst教授今天的演讲关注的是教育和学习的话题。一方面如果我们可以提出更高效的教育和学习方法,可以更好地推动人类社会的进步;另一方面,通过研究和借鉴人的教育和学习方法,可以为我们开发出更好的机器学习算法提供鲜活的范本。

微软亚洲研究院:怎样才能以可扩展且足够经济的方式为全世界提供教育? 这个问题正在驱动人机交互、社交计算、自然语言处理、机器学习和学习科学间的迷人的交叉研究。

Marti教授将在大规模学习中讨论最先进的技术,其重点在于如何提高同伴反馈、如何自动化分级以及如何帮助教师了解学生对所学内容的理解程度,强调对以上问题的解决方式将催生新的社会技术的创新。

刘铁岩博士:在线教育已经成为一个大的产业,在线课程越来越多。在国内,清华学堂在线等MOOC的发展也非常快。在国内,清华学堂在线等MOOC的发展也非常快。 在线教育,因为自身的特点,给我们带来了很多传统学习模式不具备的机遇。比如,教师可以把知识传播到更广的受众群体里,可以更有效地搜集学生的学习数据,通过大数据分析可以得到有价值的信息。与此同时,可以在这样一个实际的互动系统中进行很多有趣的研究实践,比如A/B测试、增强学习、机制设计等等。

微软亚洲研究院:我们去年的“二十一世纪的计算大会”所有视频也在清华学堂等平台放出了哦。

刘铁岩博士:在线教育会带来规模效应,我们可以采集到对于不同教学方法的具有统计意义的不同反应,而且可以做A/B对照试验。这在以前是很难做到的。

很多和人工智能有关的技术,比如自然语言处理、事件检测、社交网络、推荐系统、算法博弈论,在在线教育的这个大框架中都大有用武之地。接下来,Hearst教授将从四个方面,介绍AI技术对于教育的影响:NLP作为写作助手、AI自动评价学习进展、AI助力寓教于乐、NLP帮助互相学习。

我们知道,学生在学习写作的过程中,需要得到及时的反馈、评价。而有的时候教师的诸如Awkward的非建设性的意见对学生的帮助是很有限的。有些工具,比如Grammarly、word等,可以针对语法、句法、常用写法进行纠错,这对于提高学生的写作能力是有帮助。

不过,有研究表明,通过“纠错”的方式并不能大幅提高学生的写作能力,学生需要的是建设性的、有启发性的指导,而不是指出错误的裁判。

最近有些学者利用自然语言处理(NLP)的技术,通过推荐和类比的方式,而不是纠错的方式来帮助学生提高写作能力。这个系统WriteAhead就是基于这种想法开发的,相关论文发表在NAACL上。

传统的Parser是从检查语法错误的角度出发的。所以我们需要超越Parser的局限,多给学生看一些参考资料、给他看例子,启发他们学习更好的写作方法。

Hearst教授的研究表明,这种利用NLP技术提供推荐和指导的技术,不仅对于写作有帮助,对学习本身也有帮助。

第二,Hearst教授谈到学习过程中的自动反馈。学习之道,贵在熟能生巧,而这个过程中及时的反馈非常重要。

刘铁岩博士:一个简单的例子是文字逻辑题。现在绝大部分这类题目都非常枯燥,对小孩子来说很难。比如A比B大十岁,明年A正好是B年龄的两倍,问A现在多大?如何创造一个环境,既提高了学生的兴趣,又能给学生自动的反馈呢?一个思路就是用NLP技术,自动地把这些文字逻辑题目嵌到孩子们感兴趣的故事里,比如,“某骑士有30个圣杯,恶龙有9个圣杯,骑士大战恶龙,终于拿到了对方的圣杯,请问现在骑士一共有多少圣杯?” 通过这种方法,可以激起学生的兴趣,同时,因为题目是自动生成的,我们知道它的答案,也就很容易地实现自动评价。

再有一个例子是让学生从立体图投射到平面图,对于这种问题,其实老师对学生的答案进行评价都是有难度的。但如果使用计算机算法去实现自动评价,反而简单得多,只要通过平移、尺度、旋转、投影等变换,就可以相当准确地进行评价了。

再有一个例子是微积分的题目。如果在中间的推导过程中出错了,一方面很难给出整体的评分,另外整体评分也很难给学生针对性的反馈。如果用计算机算法去计算每一步错误的概率,并将其反馈给学生,对学生的帮助会更大一些。

第三,让我们思考一个有趣的问题:如果把作业的题目转换成游戏(像前面提到的骑士和恶龙的例子那样,甚至更进一步),对学习效果的提升是否有益呢?

答案是肯定的,有研究表明,如果把题目和社交游戏相结合,学生可以学得更准确,记忆的时间也变长。

Hearst教授举了老外学习中文的四个音调的一个例子。这个任务对老外来说是相当困难的,但如果把它变成游戏,甚至是以网游的形式出现,让人们通过对战进行学习,结果会怎样呢?有研究人员开发了一个叫ToneWars的游戏,通过它来做实验,发现大家的学习效率显著提高,竟然在24场对战中,有8场是外国人赢了中国人!

微软亚洲研究院:Hearst教授播放了ToneWars视频,同时提到还有很多类似的寓教于乐的例子,比如WordCraft用游戏来教孩子学单词、我们研究院开发的英酷(EngKoo)用卡拉OK教用户学英文发音等等。所有这些例子都说明,寓教于乐很重要,如果设计得当,会大大提高学习效率;而要实现寓教于乐的目的,好的用户界面设计、NLP技术、语音识别技术、语音合成技术等就会变得非常关键。微软亚洲研究院不久前推出的人工智能个人英语私教“微软小英”,就是这样一个寓教于乐的例子。它结合微软亚洲研究院的自然语言处理、语音识别等各种功能,帮助大家更轻松地学习英语。欢迎各位加“微软小英”为好友,体验简单应用背后的人工智能技术。

【延伸阅读】微软小英:人工智能教你学英语

刘铁岩博士:第四,Hearst教授介绍如何利用NLP技术帮助学生互相学习(peer learning)。很多人都有这样的经验,最好的学习方法是把你要学习的东西总结清楚,讲给别人听。很多研究也验证了这种互相学习的价值。从某种意义上讲,大规模的互相学习是利用了众包的力量,来改善学习效果。

除了互相提问、测试以外,这种互相学习、互相评价对于设计也有很大的帮助。

比如有个数据要可视化,可是很难去评价不同的可视化那个效果真的好。HCI领域有一些设计准则来知道怎样的设计才是好的设计;但是,那些准则很组线条,有时候不能帮助我们做具体的判定。

那是否可以换个思路,让一群人对设计结果进行评价:主观和客观。主观上就是从那些所谓的设计准则出发;客观上就是依据可视化的结果反过来回答一些原始数据中有的问题。研究结果表明主客观的评价有很强的相关性。

更重要的是,这种互相学习的众包方式,为有效提高可视化技术开启了新的视角,有可能帮我们发现新的设计准则,以及评价已有的设计准则是否合理等等。

刘铁岩博士:从某种意义上讲,这种相互学习的模式和大家熟知的在线课程MOOC还是有所区别的。在线课程免费、自己可以控制节奏和时间地点,但是学生的学习过程很孤立,缺少动力,而相互学习就能解决在线课程的短板。有人做过研究,大班上课的时候学生参与度很低,但在小组讨论中大家都表现得更加积极。行为心理学的研究也进一步表明,通过和别人一起讨论,人们可以显著提高答题的准确率,能回答更难的问题,得出更加具有深度的结论。

这可能也是为什么我们论文审稿的时候,总要有discussion period吧。这启发我们把互相学习、小组讨论的模式引入在线课程。研究表明,53%的人觉得这样使得学习过程更加愉悦。那么NLP在这个过程中能起什么作用呢?其实大有用武之地,比如评价当前讨论的深度、检测当前学员的理解程度、以此为依据改变学生分组、实时生成新的问题等等。

总的说来,Hearst教授通过很多的例子,向我们展示了AI技术,包括NLP、众包、语音识别、语音合成等,对于学习和教育有很多的启发意义。

不过听完她的报告,我也感觉前方的路还很长。比如,如何用一个系统的框架来描述AI和教育之间的关系,而不仅仅是从一些散点上入手?再比如,这个交叉领域的基本研究问题是什么?最大的挑战在哪里?产业基础在哪里?等等。我想Hearst教授的报告只是一个开始,希望大家能一起想一想这些重要的问题,共同推动AI在在线教育中的应用。