分享到微博 分享到人人 分享到LinkedIn 分享到Email
第23届国际万维网大会侧记

作者:袁晶 谢幸
微软亚洲研究院

第23届国际万维网大会(International World Wide Web Conference, WWW) 于4月7~11日在韩国举行。

大会由国际万维网会议指导委员会 (International World Wide Web Conference Steering Committee 或 IW3C21) 主办,韩国科学技术院 (Korea Advanced Institute of Science and Technology, KAIST) 与韩国技术和标准局 (Korea Agency for Technology and Standards, KATS) 协办。大会吸引了1200名人士参加。微软、谷歌、雅虎等多家企业都在主会场设置了展台。

研究论文录用情况

会议共收到来自49个国家的645篇论文,投稿最多的是美国、中国、英国、德国和印度。最终录用了84篇论文,平均录用率为13.02%。被接收的论文分布在11个子领域,众包是今年新设的领域。

表1 WWW 2014分领域录用情况

领域 投稿量 录用量 录用率
互联网经济学和商业化 35 8 22.86%
行为分析与个性化 74 14 18.92%
众包 43 8 18.60%
互联网搜索系统和应用 43 6 13.95%
软件体系结构和性能 23 3 13.04%
隐私和安全 55 7 12.73%
语义互联网 51 6 11.76%
内容分析 71 8 11.27%
社交网络和图分析 126 13 10.32%
人机交互和智能设备 33 3 9.09%
互联网挖掘 91 8 8.79%

大会论坛·主题演讲

大会论坛邀请万维网之父蒂姆·伯纳斯·李 (Tim Berners-Lee)、拉曼内森·古哈 (Ramanathan Guha)、语义网络发起人詹姆斯·亨德勒 (James Hendler)、玛丽·艾伦·祖可 (Mary Ellen Zurko)(IW3C2 的副主席)等多位重量级嘉宾进行演讲,探讨下一个25年的互联网发展。

大会另有三个主题演讲。卡耐基梅隆大学赫里斯托斯·法鲁托斯 (Christos Faloutsos) 教授作了关于图挖掘的报告,介绍了如何在网络中检测异常行为及其随时间演进的情况,探讨了网络中的病毒传播与免疫问题。三星集团副总裁崔宗浩 (Jong-Deok Choi) 介绍了由三星和英特尔主要参与研发的Tizen操作系统,该系统基于Linux 内核,可应用于智能手机、平板电脑、电视和相机等各种智能设备。微软应用和服务部门执行副总裁陆奇介绍了微软如何整合用户的数字生活。

论文报告·演示

社交网络是近年来多个顶级会议的热点。本次会议共收录了6篇论文,分两天进行报告。由布鲁塞尔自由大学、雅虎公司、鲁汶大学合作完成的文章“基于随机游走的模块性”(Random Walks Based Modularity), 讨论了基于网络中边的模块化局限性问题, 利用随机游走将模块化方式推广到基于路径的定义。基于这个新的定义,作者在多个数据集上验证了可以显著提高网络中半监督结点分类的准确性。基于加权社团聚类 (weighted community clustering) 的论文, 提出了一种可扩展的社团发现算法。基于多个真实的标准数据集的测试结果表明,该算法在保证了社团发现质量的同时,比当前最好的算法在速度上提高了两个数量级。印度德里因陀罗普拉沙信息科技学院 (IIIT, Delhi) 的一篇论文研究了Stack Overflow2上被删除的帖子,进而提出了用一个预测模型来预测帖子是否会被删除。卡耐基梅隆大学和康奈尔大学共同合作的一篇论文,提出了一种从推特数据中自动抽取用户生活中关键事件的方法,比如毕业、工作、结婚,并自动生成用户的“时间轴”。这个问题的关键挑战在于如何从噪音较多的推特数据中找出并判断哪些事件是用户的“关键事件”。对于不同的用户,判别标准也不同,而且还与用户所在国家的文化相关。卡耐基梅隆大学的一篇论文提出了一种基于会员制度网站 (membership-based websites) 生存周期的预测模型,准确地拟合了22个不同网站的日活跃用户量,成功地预测了这些网站的发展趋势。

用户行为也是人们关心的领域,其中一篇论文分析了用户在线上对餐馆的评价和线下因素的联系,比如天气以及用户的人口统计学信息。论文的作者发现,那些在网上被标注为价格低廉的餐馆,往往得到的评论较少,得到的分数也更低;同样的餐馆在“温暖”和“凉爽”的天气里得到的用户评价分数要高于那些在“寒冷”和“炎热”的天气里得到的评价。论文还对比了美国不同州的餐馆得到评价的情况与美国大选时不同党派在各州的分布情况,发现两者有惊人的相似性。

我们提交的论文是“从不同领域挖掘用户的猎奇特质”(Mining Novelty-Seeking Trait Across Heterogeneous Domains),在网络挖掘领域专场中作了报告。这项工作从不同领域的用户数据中挖掘出用户的猎奇心理特质。如果我们从某个用户的位置签到数据中发现该用户喜欢不断尝试新的餐馆,就可以为其精准地推荐在线购物网站上的新产品,同样,如果我们拥有用户的购买记录,也可以为其精准地推荐线下的餐馆或酒店。按照这个思路,我们试图找到用户的在线行为和线下行为所体现的心理特征的本质,研究其一致性,从而为个性化广告和推荐提供参考。

大会第二天下午进行了海报 (poster) 展示和项目演示 (demo) 环节。107个海报和28个演示吸引了大批参会人员的关注,其中有不少海报展示来自中国大陆。


有不少海报展示来自中国大陆

欢迎酒会·晚宴

一般在亚洲举办的国际会议都有丰盛的餐食,这次WWW主办方提供了一些很有韩国特色的食物,比如韩国拌饭和据说韩国人一般在过节时才吃的“韩牛”肉。首尔的海鲜也相当不错,在欢迎酒会上,各色海鲜让与会者大饱口福。

今年是互联网诞生25周年,晚宴上, 由IW3C2的核心成员共同切蛋糕庆祝互联网的生日,并为互联网的未来许下良好祝愿。主办方还邀请韩国演艺团体表演了不同风格的舞蹈。其中韩国传统的鼓舞和扇子舞给大家留下深刻的印象。最后,在一曲劲爆的江南style 的热舞中,结束了晚宴。

1 IW3C2也是万维网联盟(World Wide Web Consortium或W3C)的指导机构。
2 一个著名的关于编程问答论坛的网站。

 

原文刊登于《中国计算机学会通讯》2014年7月第10卷第7期

作者简介:

袁晶,CCF会员。微软亚洲研究院副研究员。主要研究方向为行为数据挖掘、时空数、据挖掘和计算社会学等。

谢幸,CCF高级会员。微软亚洲研究院高级研究员。主要研究方向为空间数据挖掘、基于位置的服务、社交网络和普适计算等。

相关链接