js5金沙2004cm✪欢迎莅临 | 中文版 | ENGLISH | 管理员入口
关注官方微信
当前位置: js5金沙2004cm > 书院工作 > 钱院学子 > 正文
钱院学子

【身边钱院人】万和润:道阻且艰,奋力耕耘

日期 : 2021-11-26 点击数: 来源:js5金沙2004cm✪欢迎莅临


万和润,电信学部计算机科学与技术学院,钱学森书院,计试81班学生,曾获优秀学生、优秀班干部、校级奖学金、杰善奖学金等称号与奖励。获得ICPCCCPC竞赛区域赛银牌、省赛金牌、CCPC final 铜牌等程序设计竞赛成绩,高校团体天梯赛个人一等奖、大学生创新与创业优秀评级。

在过去一学年的学习中,我代表学校的程序设计竞赛校队,参加了许多国际、国家级的竞赛,获得了许多奖项,最高获得了金奖级别的成绩。同时,也代表学校参加了团体程序设计天梯赛,获得了个人一等奖的成绩。也参加了CCF举行的第22CSP认证,获得了370(全国排名前1.03%)

同时,在上学年中,我还参加了大学生创新训练项目,项目是社交平台机器人账户检测,目的是检测那些散布虚假信息、危害社交网络环境的机器人。最终,我们团队实现一个能够实时收集微博平台用户公开信息,并且判别其是否为机器人账户的程序。该项目获得了优秀评级。

在此基础上,我们团队把重心转移到了境外的社交平台Twitter上,经过调查研究后发现现有的机器人账户检测的模型存在两个问题——泛化性和适应性。为了解决这个问题,需要一个更加完整的数据集以及完善的收集方案。所以,我们提出了一种基于BFS的数据收集方案,通过Twitter API,实现了自动收集以一特定用户为中心,收集该用户公开的、多模态的数据的程序。最终,收集到了含有大约22万条用户多模态信息的数据,是目前规模最大,信息最丰富的数据集,TwiBot-20。该成果已经被CIKM2021接收,并且开源了数据集,目前已有50多位国际学者使用该数据集进行研究。并且已被知名机器人数据集收集平台Bot Repository收录。

为了解决在新数据集上更加突出的两个问题,我们提出了一个基于自监督用户表示学习的模型SATAR,该模型通过自监督、运用多模态信息,综合考虑了语义、属性以及邻居的信息,并且提出共影响力的结构将这些信息聚合起来,达到了目前最好结果,该成果被CIKM2021接收。为了进一步探索图结构的作用,我们提出了使用异质关系网络模型RGCN,通过异质图卷积网络,让模型能够理解图结构的不同,该成果被ASONAM2021接收。暑假期间,我参加了NUS的暑期项目,进一步探讨了对比学习在社交机器人检测中的应用,该项目获得了亚军,我个人则获得了A评级。

在提升自己的能力同时,我也没有忘记为学校做出一定的贡献,我加入了LUD Lab,为想要科研的学弟学妹提供了一个平台与经验。并且,也作为代表参加了基础学科拔尖学生培养计划2.0优秀学生学术交流会,还作为计算机基地代表进行汇报。在交流过程中,我认识了很多优秀的同学,知道了他们在做什么,是怎么做的,让我受益匪浅。科研道阻且艰,但奋力耕耘方可成就梦想。

关闭