MLNLP 2022学术研讨会 是由 MLNLP社区 和 中国中文信息学会青年工作委员会 联合举办的学术活动。 社区会定期举办学术研讨会并邀请国内外机器学习与自然语言处理领域知名青年学者进行报告交流,旨在加强国内外同学们之间的交流。
MLNLP社区将在2月26日于线上举办第十四次学术研讨会,由MLNLP学术委员会委员谷歌研究院研究科学家王亚庆和马里兰大学博士后研究员赵洁玉共同担任本期程序委员会主席。本期研讨会以线上报告的方式进行,分为上下两半场:上半场由王亚庆老师主持;下半场由赵洁玉老师主持。具体而言,社区很荣幸邀请到伊利诺伊理工大学计算机科学系讲席助理教授舒凯老师担任大会主席,并做开场致辞;达特茅斯学院博士生刘睿博,亚利桑那州立大学 (ASU)计算机科学专业博士丁凯泽,Meta AI研究科学家雷杰,加州大学圣塔芭芭拉分校计算机系博士生卢雨洁,做专题报告。1会议概况
召开时间:
2022年02月26日 9:00-12:00(北京时间)
主办单位:
MLNLP社区
中国中文信息学会青年工作委员会
大会主席:
舒凯:伊利诺伊理工大学计算机科学系讲席助理教授
程序委员会主席:
王亚庆:谷歌研究院研究科学家
赵洁玉:马里兰大学博士后研究员
组委会:
MLNLP社区秘书处(刘洪宇、段然)
社区支持 :
智源社区
直播平台:
哔哩哔哩:http://live.bilibili.com/23872620
微信视频号:请点击下方卡片预约
会议日程
嘉宾介绍
一、主持人:
王亚庆
谷歌研究院研究科学家
嘉宾简介:王亚庆,谷歌研究院研究科学家。博士毕业于普度大学Data Mining Lab, 师从高晶教授。研究兴趣在于高效深度学习和多模态学习。在KDD/AAAI/EMNLP/WWW等会议上发表了 30 余篇论文,获得了普渡大学Bilsland Dissertation Fellowship。他曾经在Microsoft Research (Redmond),Amazon等公司工作实习, 并长期担任数据挖掘,机器学习和自然语言处理的顶级会议的委员和高级委员。个人主页:https://yaqingwang.github.io/
赵洁玉
马里兰大学博士后研究员
嘉宾简介:赵洁玉,现为University of Maryland, College Park 的博后,师从Hal Daumé III。2023年秋季会入职USC CS系。Jieyu在2021年12月博士毕业于UCLA计算机专业,导师是Kai-Wei Chang。研究方向在于自然语言处理模型中的偏见问题,其论文曾获EMNLP2017最佳论文奖。她也获得了2020 Microsoft PhD Fellowship,并且被选入参加2021 EECS Rising Star Workshop。论文曾被国内外媒体报道过,并受邀参加联合国妇女署驻华办事处举办的关于性别平等的研讨会。个人主页:https://jyzhao.net
二、大会主席致辞:
舒凯
伊利诺伊理工大学计算机科学系讲席助理教授
嘉宾简介:舒凯博士,现任伊利诺伊理工大学计算机科学系讲席助理教授,主要研究方向包括数据挖掘,机器学习,自然语言处理,人工智能等领域,在包括KDD, WWW, SIGIR, AAAI, IJCAI, NACCL, EMNLP在内的相关顶级国际会议和期刊发表论文100余篇,引用超过7,800次。他曾获得亚利桑那州立大学院长博士论文奖,AAAI-2023 New Faculty Highlights, Cisco Research Faculty Award, Google Cloud Research Credits Award, Finalist of Facebook (Meta) Research Faculty Award等奖项。他入选百度发布的首份全球高潜力AI华人青年学者百强榜单和Aminer发布的2022年AI 2000人工智能最具影响力学者。个人主页:http://www.cs.iit.edu/~kshu/。
三、分享嘉宾:
刘睿博
达特茅斯学院博士生
嘉宾简介:刘睿博,达特茅斯学院博士生,师从 Soroush Vosoughi教授。主要研究方向为自然语言处理和社会计算的交叉领域,包括可控可信赖语言模型,模型-社会对齐算法,以及最优人类反馈。他曾获 AAAI 2021 最佳论文 (3/9034), 其作为第一作者的研究工作多次发表在机器学习,自然语言处理,社会计算等顶级会议和期刊(ICLR, NeurlPS, ACL, EMNLP, NAACL, AAAI, AIJ, CSCW, ICWSM)。他曾在 Google Brain 和 Microsoft Research实习。
报告题目:穿行于虚实之间:利用游戏引擎增强语言模型
报告简介:当前的语言模型本质是利用人类语言对现实世界进行“逆向工程”。这一过程完全依赖于语言对于现实世界的准确描述,但却忽视了很多语言之外的隐含信息。此外,仅仅通过“道听途说”的描述却没有真实经历具体事件,也导致语言模型在遇到不熟悉情况下利用过往经验进行“胡编乱造”。这次报告我将介绍我近期有关利用游戏引擎仿真去增强语言模型对现实世界理解的工作。当前的游戏引擎已经被优化成作为逼真建模虚拟世界的利器,因而我们有理由相信利用其廉价和快速的仿真,我们能得到近乎无限,也无限接近真实的关于世界的经验。这一过程也符合人类的认知过程:我们会经常在脑海中模拟和推演可能的结果,并最终做出决策。在一个关于物理知识的评测数据集上,我们发现结合游戏引擎的语言模型可以达到比其模型尺寸大100倍的模型的相似性能,同时解锁单纯增大模型无法获取的新的推理能力。
丁凯泽
亚利桑那州立大学(ASU)计算机科学专业博士
嘉宾简介:丁凯泽,亚利桑那州立大学(ASU)计算机科学专业博士,师从刘欢教授。研究方向包括图神经网络,数据高效机器学习,以及它们在不同领域中的跨学科应用例如异常检测,自然语言处理。他在重要学术会议和期刊如KDD、WSDM、CIKM、ACL、AAAI、IJCAI、Web Conference、INNLS等发表多篇论文,并曾在Amazon Alexa AI, Mircosoft Research以及Google Brain实习交流。他曾获ASU毕业奖学金、ASU研究生杰出研究奖、计算机系博士奖学金等荣誉和奖项。更多信息请参考https://www.public.asu.edu/~kding9/。
报告题目:数据高效的图学习
报告简介:现实世界中存在大量的图类型数据。图通常使用节点表示实体,使用边表示实体之间的关系,可以作为一种通用的数据结构用于建模大量复杂和异构的系统。尽管近几年深度图机器学习取得了巨大的成功,但现有方法的有效性严重依赖于高质量的图数据以及充分的人工标签所提供的监督信号,从而导致那些精心设计的模型在资源受限的场景中无法得到想要的效果。本次报告将重点探讨如何利用有限的标记数据进行数据高效的图学习。
雷杰
Meta AI研究科学家
嘉宾简介:雷杰,Meta AI研究科学家,于2022年获北卡罗来纳大学教堂山分校(UNC)计算机科学博士学位,师从Tamara Berg和Mohit Bansal教授。主要研究方向包括多模态预训练和视频表征学习。他担任过计算机视觉,自然语言处理和人工智能多个顶会审稿人,如CVPR,ICCV,NeurIPS,ICLR,ACL,EMNLP等等。他也曾担任COLING领域主席,IJCAI高级程序委员。在重要学术会议如CVPR,ICCV,ACL,NeurIPS, ICML等发表学术论文近20篇。他曾获CVPR最佳学生论文荣誉提名,Adobe研究奖学金,CVPR杰出审稿人等荣誉和奖项。个人主页:https://jayleicn.github.io/。
报告题目:视频与自然语言预训练中视频的稀疏采样
报告简介:视频与自然语言相关的任务,例如视频检索,视频问答等等,在过去的很长一段时间中对视频一直是使用密集采样的方式。然而这样的采样方式通常会带来极高的计算成本。在这次报告中,我们将会讨论一些使用更高效率的稀疏采样进行学习的工作,并且给出一些此种范式适用的场景和任务,以及它的一些局限性。
卢雨洁
加州大学圣塔芭芭拉分校计算机系博士生
嘉宾简介:卢雨洁,加州大学圣塔芭芭拉分校计算机系博士生,师从王威廉教授。研究方向主要为多模态学习,在学术会议如Web Conference、CoRL、CIKM、NAACL、EMNLP、CHI、EACL、ICLR等发表学术论文10余篇。她担任过SoCal NLP Symposium 2022的程序主席,并曾获Robert Noyce Fellow荣誉。
个人主页:https://yujielu10.github.io/。
报告题目:Language+Vision+Action: Towards Complex Planning in Autonomous AI
报告简介:基于多模态信号处理完成复杂的规划是实现Autonomous AI的主要挑战之一。目前大多数模型在单一模态任务上缺少对外部模态的监督信号,且当涉及到复杂的决策序列,大模型的预训练引入假性相关,这影响了Autonomous AI在完成新的复杂的任务中的表现。其次现有模型对于利用多模态信号来扩展动作控制在时间状态与任务多维度中的表现缺乏探索。该报告将通过双向互补的视觉语言感知,具备常识性推理的程序式规划,与借助于自然语言指令的分层控制三方面,对实现Autonomous AI中的复杂规划的可行方式进行探讨。
直播平台
视频号
B站
会议报名
扫描二维码添加小助手微信