MLNLP学术Talk第十九期 | 余海洋、黎槟华@阿里达摩院:基于知识的下一代对话:新任务、新数据、新榜单

MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。

MLNLP学术TalkMLNLP社区举办的学术交流活动,旨在邀请一线青年学者分享最前沿的技术,期待最精彩的思想火花碰撞。

本期MLNLP学术Talk邀请了阿里达摩院余海洋、黎槟华为我们带来“基于知识的下一代对话:新任务、新数据、新榜单”的主题报告。详细信息如下:

1

报告一



个人介绍:

余海洋,阿里巴巴达摩院算法专家,研究领域包括深度学习、自然语言、预训练、文档问答等。在学术会议上参与发表论文10+篇,相关研究在Doc2Dial、WebQA等国际榜单上多次登顶。研究成果在阿里云智能客服、钉钉员工助理等产品中落地应用

报告摘要:

文档是各行业最普遍存在的非结构化数据知识,围绕文档的问答技术近年来取得了较大进展,受到了业界的广泛关注。本次报告将围绕文档问答的历史演进和我们的最新研究成果展开,并重点介绍我们举办的ACL2023 DialDoc Workshop Shared Task的新数据和新任务,该workshop由我们和Google ResearchAmazon AI LabsIBM Research AI、哥伦比亚大学、AllenAI等共同举办,设置 Best Paper Award Best Student Paper Award并提供5万元的比赛奖金。

2

报告二



个人介绍:

黎槟华(临城)阿里巴巴达摩院Conversation AI团队算法专家,北京大学毕业,研究领域包括NLP、预训练、结构化问答等。在学术会议上发表论文20+篇,相关研究在SpiderCoSQLSparC等国际榜单上多次登顶。研究成果在阿里云智能客服、阿里云QuickBI等产品中落地应用。

报告摘要:

表格及SQL类型的数据库是各行各业最广泛存在的结构化知识,近年来,围绕表格型知识的Text-to-SQL技术受到了学术界、工业级的广泛关注。当前的公开数据集和榜单极大推动了该方向的发展,但由于其表格知识相对简单并且多为虚拟构造,和真实工业场景有较大差距,迫切需要有面向大规模真实数据库的新一代数据集为后续发展提供基础。在本次报告中,首先会介绍Text-to-SQL的发展路径以及达摩院Conversation AI团队的最新研究成果,然后重点介绍我们构建的大规模新一代数据集BIRD,并发布比赛榜单。



特别鸣谢本次学术Talk的主要组织者:

MLNLP秘书处(王乐涵、段然、陈麒光、刘洪宇、魏福煊)

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。


相关推荐

  • Spring Boot 实现日志链路追踪,无需引入组件,让日志定位更方便!
  • 大佬总结:广告算法和推荐算法的五大差异
  • 左耳朵耗子:我看ChatGPT,为啥谷歌掉了千亿美金
  • 异常水电费牵出2亿元出口骗税大案;科学家研发出首个男性避孕药;​京津地区已婚夫妇不孕不育比例高达15%......|酷玩日爆
  • 千万不要浪费你的生日!| 每日一冷
  • 房贷到100岁?真相是,欲望还有,能力不行了......
  • 对不起,这些爆品这个价格,每样只有10个.....
  • 群众不愿花钱,背不了中国经济的锅
  • 广告流量反作弊风控中的模型应用
  • 3秒吸水,远超国标,这条毛巾真的可以回购一辈子!
  • ​外交部:敦促日方以负责任的方式处置核污染水;美环保局长赴俄亥俄要求相信政府;日本新一代主力运载火箭H3首秀失败 | 每日大新闻
  • 群友:我799买的无刷电机吸尘器,你卖399?(我再要俩!)
  • 为什么说“美国切尔诺贝利”属于必然事件?
  • 如何设计一个亿级企业消息平台
  • Debian开发者亲自维护,阻止内核移除Itanium/IA64架构
  • 中国开源社区健康案例——Apache ShardingSphere社区
  • Google默默酝酿新计划,代号“Spa”
  • Rust将迎来爆发式增长;更多国产编程语言进入视野 | 编程语言领域解读
  • Greylock:离OpenAI、DeepMind最近的VC,AI幕后玩家走向台前
  • 奇舞周刊第482期:每天都在用,也没整明白的 React Hook