科研实习 | ​北京大学杨仝教授课题组招聘大模型/机器学习方向暑期科研实习生

合适的工作难找?最新的招聘信息也不知道?

AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!


北京大学

北京大学计算机专业最早可以追溯到上世纪50年代数学力学系计算数学专业和物理系的无线电物理、电子物理和半导体物理专业。1978年正式成立计算机科学技术系,包括计算机软件和微电子两个专业。2002年成立信息科学技术学院之后,在原计算机科学技术系的基础上建立了计算机科学技术系和微纳电子学系。2021年成立计算机学院。


北京大学计算机学院涵盖了国内计算机专业最全面的研究方向。在计算机理论、系统软件与软件工程、知识工程、程序设计语言、信息安全、计算机图形学、人机交互与虚拟现实、数据库与信息系统、计算机网络、计算语言学、计算机体系结构、数字音视频编解码与多媒体通信、人工智能等多方面开展了广泛研究,在多个研究方向上处于全球领先地位。计算机学院同国内外多所大学、研究机构建立密切的学术联系和学生交换项目,如美国麻省理工学院(MIT)、卡耐基梅隆大学(CMU)、康奈尔大学(Cornell)、加州大学洛杉矶分校(UCLA),英国爱丁堡大学,日本东京大学,新加坡国立大学等;与产业界多家著名企业具有合作伙伴关系,如IBM中国研究院、Microsoft亚洲研究院、华为、腾讯、百度等。计算机学院借助享誉国内国际的声望,积极为学生提供海外交流、知名企业实习以及各种赛事参与的机会,帮助学生拓宽视野。

导师简介

杨仝,北京大学计算机学院数据所长聘副教授,博士生导师,教育部青年长江学者,本硕博学生一共70余人。该实验室研究大模型、网络、数据库、机器学习、数据挖掘等方向的新型概率数据结构,以可控且小的误差换取时间和空间上的显著降低,发表一作/通信作者CCF A类论文81篇,领域排名第一SIG论文24篇,包括SIGCOMM*5、SIGMOD*10、SIGKDD*8。2023年一年发表A类或者一区论文24篇。发表了北京大学第一单位首篇SIGCOMM论文、首篇NSDI论文、首篇Transactions on Networking论文、首篇SIGCOMM CCR论文。其中测量论文Elastic sketch在SIGCOMM 2018发表的40篇论文引用次数最多。负责1项国家自然基金重点项目、2项国家重点研发计划子课题、国家自然面上基金、青年基金、华为、中心、今日头条等项目。研究成果被国家自然基金委网站报道2次,教育部科技发展中心1次,6项研究成果在华为海思和产品线中落地,多项成果在今日头条、Redis数据库中落地。获得中国电子学会一等奖(2),奥林帕斯先锋奖。获得华为火花奖5次,是全国获该奖数最多的团队。


个人主页:

https://yangtonghome.github.io/

招聘简介

北京大学杨仝副教授团队暑期招收本科生做科研论文,大约从6.20到9.20,持续三个月,欢迎感兴趣的同学报名参加。

1. 适用人群:大一到大三本科生。有竞赛奖牌的同学优先。

2. 津贴:暑期实习期间每月给津贴1000-4000元,视表现决定具体津贴,表现突出的同学还可获得额外奖金。

3. 推荐信:参加科研的同学如果需要的话,杨老师可以给写推荐信。

科研项目介绍

1. Transformers模型在网络场景的部署研究

负责人介绍:缪瑞杰,杨仝副教授团队二年级博士。在KDD,ICDE发表过一作论文,一共以一作身份发表过A类论文4篇。科研兴趣在数据处理、AI等方面。

研究目标:研究神经网络模型,尤其是Transformer结构在网络领域的应用和部署。

研究内容:探索Transformer架构或其他模型合适的应用场景,调试模型结构、规模的实验效果,研究减少模型部署的代价。

人数:1人

前期基础:希望参与的同学了解Transformer架构,最好对transformers/pytorch有基本了解,熟悉训练和推理框架。

2. ML加强网络采样算法的研究

负责人介绍:李元鹏,杨仝副教授团队二年级博士,以第一作者身份在SIGMOD、ToN等CCF A类会议/期刊发表论文2篇。科研兴趣在网络测量,ML for network。

研究目标:研究ML对网络测量,尤其是采样算法的优化。

研究内容:探索ML-based数据包分类算法,优化采样策略以减小采样误差。

人数:1人

前期基础:希望参与的同学对网络协议栈有基本了解,掌握经典模型(e.g., CNN, RNN)的编程技能。


3. 改进Transformer模型以增强时间序列预测能力

负责人介绍:清华计算机硕士毕业,北大博士三年级,科研兴趣在大模型、医疗AI、时间序列预测等方面。

研究目标:改进现有的Transformer模型,设计一个更适合时间序列预测的底层模型结构。

研究内容:针对Transformer模型在时间序列预测中的局限性,特别是对自然时间表示能力的不足,设计新的底层模型结构,以增强模型对自然时间序列数据的表示能力。在能源、医疗等实际领域的时间序列数据上进行模型测试,对比最新文献中有关时间序列预测优化的Transformer架构开源代码,验证改进模型的有效性。

人数:1-2人

前期基础:希望参与的同学了解深度神经网络和Transformer架构的数学原理,具备一定的Python编程基础,能够熟练使用相关库(如TensorFlow或PyTorch)进行模型开发和测试。

4. 基于大模型和RAG技术的AI医学核保系统开发与优化

负责人介绍:清华计算机硕士毕业,北大博士三年级,丰富的大数据、AI领域研发和创业经验,科研兴趣在大模型、医疗AI、时间序列预测等方面。

研究目标:开发一个AI医学核保的原型系统,利用大模型和RAG技术,实现自动化的医学核保流程。

研究内容:利用开源和闭源的大模型(如Kimi、GPT-4等)进行体检报告和病例的分析。使用RAG技术构建医学核保手册的知识库,并实现查询匹配功能。设计并开发一个能够自动给出核保结论的AI医学核保系统。对开发的原型系统进行测试,并根据测试结果进行优化。本项目由原百度、360搜索的资深技术大牛带领,提供专业的指导和支持。有机会参与到实际的创业项目中,体验AI技术在实际应用中的价值。

人数:2-3人

前期基础:希望参与的同学了解有扎实的编程基础,熟悉至少一种编程语言(如Python)。了解软件开发的基本流程和工程实践。熟悉Git等版本控制系统,能够进行代码管理和协作开发。


5. 一种新的计算集合相似度的sketch

负责人介绍:北大硕士二年级,在KDD,ICDE发表过论文(共一、二作等)。科研兴趣在概率数据结构的各种应用,如网络测量、数据库加速、数据挖掘

研究内容:许多现有方法难以处理集合项以连续流形式呈现的情况,我们希望开发一种概率数据结构来计算两个集合间的相似度。目前已有初步的idea。

人数:1-2人

前期基础:希望参与的同学了解有扎实的编程基础,熟悉至少一种编程语言(如C++)。尤其欢迎英语好(可以参加到调研/论文写作等任务)或者数学好(可以参加到数学推导流程)的同学。


6. 大模型量化论文综述

负责人介绍:王砚舒,清华计算机博士毕业,北大博士后,丰富的网络,数据结构,AI大模型,和计算机系统经验。发表过系统顶会论文。

研究目标:三个月内完成一篇关于大模型量化的论文。

研究内容:需要有很强的英文阅读写作能力,对AI有一定的了解。本项目适合需要引用数来申请博士,绿卡等的学生。

人数:1-2人

前期基础:希望已经了解AI和初步的量化知识,可以快速上手一起写论文。


7. 分布式大模型推理优化

负责人介绍:王飞宇,北京大学硕士三年级,即将博士入学,发表CCF A类会议三篇,一作一篇。对概率数据结构,网络测量和大模型方面较为了解。

研究目标:探索在云环境中如何优化大模型分布式推理,提升推理系统吞吐,降低端到端时延。

人数:1~2人

前期基础:编程基础扎实,对大模型架构有一定了解,对大模型推理加速有研究热情。


8. 大规模分布式训练AI流量研究

负责人介绍:杨凯程,北大博士三年级,在SIGCOMM等会议发表过一作论文,科研兴趣在可编程网络测量及其应用等方面;孙晨,清华大学博士,现于华为工作,发表多篇SIGCOMM/NSDI论文,总引用数超过1000,科研兴趣在可编程网络,数据中心网络等方面。

研究目标:研究AI网络中大规模训练时的训练流量特征。

研究内容:研究多种多卡并行训练策略下的流量特征,探索网络如何与其更好地合作

人数:2人

前期基础:希望参与的同学对计算机网络和分布式训练有一定的了解。


9. 乘积量化算法优化

负责人介绍:王砚舒,清华计算机博士毕业,北大博士后,丰富的网络,数据结构,AI大模型,和计算机系统经验。发表过系统顶会论文。

研究目标:三个月内完成一篇乘积量化算法优化的论文。

研究内容:乘积量化pq算法是使用量化空间分割的形式来进行相似度的快速计算,在向量数据库和大模型量化领域有广泛应用,本项目使用不同算法进行pq算法的优化,在各个指标角度提高算法性能。

人数:1-2人

前期基础:一定程度的算法基础,C++基础。


10. 大模型量化算法及实现

负责人介绍:王砚舒,清华计算机博士毕业,北大博士后,丰富的网络,数据结构,AI大模型,和计算机系统经验。发表过系统顶会论文。

研究目标:三个月内完成一篇关于大模型量化的论文。

研究内容:大模型量化的目的是通过压缩权重函数和激活函数来大大压缩模型大小,从而节省推理资源。

人数:1-2人

前期基础:本项目的难度很大,希望同学有一定编程竞赛成绩,成果不局限论文,可以有开源项目甚至创业公司。


11. 乘积量化算法改进研究探究

负责人:吴钰晗,博士三年级,有较多数据结构研究经验。获得过国奖、校奖。

研究目标:探索大模型量化算法的改进空间

研究内容:PQ算法全称ProductQuantization,中文名为乘积量化。该算法来源于图像检索,本质上是对向量做压缩,有广泛的应用场景。

人数:1-2人

前期基础:有一定的算法设计和分析思考能力,C++、python编程能力。


12. 图流挖掘算法优化

负责人介绍:史奇龙,清华大学硕士一年级,发表CCF-A类会议/期刊三篇,一作两篇。对概率数据结构、网络测量、流数据挖掘方向较为了解。

研究内容:图流,即图的各边以连续流数据形式呈现。我们希望优化现有的图流挖掘算法以达到更好的效果。目前已有初步的idea。

人数:1-2人

前期基础:希望有扎实的编程、算法基础,熟悉至少一种编程语言。或是数学好(擅长数学分析、概率论等)。或是英语好(可参与论文调研/写作)。

往年本科生情况

✓ 本科生一作论文共30余篇。

✓ 部分留在了实验室读硕博、部分被推荐到其他老师和学校(包括清华、中科院等)、部分到国外继续读硕博。

✓ 博士包括:CMU*3,哈佛*2,普林斯顿*1,伯克利*1,华盛顿大学*1,密西根大学*1,奥斯汀*1,宾大*1,佐治亚理工*1,马里兰*1,港科大*2,UIUC offer*3等。

✓ 硕士包括:CMU*6+,瑞士联邦理工,纽约大学,圣地亚哥等。

✓ 2024大四出国学生:三人CMU(1博2硕),1人密西根博士,1人南加大硕士,1人港科大硕士。

✓ 学生发表论文情况:本科阶段,周洋11篇,钟正10篇,龚俊之8篇,高嗣昂7篇,王伦6篇,李浩雨5篇,杨东升4篇,董思远4篇,董丰豪3篇等。

申请方式

有兴趣参加科研实习的同学请联系杨老师:yangtongemail@gmail.com




实习内推

小红书智能创作团队微软亚洲研究院智谱AI浙江清华长三角研究院Infinity Ground阿里通义灵码团队腾讯PCG大搜团队百度智能办公平台部VIVO AI研究院京东物流地图数据部门微软亚洲研究院腾讯混元AIGC团队商汤基础多模态大模型组AMD北京AI算法团队小红书信息流算法组海康威视研究院亚马逊上海人工智能研究院腾讯AI Lab中国电信人工智能研究院百度⽂⼼(ERNIE)团队阿里通义实验室对话智能团队微软亚洲研究院DKI组蚂蚁集团深度求索DeepSeek昆仑天工联想研究院AI实验室微软亚洲研究院DKI组AMD北京AI算法团队智源人工智能研究院地平线京东零售搜索与推荐部商汤研究院校招岗位智源人工智能研究院阿里云PAI深度学习算法团队秘塔科技美柚研究院百度搜索策略部淘宝搜索算法团队百川智能IDEA数字经济研究院百度搜索策略部阿里达摩院视觉技术实验室地平线阿里巴巴淘天集团阿里达摩院对话智能团队百度文心一言团队京东零售内容算法部蚂蚁网商银行智能引擎团队腾讯AI Lab决策智能中心理想汽车智能座舱团队阿里通义实验室对话智能团队元象XVERSE蚂蚁集团算法数据技术团队腾讯游戏AI大语言模型团队秘塔科技上海算法创新研究院VIVO影像算法研究部亚马逊上海人工智能研究院腾讯游戏手游业务安全团队昆仑天工社招岗位

腾讯混元大模型团队秘塔科技途深智合蚂蚁集团风险智能团队昆仑万维AI游戏团队小红书社区搜索组阿里达摩院多模态团队上海算法创新研究院新东方教育科技集团快手大模型训练引擎团队小红书快手大模型中心VIVO影像算法研究部小红书智能创作团队京东零售九数算法中台Infinity GroundOPPO AI中心大模型算法部上海期智研究院抖音搜索生活服务团队腾讯混元AIGC团队亚马逊上海人工智能研究院商汤研究院基础语言模型团队得物App阿里安全语言语音算法团队腾讯游戏AI大语言模型团队北大—百川联合实验室Shopee Video团队地平线

高校招生

香港中文大学(深圳)林天麟老师香港城市大学马佳葳老师南方科技大学张建国教授浙江大学智能生物医用大分子实验室香港科技大学雪巍老师南方科技大学-香港中文大学(深圳)清华大学MARS Lab多伦多大学孙强教授香港科技大学(广州)聂强老师西湖大学吴泰霖老师得克萨斯A&M大学黄冠豪老师上海科技大学屠可伟老师深圳大学光明实验室伯明翰大学冯悦老师复旦大学智能人机交互实验室香港科技大学(广州)戴恩炎老师北京大学樊文飞院士团队香港中文大学(深圳)刘桂良老师厦门大学郭诗辉老师上海科技大学YesAI Lab清华大学朱军教授香港科技大学(广州)陈城老师清华大学NLP实验室香港中文大学(深圳)刘圳老师香港理工大学林婉瑜老师加州大学默塞德分校王艺炜老师香港科技大学邵琪佳老师剑桥大学机器智能实验室


加入社群  🌟


为了更好地了解和满足大家的需求,我们建立了「求职者社群」

加入 AI 求职社群,你可以享有招聘需求曝光获取最新面试经验校招准备攻略硕博招生独家内推渠道等服务。

扫描下方小助手的微信,pick 你心仪的岗位~



如何发布招聘

AI 求职是「PaperWeekly」旗下聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。

目前已有百度、阿里、腾讯、字节跳动等企业发布内推岗位,欢迎大家订阅关注、发布岗如果你也想对公司和在招职位进行更多曝光,请联系我们的栏目负责人(微信:pwbot02)。··

相关推荐

  • 开放词汇3D物体检测新SOTA!港科大、华为联合发布CoDAv2
  • 高效大模型答案抽取器xFinder:适用于各类LLM评估框架
  • 答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
  • 刚刚!Stable Diffusion 3 重磅开源,超全图像生成必备训练数据集、教程汇总
  • 字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果
  • 【机器学习】优化预测速度 部署机器学习模型的7个要点
  • 大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4
  • 公司现在只发50%的工资,我就出去面试!没想到碰上了领导,他说这公司不行,你不用面了!结果我面试后,HR给我涨薪30%。这是为啥
  • AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降
  • 网传南方医科大学老师为抢救患儿迟到29分钟,被举报扣款2000元?
  • RAG落地中的文档智能处理经验及6月份半月度大模型等进展分享回顾
  • 摸鱼网站精选分享第三番
  • 17岁中专女生姜萍拿下数学竞赛全球第12名!我试着做了这套题,给跪了...
  • 腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题
  • KDD2024-WhoIsWho-Top3开源方案
  • VSCode无限画布模式(可能会惊艳到你的一个小功能)
  • 管理员如何踢掉登录用户?
  • 3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
  • 2024阿里巴巴全球数学竞赛试题&答案
  • 65W!确实可以封神了!