夕小瑶科技说 原创
作者 | 智商掉了一地
众所周知,在当今学术界,论文数量和产出速度常常被视为研究者生产力和学术成就的重要标尺。笔者也面试过很多博士生候选人,大家普遍会以自己读博期间发表过10几篇甚至几十篇论文而骄傲,很少有候选人会强调自己读博期间虽然发表论文数量不多,但对某一课题有很深的insight并拿出自己的代表作。
而在高校实验室,大家对于“大神”的认定普遍也是以某某师兄/师姐曾经发表过XX篇顶会论文来完成和比较的。
这种对论文数量的偏重引人质疑,以量取胜的趋势是否能真正反映一个科研人员成果的价值和质量呢?
最近备受瞩目的文生视频模型 Sora,它的两位联合负责人在直博的三年半时间里,并未大量发表论文,仅见刊两三篇论文,这一现象激发了对学术界一个普遍而深刻的思考:很多场景下是否应该坚持以论文数量作为评价标准?在科研实践中,论文的质量到底扮演着怎样的角色?
让我们一起来探索,在追求学术的道路上,应如何权衡论文的数量与质量,以及这种权衡对于自身职业发展和整个学术生态的影响。
Sora 项目的领导团队中,除了 OpenAI 的资深成员 Aditya Ramesh,他本科毕业后便加入了该公司,Sora 的两位联合负责人 Bill Peebles 和 Tim Brooks 作为应届博士毕业生,都 师从 UC Berkeley 的 Alyosha Efros 教授,在博士期间都取得了显著的成就。
Bill Peebles 在 MIT 本科毕业后,仅用了3年零9个月便完成了博士学位。博士在读期间发表了 2 篇一作论文[1]:
The Hessian Penalty: A Weak Prior for Unsupervised Disentanglement(ECCV 2020)
GAN-Supervised Dense Visual Alignment(CVPR 2022,最佳论文候选)
以及 2 篇在投的论文:
Learning To Learn With Generative Models Of Neural Network Checkpoints
Scalable Diffusion Models with Transformers(中稿 ICCV 2023,据悉这是 Sora 背后的核心技术之一,它将 Diffusion 模型与 Transformer 结合起来。Diffusion Model 最初由德国慕尼黑大学提出,据 Meta 的 AI 科学家 Yann LeCun 透露,Sora 的这项基础研究 DiT 曾在 CVPR 2023 的审稿过程中被认为“缺乏创新性”而遭拒稿[2]。然而,这并不影响 Sora 在发布后的短短几天内获得的广泛关注和成功。)
Sora 的另一位联合负责人 Tim Brooks 有着同样引人注目的履历。他于 2023 年取得博士学位,博士生涯仅历时 3 年零 5 个月,尽管他直到博士第三年才开始发表论文,但他以第一作者身份发表了三篇高质量的论文:
除了在 Sora 项目中的贡献外,他还是著名的 DALL.E 项目的作者之一。
你可能会认为他仅仅是 AI 领域的一位科研大佬,但他的兴趣远不止于此。他在学术研究之外还有广泛的艺术爱好,他静可摄影,动可演唱,在文艺界里他也游刃有余,他的个人主页中有很多原创作品[3]。
从高中开始,Tim 的摄影就曾获国家地理、自然最佳摄影和国家野生动物联合会等机构颁发的奖项。
他还曾在百老汇舞台上表演,并因参与阿卡贝拉 beatboxing 获得了国际奖项。
由此可见,Tim 是个妥妥的文艺青年,而 Sora 的诞生,也少不了他在摄影、影片和音乐方面的兴趣驱动。
现在,我们言归正传,探讨这两位联合负责人的经历给我们带来的启示。
从传统的优秀博士研究生标准来看,他们的特点有所不同:读博时间较短(直博时间仅 3 年半左右)、论文发表数量不够突出。
这可能和导师的风格有关,Sora 的两位联合负责人的博导 Alyosha Efros 并不是那种极其严肃的学者形象,他当年的毕业论文附录中甚至包含了一章《伯克利周边的爬山指南》,可见他也是一位很有趣的人。
Alyosha 在个人主页中提到,他正尝试实践“slow science”,也许这是他没有 push 这两位博士量产文章的原因之一吧。
究竟什么是“slow science”呢?它甚至有一个专门的网站[4],这个概念阐述了一种对待科研的态度,其中提到的“科学需要时间来思考,科学需要时间阅读、需要时间失败”令人深受触动。
在当今竞争激烈的科研环境中,与追求短期成果和即时反馈的快节奏科学不同,“slow science”强调了科学研究的持久性和深度,呼吁我们更加注重科研的质量。
想起之前与导师的闲聊,他感慨现在毕业评优对于论文数量的要求越来越卷,听说有位同学靠着读博期间十几篇论文拿到了优秀毕业生,这样的产出能力让我大受震撼。
为何学术研究的风向变成了追赶顶会 DDL、比拼论文数量的“快餐式”科研?目前,学术界普遍存在对论文数量和发表速度的过度追求,许多研究者深受“发表或湮灭(publish or perish)”压力的驱使,这背后的原因错综复杂。
在学术界,尤其是国内的高等教育和研究机构中,论文数量常常被用作衡量学术成就和招聘条件的重要指标。在某些招聘条件中,甚至会明确要求应聘者在特定期刊上发表一定数量的论文,据此给应聘者打上对应的标签。
在算法岗位的求职过程中,为了迅速筛选不同水平的候选者,比较论文数量可能成为最有效的方法。有时候,顶会论文数量的差距可能就是求职者之间的分水岭。
然而,这种“快餐式”科研的趋势虽然在某种程度上促进了知识的快速传播和产出,但也带来了一系列负面影响。对论文的过度追求可能导致学术质量的降低、研究不端行为(如数据造假、剽窃等)、以及对创新和深入研究的忽视,这些问题都指向了学术评价体系的不足。
去年,《Nature》杂志上发表的一篇文章指出,“近年来科研论文数量激增,却缺少颠覆性创新”,研究人员跨越多个学科,通过分析数十年来科技成就的创新动态指数趋势,旨在评估研究成果在颠覆性方面的整体变化。然而结果显示,论文和专利更倾向于深化既往研究,而非开拓新的领域。
当前的科研体系已经高度成熟并形成了一种“产业化”模式,科学家们被困在了一个忙碌的“职业陷阱”中,不断追逐所谓的职业发展,却往往缺乏进行重大科技创新所需的自由和时间。导致大部分学者没有足够的动力,在科研任务之外考虑工业界落地的问题。
研究人员提出了几点建议:
AI 领域的一些研究人员在顶级会议上大量发表论文,甚至一些团队采取流水线作业方式高频产出文章,这也反映了学术评价体系存在的一定缺陷。正是由于缺乏有效的后续验证和相对较低的实验门槛,使得该领域的论文数量和发表速度相比于计算机科学的其他分支显得略为夸张。
实际上,我们不应对学术界过于苛责。一篇顶会或顶刊,加上编辑也就寥寥几人的评审流程,别说发掘一项研究的全部价值,就算能够完全理解核心观点并在很全面的维度上评估已经实属不易。
然而,真正具有前瞻性的优秀研究,在最初出现时往往难以获得正确的评价,因为它们可能超出了当前的研究范畴,或是提出了全新的概念。这样的研究可能需要时间来被学界广泛接受和理解,因此在初次提交时可能不被充分认可,正如被拒稿后重投的《Scalable Diffusion Models with Transformers》一文,当 Sora 出现在公众视野时,这篇论文才重新受到关注。
长期以来,学术界普遍认同一个观点:撰写学术论文是一种有价值和有意义的活动。这种认识逐渐演化成了一个等式——做有意义的工作等同于撰写更多的学术论文。这一思维模式不仅在学术界获得了广泛认可,而且成为了评估学者工作和贡献的重要标准。
然而,过于追求发表论文,可能扭曲了许多人的价值观。学者们可能会过度关注论文的数量和产出速度,忽视了论文的质量、研究的深度以及对社会的实际影响。这种偏向可能导致学术界过度追求短期成就,而忽略了长期的知识积累和创新。
更为严重的是,这种趋势可能会淡化科研的根本目的:探索未知、解决实际问题、传播知识和促进社会进步。当论文成为目的而非手段时,科研的真正价值就可能会被忽视。在这种情况下,科研工作可能会变得形式化和功利化,不再是出于对知识的纯粹追求和对社会贡献的真诚愿景。
因此,我们需要重新审视和调整我们的价值观,以确保科研活动不仅仅是为了发表论文,而是为了追求更深层次的学术探索和社会发展。这可能需要学术界、资助机构和政策制定者共同努力,创造一个更加平衡和健康的科研环境,让学者们可以自由地追求有深度、有影响力且真正有意义的研究。
经过深入讨论,我们得出结论:尽管论文数量和发表速度在一定程度上能够反映研究者的学术活跃度和影响力,但它们决不能成为评价科研价值的唯一或最重要的标准。
Sora 的两位作者向我们展示了,论文的价值在于质量而非数量,只要其质量过硬,同样能够在社会各界产生重大影响,并推动科学的进步。因此,我们应该鼓励学术界和评价体系更加重视研究的创新性、深度和实际影响,而非一味地追求产出更多论文。
不要在日复一日的实验中变得麻木,拥有一个热爱生活并有趣的灵魂也至关重要。有时,放慢步伐实际上是为了提升工作质量,让我们一起试着“slow science”。科学需要时间来思考,我们应该更多地关注实验设计和批判性思考,努力提升研究的深度和广度,不为了发论文而去发论文。
最终,我们期待一个更健康、公正且多元的学术评价环境的出现,这将是推动科研工作质量真正提升的关键。让我们共同努力,为了一个以质量和创新为核心的学术未来,不断探索和前行。