Open AI 持续的研究中,不断探索引入新的技术路线。这次引入的强化学习方法,很好地提升了模型的效果。在研究中,Open AI 在模型训练中,引入了人类专家。专家一方面帮助 ChatGPT 撰写更符合人类习惯的回答,另一方面,也对生成的结果进行排名,通过这样的奖励机制,实现模型的微调优化。
组织文化
Open AI 自成立之初,就致力于打造通用 AI 的能力,并坚定的持续投入,这是 ChatGPT 成功的一大关键因素。在这样的愿景下,吸引了一大批高水平的人才,在没有任何商业 KPI 的情况下心无旁骛地开展研发工作,最终取得了重大的突破。
反馈机制
通过用户的使用, Open AI 可以获得用户对于模型优劣和使用体验的反馈,从而形成了模型使用到体验反馈的闭环,从而进一步优化模型。此外,Open AI 还组织专门的反馈竞赛,鼓励用户针对回答中的风险危害、新颖的回答建议等方面给予反馈,参赛者有机会赢取 500 美元的 API 积分,并可兑换相应奖品。
尚未开源,目前是以 API (应用程序编程接口)调用的方式服务,目前也暂无开源计划。 Open AI 不 Open ,是业界很多人诟病的地方。开源是多年来软件和互联网产业之所以蓬勃发展的核心动力之一。开源的方式可以调动全球开发者的积极性,每个人都可以下载源代码使用,并进行优化和在社区分享。这种用全社会的力量来创新的机制,大幅加速了技术科研攻关、产业应用的进程。 关于 ChatGPT 为何不开源,业界也有一些专家表示认可,因为人工智能技术至今为止还是一个黑盒,关于其内部的机制尚未可知,如果代码开源,很难避免该技术用于一些不利于社会和人类的方面。此外,自从 Open AI 放弃了非盈利组织的定位,接受微软等投资后,从商业化的角度考虑,也会采取整体模型闭源,开放应用接口的方式来推广,同时也会开源少部分模型,丰富开发者生态。