OpenAI研究 评估代码生成模型的经济影响的研究议程
OpenAI 正在开发一项研究计划,以评估代码生成模型的经济影响,并邀请外部研究人员合作。在代码上训练的大型语言模型 (LLM) 能力的快速进步使得研究它们对个人、公司和社会的经济影响变得越来越重要。Codex——OpenAI 通过对 GitHub 上数十亿行公开可用代码微调 GPT-3 开发的 LLM——已被证明在评估问题样本上生成功能正确代码的概率为 28.8%(Chen 等人,2021 年) ). 这可能对编码的未来和依赖它的行业的经济产生重要影响。在本文件中,我们制定了一项研究议程,以评估法典对政策制定者、企业和公众感兴趣的经济因素的影响。我们通过强调代码生成模型对软件开发的潜在广泛适用性、随着模型能力的进步其他 LLM 产生重大社会和经济影响的潜力以及使用 Codex 生成证据和建立可能适用于研究未来模型的经济影响的方法。我们建议学术和政策研究重点研究代码生成模型和其他 LLM,以便可以使用有关其经济影响的证据为三个关键领域的决策提供信息:部署政策、AI 系统设计和公共政策。为了帮助指导这项研究,我们概述了我们打算使用 Codex 研究的经济影响领域内的六个优先成果领域:生产力、就业、技能发展、公司间竞争、消费者价格和经济不平等。对于每个领域,我们简要讨论了以前关于人工智能对这些结果的影响的文献,描述了我们认为是上述三个决策领域的关键输入的问题,并提供了可以通过以下方式进行的研究示例法典。为了促进建立在这个初步研究议程基础上的工作,我们宣布了一项征集外部研究人员的意向书,与 OpenAI 研究人员和客户合作,以更好地衡量代码生成模型和其他 LLM 的经济影响。