超级对齐：开创AI未来的新篇章

AI快讯 2年前 (2023) admin

4,216 0 7

就在不久前，OpenAI首席科学家Ilya领导的超级对齐团队发布了该团队成立以来的首篇论文。这标志着对未来超人类模型进行实证对齐的全新研究方向的诞生。

团队声称，他们已经找到了解决超级AI系统对齐的一个核心挑战的新途径。这个挑战在于，人类需要监督比自己更聪明的人工智能系统。而在最新的研究中，OpenAI提出了一个引人注目的问题：小模型是否能够监督大模型呢？

论文地址：超级对齐论文

超级AI的控制难题

在人工智能领域，超级智能——即比人类更聪明的AI——可能在未来十年内出现。然而，对于如何可靠地引导和控制这样的超人AI系统，人类目前仍然一筹莫展。

这个问题至关重要，因为解决它将确保未来最先进的AI系统既安全又造福人类。为了解决这一问题，OpenAI于今年7月成立了超级对齐团队，致力于解决超级智能的对齐难题。

在论文中，团队提出了一个引人深思的类比：小模型是否能够监督大模型？这个问题涉及到超级AI模型对齐的核心挑战，即弱小的人类如何信任并控制比他们更智能的AI系统。

通过实验证明，使用较小模型（如GPT-2）来监督较大模型（如GPT-4）可以在很大程度上激发出后者的能力，甚至在小模型无法解决的难题上也能正确泛化。这一研究开辟了一个新的研究方向，使我们能够直接解决超级AI模型调整的核心挑战。

团队在研究中使用了一种简单的方法，通过GPT-2监督GPT-4，取得了显著的泛化能力提升。在自然语言处理任务中，使用这种方法时，生成的模型通常在GPT-3和GPT-3.5之间性能水平。虽然这种方法存在一些局限性，但结果表明，从弱到强的泛化是可行的。

团队还表示，他们将开源代码，鼓励机器学习社区共同参与对弱到强泛化的研究。

为了进一步推动对齐超级模型的研究，OpenAI与Eric Schmidt合作启动了一个价值1000万美元的资助计划。该计划旨在支持技术研究，确保超人类AI系统对齐并保持安全。

资助计划包括向学术实验室、非营利组织和个人研究人员提供10万至200万美元的资助，设立了为期一年、总额为15万美元的OpenAI Superalignment奖学金，特别支持首次从事对齐研究的研究人员。

这一系列的研究成果不仅在对齐超级AI方向上取得了实质性进展，而且通过开源代码和资助计划，OpenAI积极邀请全球的研究者和实践者一同投入这一前沿领域的研究，共同迎接未来人工智能的巨大挑战。这标志着对未来AI发展方向的积极探索，为人工智能领域的未来铺平了新的道路。

版权声明：admin 发表于 2023-12-16 17:23:23。
转载请注明：超级对齐：开创AI未来的新篇章 | ai导航网

暂无评论...