超级对齐:开创AI未来的新篇章

AI快讯 1年前 (2023) admin
3,193 0

就在不久前,OpenAI首席科学家Ilya领导的超级对齐团队发布了该团队成立以来的首篇论文。这标志着对未来超人类模型进行实证对齐的全新研究方向的诞生。

团队声称,他们已经找到了解决超级AI系统对齐的一个核心挑战的新途径。这个挑战在于,人类需要监督比自己更聪明的人工智能系统。而在最新的研究中,OpenAI提出了一个引人注目的问题:小模型是否能够监督大模型呢?

超级对齐:开创AI未来的新篇章

论文地址:超级对齐论文

超级AI的控制难题

在人工智能领域,超级智能——即比人类更聪明的AI——可能在未来十年内出现。然而,对于如何可靠地引导和控制这样的超人AI系统,人类目前仍然一筹莫展。

这个问题至关重要,因为解决它将确保未来最先进的AI系统既安全又造福人类。为了解决这一问题,OpenAI于今年7月成立了超级对齐团队,致力于解决超级智能的对齐难题。

小模型监督大模型?

在论文中,团队提出了一个引人深思的类比:小模型是否能够监督大模型?这个问题涉及到超级AI模型对齐的核心挑战,即弱小的人类如何信任并控制比他们更智能的AI系统。

通过实验证明,使用较小模型(如GPT-2)来监督较大模型(如GPT-4)可以在很大程度上激发出后者的能力,甚至在小模型无法解决的难题上也能正确泛化。这一研究开辟了一个新的研究方向,使我们能够直接解决超级AI模型调整的核心挑战。

实验结果与展望

团队在研究中使用了一种简单的方法,通过GPT-2监督GPT-4,取得了显著的泛化能力提升。在自然语言处理任务中,使用这种方法时,生成的模型通常在GPT-3和GPT-3.5之间性能水平。虽然这种方法存在一些局限性,但结果表明,从弱到强的泛化是可行的。

团队还表示,他们将开源代码,鼓励机器学习社区共同参与对弱到强泛化的研究。

超级对齐的未来计划

为了进一步推动对齐超级模型的研究,OpenAI与Eric Schmidt合作启动了一个价值1000万美元的资助计划。该计划旨在支持技术研究,确保超人类AI系统对齐并保持安全。

资助计划包括向学术实验室、非营利组织和个人研究人员提供10万至200万美元的资助,设立了为期一年、总额为15万美元的OpenAI Superalignment奖学金,特别支持首次从事对齐研究的研究人员。

总结

这一系列的研究成果不仅在对齐超级AI方向上取得了实质性进展,而且通过开源代码和资助计划,OpenAI积极邀请全球的研究者和实践者一同投入这一前沿领域的研究,共同迎接未来人工智能的巨大挑战。这标志着对未来AI发展方向的积极探索,为人工智能领域的未来铺平了新的道路。

版权声明:admin 发表于 2023-12-16 17:23:23。
转载请注明:超级对齐:开创AI未来的新篇章 | ai导航网

暂无评论

暂无评论...