引言
谷歌最新推出的Gemini 1.5模型在AI圈引起了巨大关注。内测资格的大佬们通过一系列极限测试,尝试揭示Gemini 1.5的真实水平。本文将深入探讨Gemini 1.5在处理不同场景的表现,以及其对Sora等竞品的应对能力。

樱花雪景视频
Gabor Cselle进行了一项极富挑战性的测试,要求Gemini 1.5分析一段樱花雪景视频。Gemini 1.5指出视频存在明显问题,如雪下得过于规律、樱花依然盛开等。尽管视觉效果令人惊叹,Gemini 1.5准确地指出这并非真实场景。这展示了Gemini的高度识别和理解能力。
丛林漫步视频
Rowan Cheung测试了一段猫在丛林漫步的视频,Gemini 1.5给出的评价更为谨慎。虽然一些细节看起来自然流畅,但Gemini 1.5提到了猫的眼睛异常放大和毛皮质感过于完美无瑕。Gemini 1.5在面对复杂而真实的场景时展现出更慎重的判断,留下了判断视频真伪的空间。
Sora与Gemini的对决
Sora作为Gemini的竞争对手,其视频生成技术已经达到了难以分辨真伪的地步。然而,Gemini 1.5的分析能力基本到位,通过对视频细节的敏感识别,准确指出了可能的AI痕迹。
上下文窗口的拓展
Gemini 1.5创下了处理上下文窗口达到100万token的纪录。这一突破使得Gemini在处理提示时能够接纳更多信息,进而输出更加连贯和实用的结果。从处理长视频到11小时音频、超过30,000行代码库,再到超过700,000个单词的文本,Gemini 1.5展现出强大的处理能力。
结语
Gemini 1.5作为一款强大的AI模型,通过极限测试展示了其在不同领域的卓越表现。在视频分析和对抗竞争对手Sora方面,Gemini 1.5表现出色,而100万token的上下文窗口则为其提供了更广泛的应用场景。Gemini 1.5的推出,标志着AI领域迎来了一次重要的技术飞跃。