Google史上最强大AI正式亮相!Gemini超强功能曝光,会编程、懂推理,比ChatGPT 4还要厉害!
Published by谷歌(Google)在今年5月举办的开发者大会上透露正在开发AI大模型Gemini,没想到时隔7个月,Gemini终于在12月6日面世了!根据科技界行家的讨论,这是谷歌至今为止构建得最强大、最通用、最灵活的模型。到底Gemini的功能有多强大呢?
什么是 Gemini?
Gemini由Google和其母公司Alphabet共同创建,是谷歌最新发布的强大人工智能模型,它不仅可以理解文本,还能处理图像、视频和音频,功能非常强大!此外,Gemini还能在数学、物理等领域完成复杂任务,同时能够理解并生成各种编程语言中的高质量代码。
为了满足不同的计算需求,谷歌一共推出3款Gemini,分别是Gemini Nano、Gemini Pro和Gemini Ultra。
- Gemini Nano:谷歌最高效的设备端任务模型。专为智能手机设计,特别是Google Pixel8。它专为在设备上执行需要高效AI处理的任务而构建,无需连接到外部服务器,如在聊天应用中建议回复或总结文本。
- Gemini Pro:谷歌可扩展任何任务的最佳模型。在谷歌的数据中心运行,旨在为公司最新版本的AI聊天机器人Bard提供动力,它能够快速响应并理解复杂的查询。
- Gemini Ultra:谷歌最大、最有能力的模型,适用于高度复杂的任务。虽然尚未广泛推出,但谷歌将Gemini Ultra描述为其最强大的模型。在大语言模型研发的32个广泛使用的学术基准中,它在30个基准中表现卓越。设计用于执行高度复杂的任务,在完成当前测试阶段后将发布。
怎么使用Gemini?
Gemini现在可以在Google产品中的Nano和Pro版本上使用,如Pixel8手机和Bard聊天机器人。谷歌计划随着时间的推移将Gemini逐步整合到其搜索、广告、Chrome和其他服务中。此外,开发人员和企业客户将从12月13日开始,可以通过Google的AI Studio和Google Cloud Vertex AI中的Gemini API开始访问Gemini Pro。
Gemini和其他AI模型有什么不同?
谷歌的Gemini似乎是至今为止最大、最先进的AI之一。与当前驱动AI聊天机器人的其他流行模型相比,Gemini因其本地多模态特性而脱颖而出,而其他AI模型如GPT-4则依赖于插件和集成才能真正实现多模态。
和GPT-4相比,Gemini可以轻松进行本地多模态任务。虽然GPT-4在语言相关任务方面表现出色,如内容创作和复杂文本分析,但它需要依赖OpenAI的插件进行图像分析和访问网络,并依赖DALL-E3和Whisper生成图像和处理音频。
*部分照片取自网络,内容谈谈网归有,若想参考请附加此文的链接。谢谢!照片如有侵犯版权问题请告知,谈谈网必定删除。