Google Gemini
AI写作 AI绘画 AI编程 AI聊天
Google Gemini

Google推出的AI,对标OpenAI的ChatGPT

Gemini是一款由Google DeepMind(谷歌母公司Alphabet下设立的人工智能实验室,是谷歌的兄弟公司)于2023年12月6日发布的人工智能模型,可同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。首个版本为Gemini 1.0,包括三个不同体量的模型:用于处理“高度复杂任务”的Gemini Ultra、用于处理多个任务的Gemini Nano和用于处理“终端上设备的特定任务”的Gemini Pro。

主要功能

播报

编辑

三种模型

谷歌针对Gemini(1.0)优化了三个不同体量的模型,分别应用于不同的场景:
模型规模
模型描述
Gemini Ultra
虽然目前还没有被广泛使用,但谷歌将Gemini Ultra描述为其最强大的模型。可在各种高度复杂的任务(包括推理和多模态任务)中提供最先进的性能。由于采用了Gemini架构,它可以在TPU加速器上高效地提供大规模服务。该版本将于2024年在Bard中推出,并通过云API提供服务(前提是经过“广泛的信任和安全检查”)。该模型被定位于击败ChatGPT 4.0。
Gemini Pro
在成本和延迟方面性能优化的模型,可在广泛的任务范围内提供较优性能。该模型表现出强大的推理性能和广泛的多模态能力。Gemini Pro在谷歌的数据中心运行,旨在支持公司AI聊天机器人Bard的最新版本,它能够快速响应并理解复杂的查询。该模型定位于击败ChatGPT 3.5。
Gemini Nano
用于在数码设备上运行的最高效模型,目前应用于谷歌的智能手机系统,特别是Google Pixel 8(谷歌智能手机),旨在执行需要高效AI处理但不需要连接到外部服务器的本地任务,比如在聊天应用中建议回复或总结文本,分别应用于Pixel 8录音机应用中的自动摘要功能,以及Gboard键盘的智能回复部分。谷歌训练了两个Nano版本,参数分别为18亿(Nano-1)和32.5亿(Nano-2),分别针对低内存和高内存设备。它是通过从更大的Gemini模型中提取精髓进行训练。该模型经过4位量化(量化是指将连续的模拟信号转换为离散的数字信号的过程;4位量化即数字信号的每个采样点数值表示为4位二进制数,其可以表示16个不同的数值)以进行部署,并提供最佳性能。

相关导航