Gemini是谷歌DeepMind团队基于2012年启动的人工智能研究计划开发的多模态大模型,为应对ChatGPT挑战,谷歌于2023年1月促使联合创始人回归并加速AI开发,历经PaLM、PaLM 2(2023年5月发布)等迭代阶段,于2023年12月6日正式发布。
该模型基于Transformer架构,采用原生多模态设计,支持文本、图像、音频、视频及代码的联合处理。初代Gemini 1.0包含Ultra(复杂任务)、Pro(通用场景)和Nano(移动端)三个版本,自2023年12月13日起通过Google AI Studio和Vertex AI平台向开发者开放API。
2024年2月,谷歌将旗下聊天机器人Bard更名为Gemini,推出Advanced版本,并发布Gemini 1.5。2024年12月,谷歌发布Gemini 2.0。2025年3月新增Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日,谷歌正式发布Gemini 3。模型生态整合至谷歌搜索、广告系统、Chrome浏览器、智能家居及Android Auto车载系统,并在图像生成、编程辅助、长文本分析等场景广泛应用。