Gemini是谷歌DeepMind團隊基于2012年啟動的人工智能研究計劃開發的多模態大模型,為應對ChatGPT挑戰,谷歌于2023年1月促使聯合創始人回歸并加速AI開發,歷經PaLM、PaLM 2(2023年5月發布)等迭代階段,于2023年12月6日正式發布。
該模型基于Transformer架構,采用原生多模態設計,支持文本、圖像、音頻、視頻及代碼的聯合處理。初代Gemini 1.0包含Ultra(復雜任務)、Pro(通用場景)和Nano(移動端)三個版本,自2023年12月13日起通過Google AI Studio和Vertex AI平臺向開發者開放API。
2024年2月,谷歌將旗下聊天機器人Bard更名為Gemini,推出Advanced版本,并發布Gemini 1.5。2024年12月,谷歌發布Gemini 2.0。2025年3月新增Gemini Embedding模型及推理模型Gemini 2.5。2025年11月18日,谷歌正式發布Gemini 3。模型生態整合至谷歌搜索、廣告系統、Chrome瀏覽器、智能家居及Android Auto車載系統,并在圖像生成、編程輔助、長文本分析等場景廣泛應用。