谷歌在正在进行的 I/O 2024 开发者大会上宣布,其最新的生成式 AI 模型 Gemini 1.5 Pro 现已向 Gemini Advanced 订阅用户开放。此外,谷歌还为 Gemini 1.5 Pro 模型添加了多项新功能,目前该模型已在 150 多个国家/地区提供 35 多种语言版本。
Gemini Experiences 和Google Assistant副总裁兼总经理 Sissie Hsiao表示:“Gemini 旨在成为您的个人 AI 助理,它具有对话性、直观性和实用性。无论您是在应用程序中使用它还是通过网络体验使用它,Gemini 都可以帮助您处理复杂的任务,并且可以代表您采取行动。”
谷歌还将 Gemini 深度整合到日历、任务和 Keep 中,类似于地图和 YouTube,让用户无需离开这些应用程序即可利用生成式 AI 功能。
Gemini 1.5 Pro 利用其多模式功能,在图像理解方面也得到了很大的改进,人们可以点击餐厅里一道菜的图片,人工智能就可以描述菜谱,也可以通过逐步解释解决教科书中的数学问题。
Gemini 1.5 Pro 型号的新功能包括更大的上下文窗口,最多可容纳 100 万个标记。据称这是世界上所有消费者聊天机器人中可用的最长的上下文窗口,允许用户扫描最多 1,500 页的大型文档或书籍,并能够一次汇总最多 100 封电子邮件。
未来几天,谷歌甚至将增加处理一小时视频内容的能力,以及包含超过 30,000 行代码的代码库。
除此之外,谷歌还允许用户直接从设备或通过 Google Drive 将文件上传到 Gemini,以快速获取事实、见解和答案。在这里,Gemini 将充当数据分析师,甚至可以从上传的数据中构建自定义聊天和可视化模型。