DeepMind CEO：谷歌最终将合并 Gemini 和 Veo AI 模型 - 代码天地

DeepMind CEO：谷歌最终将合并 Gemini 和 Veo AI 模型

业界资讯 2025-04-11 17:04:50 阅读次数: 0

谷歌 DeepMind 首席执行官 Demis Hassabis 最近在 LinkedIn 联合创始人 Reid Hoffman 联合主持的播客 Possible 上表示，谷歌计划最终将其 Gemini AI 模型与其Veo 视频生成模型相结合，以提高前者对物理世界的理解。

Hassabis 表示：“我们从一开始就将 Gemini 打造成多模式的基础模型，我们这样做的原因是我们对通用数字助理这一理念有一个愿景，这种助理……能够在现实世界中真正为你提供帮助。”

AI 行业正逐渐走向“全能”模型——可以理解和合成多种媒体形式的模型。谷歌最新的 Gemini 模型可以生成音频、图像和文本，而 OpenAI 的 ChatGPT 中的默认模型可以原生创建图像，包括吉卜力工作室风格的艺术作品。亚马逊也宣布计划在今年晚些时候推出“any-to-any”模型。

而这些全能模型需要大量的训练数据，譬如图像、视频、音频、文本等等。Hassabis 暗示，Veo 的视频数据主要来自谷歌旗下的平台 YouTube。“基本上，通过观看 YouTube 视频--大量的 YouTube 视频，[Veo 2] 就能了解世界的物理原理。”

谷歌此前曾向 TechCrunch 表示，根据其与 YouTube 创作者的协议，其模型“可能”会使用“部分”YouTube 内容进行训练。据报道，谷歌去年扩大了服务条款，部分原因是为了让该公司能够利用更多数据来训练其 AI 模型。

猜你喜欢

转载自www.oschina.net/news/343969/deepmind-ceo-google-combine-gemini-and-veo-ai-models

DeepMind CEO：谷歌最终将合并 Gemini 和 Veo AI 模型

[AI 大模型] Google Gemini

【AI开源大模型】Falcon 40B——排名第一的AI模型（比 GPT-3 以及 DeepMind 和谷歌的模型更便宜、运行速度更快）

谷歌发布最强AI大模型Gemini（超越chatgpt4）

超越GPT-4！谷歌AI大模型Gemini震撼发布

OpenAI 又赢麻了谷歌 DeepMind 创始人刚称 Gemini 能碾压 GPT-4

AI日报：谷歌Gemini Pro即将面向企业和开发者

深度揭秘 AI 巨头之谷歌 DeepMind

大语言模型之五谷歌Gemini

Google DeepMind推出大模型 Gemini （vs GPT4）：规模最大、能力最强的人工智能模型

《经济学人》深度报道：DeepMind和谷歌的AI拉锯战

DeepMind给AI模型做了个IQ测试，结果是这样的

谷歌创始人布林重返职场，投入研发AI杀手锏！预计下半年推出下一代通用模型『Gemini』，和OpenAI的终局之战！

Gemini Pro 加持，谷歌 AI 笔记 Notebook LM 重磅升级！

DeepMind和Unity合作，创建虚拟世界来训练AI

Google 推出的 Gemini 2.0 Flash AI 模型支持 AI 图像去水印

[Google] DeepMind Gemini：新一代LLM结合AlphaGo技术将力压 GPT-4｜未来 AI 领域的新巨头

谷歌发布大模型Gemini，赶超GPT4

阿里巴巴宣布分红25亿美元；小米14系列手机内核已在GitHub开源；谷歌推出最强AI模型Gemini | 极客头条

深度学习之Deepmind WaveNet模型和Keras实现

Emu3：北京智源推出AI多模态世界模型，超越DeepMind和微软，刷新了8项性能指标

谷歌推出全新AI模型Gemini；AMD推出新款高性能AI芯片挑战英伟达；台积电自研聊天AI tGenie已投入运营丨每日大事件...

Google 发布最强 AI 模型 Gemini，性能超「GPT-4」

国外AI大模型（OpenAI、Anthropic、Gemini、Copilot、Llama3、xAI、Groq、BloombergGPT）

Gemini：AI领域的璀璨明星

Google DeepMind、OpenAI等联合发文：AI大模型的极端风险，如何评估？

Nature封面：“揭穿”一切！Google DeepMind为AI大模型添加了“隐形指纹”

从AlphaGo到AlphaFold-DeepMind在AI大模型中的突破与实践【附核心代码】

Gemini API 和 Google AI Studio 升级，提升搜索准确性和响应能力

Imagen 2 发布、Gemini Pro 免费体验、代码平台 Duet AI 上线，谷歌大爆发

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)