Sora模型引领AI新突破:五大能力重塑视频生成

这个春节着实精彩,“春山学”吃透了,不如把目光移向OpenAI又一重磅产品——文生视频大模型Sora。智能新纪元已然开启,因为正如周鸿祎所说:“,Sora的诞生意味着AGI(通用人工智能)的实现将从10年缩短到1年。”

Sora模型之所以引起全球的关注,在于其可根据简短提示词,生成长达60s 高清短视频,将此前行业视频生成长度大幅提升。该模型实现了文生视频五大能力突破:

1、文本到视频,长时生成能力

Sora 能够根据用户提供的文本描述生成长达 60s 的视频,这此视频不仅保持了视觉品质,而且完整准确还原了用户的提示语。

素材来源:OpenAI官网

2、复杂场景和角色生成能力

Sora 可以生成具有多个角色、特定的运动类型以及细节精准的主题与背景所构建的复杂场景。通过对生动角色以及复杂运镜的应用,视频具有高度真实性和叙事效果。我们认为对于短视频创作行业,制作者可以快速将创意进行视频化,并带来逼真的视觉效果。

素材来源:OpenAI官网

3、深刻语言理解能力

Sora 对语言拥有深刻理解能力,可以准确解释提示并生成可以表达丰富情感引人注目的角色。我们认为 Sora 对语言的理解能力可以准确的反应用户的指令,从而创作出更加优质的作品。

素材来源:OpenAI官网

4、多镜头生成能力

Sora 可以在单个生成的视频中创建多人镜头,同时可保持角色与视觉风格的一性。多镜头生成功能对于影视制作及其他多视角展示作品可起到极大辅助作用。

素材来源:OpenAI官网

5、物理世界模拟能力

Sora 不仅可以理解用户在提示中输出的指令,还可以理解所生成的事物在物理世界存在与运行的方式,从而展现了人工智能在理解现实世界并与之互动的能力。Sora 可以模拟真实物理世界的运动,例如物体的移动、习性以及相互作用。

素材来源:OpenAI官网


虽然有些人对OpenAI声称的Sora可以理解“物理规律”表示怀疑,但这个一分钟的视频所展示的效果,毫无疑问是人工智能的进一步取得。

从ChatGPT到Sora,AI正在加速普及。基于大模型的生成式 AI,快速衍生出一系列亲民值爆表的 AI 工具:文生图、文生视频、文生游戏、文生代码...聚焦软件开发领域,文生代码正在重塑软件开发关键节点,帮助开发人员提高工作效率。

以飞算SoFlu软件机器人推出的FuncGPT(慧函数)为例,作为一款专注AI生成Java函数的生成器,FuncGPT(慧函数)支持所有类型函数创建。通过自然语言描述Java函数需求,实时生成高质量、高可读性的Java函数代码。生成代码可直接复制到IDEA,或一键导入Java全自动开发工具函数库,帮助开发人员高效完成工作任务。

SoFlu软件机器人作为一款全栈式全自动的软件开发工具,覆盖软件前端开发、后端开发、测试、运维全过程,旨在改变原来手工编码的作业模式,通过可视化拖拽方式以及参数配置就能实现等同于编写复杂代码的业务逻辑,在设计业务逻辑的同时就完成了微服务应用开发,做到“业务即图,图即代码”,实现“软件开发,十倍提效”。

以某特大型央企石油集团旗下大型电商平台重构项目为例,传统模式下至少需要27人,开发300多天才能完成的项目,在使用了飞算SoFlu软件机器人后,9人小团队在5个软件机器人的协助下,仅用45天就完成了商城的重构及上线,并且在保障系统强壮度和安全性的同时从源头上降低系统维护难度。该项目负责人事后感叹,团队利用飞算SoFlu软件机器人实现了自主研发,做到了以前不可能完成的事情。

飞算SoFlu软件机器人搭载FuncGPT(慧函数),配以代码实时可见、人机交互智能等功能, 使得开发人员、企业得以体验人工智能带来的惊人变革。根据用户反馈,当作为生产工具使用时,AI的最大价值可能不仅仅是提高工作效率,而是帮助人们成为更全面的人才,使人们能够迅速掌握以往从未具备的技能。

毫无疑问,新技术并不会立刻产生效果,人们需要时间去学习如何有效地利用它。


1899年,汽车行业只有几千名从业者,每年仅生产出2500辆汽车。当微软电脑刚问世时,人们认为其销量不会超过一千台。在一档访谈节目中,主持人不以为然地说,电脑只是将收音机和电视机整合在一起,不知道有什么用处。


人工智能也是如此,即使是同一个智能机器人,我们会发现它展示出的能力是有差异的,智能机器人的表现取决于用户的知识水平、专业技能,以及提示词的应用能力。


我们相信,总有一天人工智能会像办公软件一样成为每个人日常生活中不可或缺的工具。至于它对人们的职业发展和社会进步会有怎样的影响,这还需要时间来揭示。目前可以确定的是,就像视频中展现的那位自信的女性一样,人工智能正在坚定地走进我们的生活。

老乡鸡“开源”了 deepin-IDE 终于实现了自举! 好家伙,腾讯真把 Switch 变成了「思维驰学习机」 腾讯云4月8日故障复盘及情况说明 RustDesk 远程桌面启动重构 Web 客户端 微信基于 SQLite 的开源终端数据库 WCDB 迎来重大升级 TIOBE 4 月榜单:PHP 跌至历史最低点 FFmpeg 之父 Fabrice Bellard 发布音频压缩工具 TSAC 谷歌发布代码大模型 CodeGemma 不要命啦?做的这么好还开源 - 开源图片 & 海报编辑器工具
{{o.name}}
{{m.name}}

猜你喜欢

转载自my.oschina.net/u/4868096/blog/11044508