【AI资讯汇总】2024年12月第二周

目录

OpenAI正式上线Sora,ChatGPT Pro用户可无限生成、最长20秒

谷歌发布新一代大模型Gemini 2.0,掀了AI圈牌桌,全力狙击OpenAI

OpenAI向所有用户开放ChatGPT Canvas 功能,新增支持Python代码运行

王者降临!苹果全家桶接入ChatGPT,重塑iPhone、iPad 、Siri

OpenAI 推出全新 ChatGPT Projects,集成多项实用工具


OpenAI正式上线Sora,ChatGPT Pro用户可无限生成、最长20秒

关键看点

  • OpenAI 发布 Sora Turbo,一款超写实 AI 视频生成软件。
  • 软件支持文本和图像生成视频,时长可达10至20秒。
  • 提供480p、720p、1080p分辨率和多种画面比例。
  • 设有情节提要功能,实现视频剪辑流畅过渡。
  • ChatGPT Plus 用户每月可生成50个视频,Pro 用户无限制。
  • 2025年初将发布更多定价选项。
  • 软件对生成真实人像、暴力和露骨主题有严格限制。

详情

  • Sora Turbo 发布:OpenAI 推出 Sora Turbo,支持 ChatGPT Plus 和 Pro 用户,订阅费用分别为每月20美元和200美元,服务覆盖美国及大部分非欧盟和英国地区。
  • 视频生成能力:用户可以通过文本输入或静态图像生成10至20秒的视频,支持480p、720p、1080p分辨率,以及16:9、1:1、9:16三种画面比例。
  • 用户界面:Sora Turbo 设计了新用户界面,支持网格或列表视图,方便用户查看和管理视频作品。
  • 情节提要功能:用户可以在时间轴视图中生成多个相互关联的剪辑,自由调整剪辑切换方式,创造流畅视觉效果。
  • 视频生成限制:ChatGPT Plus 用户每月最多生成50个视频,分辨率720P、5秒,有水印;Pro 用户可快速生成500个视频,支持1080P、20秒、无水印,享有慢速无限生成服务。
  • 定价选项计划:OpenAI 计划在2025年初之前发布更多针对不同用户需求的定价选项。
  • 内容生成限制:Sora Turbo 对生成真实人像、暴力和露骨主题实施了严格的限制,以防止不当内容的产生。

链接

OpenAI正式上线Sora,ChatGPT Pro用户可无限生成、最长20秒


谷歌发布新一代大模型Gemini 2.0,掀了AI圈牌桌,全力狙击OpenAI

关键看点

  • 谷歌发布新一代大模型Gemini 2.0,性能提升,支持多模态输出。
  • 推出多模态实时API,展示三个智能体研究原型。
  • Gemini 2.0旨在提升投资回报率,增强谷歌在AI领域的竞争力。
  • Gemini 2.0 Flash在性能上超越参数量级更大的模型。
  • Gemini 2.0支持原生图像生成和音频输出,以及使用Google搜索和地图。
  • Gemini 2.0 Flash使用量增长超过900%。
  • 谷歌展示Project Astra、Project Mariner和Jules三个智能体研究原型。
  • Gemini 2.0背后有新一代TPU芯片Trillium的支持。

详情

  • Gemini 2.0发布:谷歌发布新一代大模型Gemini 2.0,速度翻倍,能力更强,支持原生图像生成和音频输出的多模态输出,以及原生使用Google搜索和地图等工具。
  • 多模态实时API:谷歌推出新的多模态实时API,支持实时音频、视频流输入和多个组合工具的使用,展示了三个智能体研究原型:Project Astra、Project Mariner和Jules。
  • 业务防御与投资回报:谷歌Gemini 2.0的发布是对固有业务的防御,以期在更低成本下实现更强大的能力所带来的投资回报率提升。
  • 性能提升:Gemini 2.0 Flash在性能上超越了参数量级更大的1.5 Pro模型,没有提供具体数据对比,但竞技场新王Gemini-Exp-1121正是Gemini Flash 2.0,超越了ChatGPT-4o和o1 Preview,登上第一。
  • 多模态能力:Gemini 2.0不仅能理解文本、图像、视频、音频和代码,还能原生生成图像和多语言音频,这是其他领先模型做不到的。
  • 长上下文理解:Gemini 2.0支持更长的上下文,Gemini 1.5 Pro已支持200万token的海量上下文窗口,Gemini 2.0不会低于此水平。
  • 工具使用能力:Gemini 2.0能原生调用Google搜索、执行代码以及使用第三方用户定义的功能。
  • 用户使用增长:Gemini 2.0 Flash在正式发布前就已经获得了用户用脚投的票,Flash使用量的增长超过900%。
  • 硬件支持:新一代TPU芯片Trillium支持了Gemini 2.0的全部训练和推理过程,训练性能提升超过4倍,推理吞吐量提升达3倍,每芯片的峰值计算性能提升4.7倍,同时能耗效率提升67%。

链接

谷歌发布新一代大模型Gemini 2.0,掀了AI圈牌桌,全力狙击OpenAI


OpenAI向所有用户开放ChatGPT Canvas 功能,新增支持Python代码运行

关键看点

  1. OpenAI 向所有 ChatGPT 用户开放 Canvas 功能。
  2. Canvas 支持 Python 代码运行和图形预览。
  3. 用户界面更新,提高工作效率,即时提供文本和代码建议。
  4. 自定义 GPT 用户可以集成 Canvas 并自定义使用参数。

详情

  1. Canvas 功能开放:OpenAI 在其 “12Days of OpenAI” 系列直播活动中宣布,将 Canvas 功能扩展至所有 ChatGPT 用户,之前仅限于付费用户使用。
  2. 用户界面变化:Canvas 改变了 ChatGPT 的传统界面,将对话框设置在页面顶部,新增右侧内容编辑区域,用户可以在此撰写代码块或文本文件。
  3. 对话与编辑集成:用户与 ChatGPT 对话时,请求的修改结果会直接呈现在边栏,提高了工作效率,并允许即时提供文本和代码建议。
  4. Python 代码支持:Canvas 现在支持运行 Python 代码,用户可以直接粘贴代码到 ChatGPT 中,系统会自动打开 Canvas 并运行代码。
  5. 图形预览与错误检查:Canvas 能够根据代码自动生成和预览图形,为开发者和分析师调整公式或数据提供便利,并具备查找代码错误并提出修正建议的功能。
  6. 自定义 GPT 集成:对于自定义 GPT 用户,Canvas 默认集成,但用户可以自行定义何时及是否在其创建的助手中打开 Canvas。
  7. 未来功能改进:OpenAI 表示,未来将继续改进 Canvas,并推出更多新功能。

链接


王者降临!苹果全家桶接入ChatGPT,重塑iPhone、iPad 、Siri

关键看点

  • 苹果设备(iPhone、iPad、Mac)和Siri将原生集成ChatGPT。
  • iPhone 16及以上型号支持ChatGPT的高级视觉功能。
  • Siri得到强化,能更深度理解问题并提供更准确回答。
  • 苹果的加入将极大提升ChatGPT的曝光度和使用范围。

详情

  • 苹果设备集成ChatGPT:OpenAI宣布苹果的iPhone、iPad、Mac和Siri可以原生使用ChatGPT,这将重塑这些设备的用户体验。
  • iPhone 16高级视觉功能:iPhone 16及以上型号可以使用ChatGPT的高级视觉功能,相机控制功能能对图像进行分析并提取关键元素,然后由ChatGPT进一步理解和处理。
  • Siri强化:Siri现在能与ChatGPT协同工作,提供更准确、详细的回答,例如在组织圣诞派对时提供客人名单、音乐和娱乐安排等建议。
  • ChatGPT文本生成与理解:Mac系统中可以原生使用ChatGPT,ChatGPT能解读技术报告并详细阐述技术如何协同工作,还能根据用户要求制作数据可视化图表。
  • 苹果对ChatGPT的需求:苹果非常需要ChatGPT的集成,以提升其智能设备的能力和用户体验。

链接

王者降临!苹果全家桶接入ChatGPT,重塑iPhone、iPad 、Siri


OpenAI 推出全新 ChatGPT Projects,集成多项实用工具

关键看点

  • OpenAI 发布 ChatGPT Projects,集成多项实用工具。
  • 功能包括文件上传、自定义对话、Canvas、网络搜索等。
  • 用户可通过创建项目组织工作内容,提升工作效率。
  • 支持上传多种文件类型,增强对话深度与针对性。
  • 提供对话管理工具,帮助团队组织和搜索沟通记录。
  • 集成网络搜索、Canvas、实时聊天协作和代码执行工具。
  • 目前仅对ChatGPT Plus、Pro和Teams用户开放,未来将向免费用户开放。

详情

  • ChatGPT Projects 发布:OpenAI 在技术直播中发布了 ChatGPT Projects,标志着 ChatGPT 从对话平台发展成为协作平台。
  • 项目组织功能:用户可以创建项目来组织不同的工作内容,如家庭聚会,并通过颜色区分项目。
  • 文件上传功能:用户可以上传PDF、数据电子表格、图片和音频文件,使 ChatGPT 能够基于背景信息生成更深入的见解。
  • 自定义指令:用户可以设置自定义指令,使 ChatGPT 的回应更符合个性化需求,如设计师可以上传品牌风格指南。
  • 对话管理工具:提供工具帮助团队成员组织和搜索过去的对话记录,通过关键词快速找到相关讨论。
  • 集成实用工具:ChatGPT Projects 集成了网络搜索、Canvas、实时聊天协作和多类型代码执行等工具,适用于开发者和项目管理者。
  • 用户范围:目前新功能仅对ChatGPT Plus、Pro和Teams用户开放,未来计划向所有用户开放。

链接

OpenAI 推出全新 ChatGPT Projects,集成多项实用工具