国内AI大模型(阿里通义、百度文心一言、字节豆包、月之暗面Kimi、腾讯混元、讯飞星火、京东言犀、紫东太初、天工昆仑万维)

国内AI大模型

通义(阿里)

阿里AI依托阿里领先的云基础设施、大数据和AI工程能力、场景算法技术和多年行业实践,一站式地为企业和开发者提供云原生的AI能力体系。帮助提升AI应用开发效率,促进AI在产业中规模化落地,激发业务价值。

通义版本迭代详情​

(1)通义千问2.0发布

这一重要升级发生在2023年10月31日,阿里云在杭州的云栖大会上正式宣布。通义千问2.0的参数规模达到了千亿级别,并声称其综合性能超越了当时的GPT-3.5,展现了阿里云在大模型研究上的重大进展。这标志着阿里云在AI技术竞赛中加速追赶最前沿水平,如OpenAI的模型。​

(2)通义千问2.5​

发布时间:2024年5月9日​
发布地点:北京阿里云AI智领者峰会​
主要改进:相比通义千问2.1版,通义千问2.5版本的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。​
应用场景扩展:在过去一年中,通义千问发展出了文生图、智能编码、文档解析、音视频理解等能力,使得其应用场景更加广泛。

通义大模型​

通义大模型系列是阿里巴巴集团推出的一系列超大规模的语言模型,涵盖了多个不同参数规模和功能特性的模型。以下是通义大模型系列的一些主要成员,按照参数规模和功能特点进行归纳:​

(1)基础模型(通义M6)

作为通义大模型系列的基础,通义 - M6 已经从最初的3亿参数基础模型发展到10万亿参数的全球最大预训练模型,并进一步演进为业界首个通用统一大模型M6-OFA。​

(2)深度语言模型(通义AliceMind)

这是阿里达摩院开源的深度语言模型体系,包含了多种模型,如通用语言模型StructBERT、生成式PALM、结构化StructuralLM、超大中文PLUG、多模态StructVBERT、多语言VECO、对话SPACE系列和表格STAR系列。这些模型在中文语言理解测评基础CLUE上取得了显著成绩,包括分类榜单、机器阅读理解榜单和总榜单的三榜第一。​

(3)视觉大模型

专注于视觉领域,自下而上分为底层统一算法架构、中层通用算法和上层产业应用。它可以在电商行业实现图像搜索和万物识别等场景应用,并在文生图以及交通和自动驾驶领域发挥作用。​

(4)行业模型:

通义大模型系列还涵盖了多个针对特定行业的模型,如通义灵码-智能编码助手、通义智文-AI阅读助手、通义听悟-工作学习AI助手、通义星尘-个性化角色创作平台、通义点金-智能投研助手、通义晓蜜-智能客服、通义仁心-个人专属健康助手、通义法睿-AI法律顾问等,这些模型为不同行业提供了定制化的解决方案。​

(5)AI绘画创作大模型(通义万相)

基于阿里研发的组合式生成模型Composer,通义万相提供高度可控性和极大自由度的图像生成效果,支持多类图像生成类任务能力。

通义千问

通义千问是阿里巴巴集团推出的一款大规模预训练语言模型。

官网使用地址:https://tongyi.aliyun.com/qianwen
通义介绍官网:https://tongyi.aliyun.com

阿里AI 生态布局​


阿里AI的生态布局涵盖了从人工智能基础设施、智能客服、智能物流、智能城市、智能家居到人工智能应用的全方位领域,同时拥有强大的研究机构和技术实力,持续推动AI技术的创新和应用。​

(1)人工智能基础设施

阿里云推出了AI平台PAI,提供了包括语音、图像、自然语言处理等多个领域的AI能力和算法,帮助企业和开发者快速构建AI应用。​

阿里云机器学习平台PAI(Platform of AI)为开发者提供了自然语言处理的机器学习算法和工具,支持快速构建智能应用。​

(2)智能客服与虚拟助手

阿里巴巴的钉钉和淘宝等平台上已经应用了AI客服技术,通过自然语言处理等技术,可以智能识别用户问题并提供相应的答案。​

阿里巴巴推出了图灵机器人,这是一个开放式的聊天机器人平台,支持自然对话和多轮交互。​

(4)智能物流​

阿里的菜鸟网络在物流领域应用了AI技术,通过大数据和机器学习等技术,提高了物流运营的效率和精度。​

(5)智能城市

阿里在智能城市领域布局,与多个城市和政府合作,应用AI技术提高城市管理和服务的水平。​
阿里云推出了整合城市管理、工业优化、辅助医疗、环境治理、航空调度等全局能力为一体的ET大脑,正式布局产业AI。​

(6)智能家居

阿里的智能音箱天猫精灵,通过语音识别和自然语言处理等技术,可以实现控制家电、语音购物等功能。​

(7)人工智能应用领域

阿里在人工智能应用领域进行布局,推出了包括智能翻译、人脸识别等在内的多个应用。​
阿里云智能语音技术提供了语音合成、语音识别和语音转换等功能,用于支持智能语音交互和自然语言处理。​

(8)研究机构与布局

2014年,阿里宣布成立数据科学与技术研究院即iDST,重点研究大数据、机器学习、自然语言处理等领域。​
2017年,阿里在云栖大会上宣布成立全球性研究机构“达摩院”,把研究范围扩大至机器智能、区块链、量子计算、自动驾驶等领域。​

(9)大模型领域的研究

2023年4月,阿里云正式推出自研大模型“通义千问”,并发布Qwen系列开源模型。

阿里相关 AI 平台

阿里妈妈

地址:https://chuangyi.taobao.com/

在这里插入图片描述

万相营造

地址:https://agi.taobao.com/

在这里插入图片描述

阿里达摩院​

​地址:https://damo.alibaba.com/​

阿里达摩院是阿里巴巴集团旗下的全球研究机构,致力于探索科技未知,以人类愿景为驱动力,推动技术创新和应用落地。
在这里插入图片描述

创建历史与愿景​

阿里达摩院成立于2017年10月,在杭州云栖大会上正式宣布成立,名为“新技术研究院”。​
愿景是“服务世界二十亿人,创造一亿个工作岗位,为一千万家企业创造盈利的平台”。​
阿里巴巴集团对达摩院的投入承诺在五年内超过1000亿元,并期望其成为中国人创办的世界顶级科研机构。​

组织架构与人才储备​

阿里达摩院在全球多个地点设立科研机构,拥有顶尖科学家和工程师的团队。​
学术咨询委员会包括世界知名学者和科学家,如Michael I. Jordan、李凯、George M. Church等。​
阿里巴巴集团内部有超过2万名工程师和500多位博士的技术储备,为达摩院的研究提供强大的支持。​

研究领域与成果​

机器智能​
围绕机器学习等前沿技术开展理论与应用研究,帮助多个行业提升效率。​
下设语音、视觉智能、语言技术、决策智能、城市大脑等实验室。​
自主研发了全球首款基于RISC-V架构的神经网络处理器芯片“含光800”。​

数据计算​
旨在重构融合、开放、安全、敏捷、生态化的信息基础设施。​
下设计算技术、智能计算、数据库与存储等实验室。​

机器人​
主要围绕环境感知、高精定位、决策规划、智能控制等前沿技术方向。​
目前下设智能交通实验室,涉及无人驾驶、无人物流等研发与应用。​

金融科技​
致力于提升金融领域的连接、信任、安全和便捷。​
下设金融智能、区块链、生物识别等实验室,在杭州、北京、西雅图等地设有办公地点。​

其他领域​
在量子计算、生物计算、新材料等领域也有深入研究,取得了多项突破性成果。​

技术应用与产业合作​

阿里达摩院的研究成果广泛应用于电子商务、金融、人机交互、智能物流等多个领域。​
与全球多家企业和研究机构合作,共同推动AI技术的创新和应用。​

总结​

阿里达摩院作为阿里巴巴集团旗下的全球研究机构,在机器智能、数据计算、机器人、金融科技等领域取得了显著成果。其研究成果不仅为阿里巴巴集团的发展提供了有力支持,也为全球科技进步做出了积极贡献。未来,阿里达摩院将继续致力于探索科技未知,推动技术创新和应用落地,为人类社会的发展做出更大贡献。

阿里天池平台​

地址:https://tianchi.aliyun.com/​
天池课程中心:https://tianchi.aliyun.com/

在这里插入图片描述
在这里插入图片描述

天池Notebook​

天池notebook集成机器学习PAI DSW(DataScienceWorkshop)探索者版,成为天池实验室底座,为大家提供完备的IDE以及丰富的计算资源

阿里云PAI​

阿里云PAI(Platform of Artificial Intelligence),全称为阿里云机器学习平台,是阿里巴巴集团针对人工智能开发者和数据科学家打造的一站式云端机器学习开发与部署平台。PAI旨在简化机器学习和深度学习项目的整个生命周期管理,从数据准备、模型训练、评估、优化到部署,为用户提供全方位的支持。以下是阿里云PAI的几个核心特点和功能:​

核心特点:

(1)全面的算法库
PAI内置了丰富的机器学习和深度学习算法,覆盖了分类、回归、聚类、推荐、计算机视觉、自然语言处理等多种应用场景,用户可以直接使用这些算法快速构建模型。​

(2)低代码/无代码开发
通过可视化的拖拽式工作流设计,即便是没有深厚编程背景的用户也能轻松搭建模型,降低了AI应用的开发门槛。​

(3)灵活的开发环境
提供Jupyter Notebook、PyCharm等集成开发环境,支持Python、Scala等多种编程语言,满足不同用户的开发习惯和需求。​

(4)大数据处理能力
集成阿里云MaxCompute、OSS(对象存储服务)等大数据存储和处理服务,可以轻松处理PB级别的数据,支持高效的数据预处理和特征工程。​

(5)模型训练与优化
支持分布式训练,大幅缩短模型训练时间。同时,提供模型调优工具和自动模型选择功能,帮助用户快速优化模型性能。​

(6)模型管理与部署
用户可以便捷地管理训练好的模型,将其部署为RESTful API或者Serving服务,无缝对接到各种应用系统中,实现模型的快速上线和迭代。​

(7)安全与合规
符合多种行业安全标准,确保数据处理和模型训练过程中的数据隐私和安全。​

主要功能模块​

(1)PAI-Studio(可视化建模)
一个拖拽式的工作流设计工具,用户可以通过图形界面来构建数据处理流程和机器学习模型,无需编写代码。​

(2)PAI-DSW(Data Science Workshop)
提供基于Jupyter Notebook的交互式开发环境,支持Python、R等语言,便于数据探索、模型开发和算法调试。​

(3)PAI-EAS(Elastic Algorithm Service)
一个模型在线服务组件,支持模型的快速部署和弹性伸缩,实现低延迟的在线预测服务。​

(4)PAI-AutoLearning
利用自动化机器学习技术,根据用户提供的数据自动选择最佳模型和超参数,极大提升模型开发效率。​

(5)PAI-DLC(Deep Learning Container)
提供预置深度学习框架和环境的容器服务,方便用户在GPU实例上运行自定义的深度学习训练任务。​

阿里云PAI以其强大的功能集、易用性和灵活性,成为企业和开发者在人工智能领域的重要工具,广泛应用于金融、电商、医疗、教育、制造业等多个行业,加速了AI技术在实际业务场景中的应用和落地。

文心一言(百度)

文心大模型首页:https://wenxin.baidu.com/​
大模型社区-飞桨星河:https://aistudio.baidu.com/community

文心一言是百度打造出来的人工智能大语言模型,具备跨模态、跨语言的深度语义理解与生成能力,文心一言有五大能力,文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成;其在搜索问答、内容创作生成、智能办公等众多领域都有更广阔的想象空间。​

文心一言企业服务由千帆大模型平台提供,包括推理服务及大模型微调等一系列开发和应用工具链。​

文心一言大模型现已升级至4.0,企业客户可通过百度智能云千帆大模型平台申请接入。

在这里插入图片描述

1、技术特点​
文心大模型采用了创新性的知识增强技术,从单模态大模型到跨模态、从通用基础大模型到跨领域、跨行业都有持续的创新和突破。​

它构建了模型层、工具与平台层,大幅降低了人工智能开发和应用门槛,加快了人工智能大规模产业化进程并拓展了人工智能技术边界。​

2、模型体系
文心大模型已经形成了基础-任务-行业三级大模型体系,包括自然语言处理、视觉、跨模态等基础大模型,对话、跨语言、搜索、信息抽取等任务大模型,以及生物计算领域大模型和行业大模型。​
其中,ERNIE 3.0是ERNIE系列大模型的进一步升级,通过持续学习对百余种不同形式的任务数据学习,实现了任务知识增强,显著提升了模型的零样本/小样本学习能力。​

3、参数规模
鹏城-百度·文心(ERNIE 3.0 Titan)的参数规模达到2600亿,相对于GPT-3的参数量提升了50%。​

4、应用领域
文心大模型可以支持智能创作、摘要生成、问答、语义检索、情感分析、信息抽取、文本匹配、文本纠错等各类自然语言理解和生成任务。

文心大模型主要产品​

(1)文心一言 (对话)​


文心一言地址:https://yiyan.baidu.com​

在这里插入图片描述

(2)文心一格 (绘画)​

文心一格地址:https://yige.baidu.com

在这里插入图片描述

百度AI布局​

(1)AI平台:

百度AI平台(含百度云)提供了从基础设施、算法、工具、场景到解决方案的全链条AI服务,帮助客户实现智能化转型和业务创新。​
百度AI平台的技术能力不断提升,推出了百度大脑7.0,集成了百度自研的AI芯片昆仑,提供了超过300项AI服务,支持了超过1000种AI场景。​

(2)AI应用

百度AI应用涵盖了多个领域,如百度搜索、百度智能小程序、百度智能小屏、百度智能音箱、百度智能驾驶、百度智能健康等,为用户提供便捷、智能和个性化的服务。​

(3)AI硬件:​

百度自主研发了专用于AI计算的芯片,包括昆仑系列和飞桨系列,分别用于云端和边缘的AI计算,为百度AI平台和应用提供了高效、低成本和可定制的计算支持。​

(4)社会影响力

百度AI平台的社会影响力不断扩大,参与了国家重大工程,如新冠疫情防控、北京冬奥会、国家数字货币等,为国家和社会提供了智能化的解决方案。​

(5)研发投入

百度在AI领域的研发投入巨大,拥有全球最大的AI研发团队,超过5000名AI工程师和科学家,拥有全球最多的AI专利,超过11000项。

百度AI相关平台汇总

(1)百度AI开放平台

百度大脑是百度技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台。​

简介:提供强大可靠的技术支持,为企业提供优质易用的应用方案。​
应用场景:企业服务和智能硬件。​
官网网址:https://ai.baidu.com

在这里插入图片描述

(2)飞桨AI Studio

简介:针对教学全流程,提供一站式教学和实训平台。​
主要功能:教学管理、实训环境、服务共建等。​
应用场景:人工智能实训室和产业学院建设。​
官网网址:https://aistudio.baidu.com/overview

在这里插入图片描述

(3)百度智能云

百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务,加速产业智能化转型升级

简介:面向企业的智能云服务平台,提供大模型应用产品。​
主要功能:知识管理、智能客服、数字人等。​
应用场景:企业知识管理、客户服务、营销等。​
官网网址:https://cloud.baidu.com

在这里插入图片描述

(4)百度松果学堂​

简介:百度旗下的AI人才培养平台,提供全方位的AI学习与实践资源。​
主要资源:AI基础课程、实践教学、技术竞赛、产业实训、科研基金等。​
应用场景:高校教育、行业应用等。​
官网网址:http://campus.baidu.com

在这里插入图片描述

(5)百度千帆AI应用商店

简介:提供各种AI应用的商店。​
主要应用:创客贴智能设计神器、新华妙笔AI、智启特AI学术助手、千象Pixeling AIGC创作平台、ChatPPT等。​
应用场景:满足用户在不同场景下的AI应用需求。​
官网网址:https://qianfanmarket.baidu.com

(6)一念

官网网址:https://yinian.cloud.baidu.com

在这里插入图片描述

(7)数字人(云曦)

官网网址:https://xiling.cloud.baidu.com

在这里插入图片描述

(8)智能客服

在这里插入图片描述

百度 AI 开发​

AI 开发平台
地址​:https://ai.baidu.com
BML 全功能 AI 开发平台是一个面向企业和个人开发者的机器学习集成开发环境,为经典机器学习和深度学习提供了从数据处理、模型训练、模型管理到模型推理的全生命周期管理服务,帮助用户更快的构建、训练和部署模型。​

开发工具​
“开箱即用”的三大AI开发工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder​

AgentBuilder​
AgentBuilder是百度推出的一款对话流程构建工具,旨在帮助开发者快速创建各种智能对话应用。

1、界面设计:
AgentBuilder拥有简洁明了的界面设计,左侧提供丰富的对话组件库,方便开发者选择和拖拽;中间是代码编辑区,开发者可方便地编写和修改代码;右侧为运行展示区,让开发者实时查看对话运行情况,便于调试和优化。​

2、功能特点:​
支持通过拖拽组件、设置参数和编写代码来构建复杂的对话流程。​
利用条件判断和循环结构,开发者可以创建出更加智能的对话应用。​
提供丰富的API接口和文档,帮助开发者深入了解其功能和用法。​

AppBuilder​
AppBuilder是专为Openbiz Cubi平台设计的元数据集成开发环境,其特点包括:​
1、交互性图形界面:AppBuilder具有交互性图形界面,提供直观的开发体验。​
2、生成向导和编辑器:包含两个功能强大的生成向导(App生成向导和模块关联向导)以及直观的元数据编辑器,极大地提高了开发效率。​
3、AI能力:AppBuilder集成了大量的人工智能能力,如百度多年的技术积累和AI能力组件,使应用开发更加智能化。​
4、组件丰富:提供包括百度独家开放的业务组件在内的55个组件,支持主流场景的第三方API集成,以及自定义组件的开发。​

ModelBuilder​
ModelBuilder是百度发布的模型定制工具,其主要特点包括:​
1、模型丰富:预置了包括ERNIE3.5、ERNIE4.0等在内的77个大模型,支持国内外主流第三方模型。​
2、模型定制:支持根据需求定制任意尺寸的模型,并可进行模型精调和post pretrain。​
3、技术特点:采用先进的压缩加速技术,如Qianfan-Llama-2-70B-compressed模型,降低模型推理资源占用。​
4、功能优势:提供数据集整理、模型精调、在线测试、模型评估等系统工具,支持Web应用调用,方便企业集成到自身业务系统中。

百度 AI 市场与服务​

AI 市场​:https://aim.baidu.com

百度AI市场是一个专注于服务AI产业链的商业平台,为开发者、企业和用户提供丰富的AI产品、解决方案以及服务。以下是关于百度AI市场的详细介绍:​

一、产品与服务​
百度AI市场提供了从硬件产品、解决方案到软件服务和数据服务的全方位支持。​
硬件产品:包括边缘计算、计算机视觉、智能终端、智能机器人等,为AI应用提供强大的硬件支持。​
解决方案:涵盖智能园区、智能工业、智能农业、企业服务等多个领域,为用户提供定制化的AI解决方案。​
软件服务:提供API接口、SDK集成包、企业应用等,满足不同用户的软件需求。​
数据服务:包括图像采集、标注、数据审核服务、文本数据服务、音频数据服务等,为AI应用提供高质量的数据资源。​

二、市场特点​
丰富性:百度AI市场拥有丰富的产品、解决方案和服务,可以满足不同用户的多样化需求。​
专业性:作为一个专注于AI产业链的商业平台,百度AI市场提供了专业的AI产品和服务,具有较高的技术含量和附加值。​
开放性:百度AI市场秉持开放合作的理念,与众多企业、高校和研究机构建立了合作关系,共同推动AI技术的创新和应用。​

三、市场成绩​
百度AI市场凭借其丰富的产品、专业的服务和开放的合作态度,取得了显著的市场成绩。例如,百度AI平台(含百度云)的收入在持续增长,成为百度的第二大收入来源。同时,百度AI平台的客户数也在不断增加,覆盖了金融、教育、医疗、制造、零售、物流等多个行业。​

四、未来展望​
未来,百度AI市场将继续加大投入,推动AI技术的创新和应用。一方面,百度将不断提升AI技术的研发能力,推出更加先进、更加智能的AI产品和服务;另一方面,百度将加强与各行业的合作,探索AI在更多领域的应用场景,推动AI产业的繁荣发展。​

综上所述,百度AI市场是一个专业、开放、丰富的AI商业平台,为开发者、企业和用户提供了一站式的AI产品和服务支持。


豆包(字节)​

官网简介:https://www.volcengine.com/product/doubao
使用入口:https://www.doubao.com/chat

AI 部门 Flow​

一、部门背景与成立​
成立时间:Flow是抖音在23年年末时专门成立的全新AI部门。​
目标定位:Flow部门致力于推动AI技术的研发和应用,以满足抖音集团各核心业务部门的AI需求。​

二、产品与服务​
AI产品系列:Flow部门推出了豆包(Cici)、扣子(Coze)、“话炉”和“PicPic”等一系列AI产品。​
“话炉”和“PicPic”:可能分别专注于自然语言处理和图像处理领域的AI产品。​
服务范围:这些AI产品服务于抖音电商、抖音生活服务、火山引擎、巨量引擎、稀土掘金、今日头条、大力教育以及剪映等抖音集团的核心业务部门。​

三、技术与应用​
技术创新:Flow部门不断探索和创新AI技术,以提供更高效、更智能的解决方案。​
应用场景:AI技术在抖音集团的多个业务场景中得到了广泛应用,如内容推荐、广告投放、自动化营销、客户管理等。​

四、市场影响与未来展望​
市场影响:Flow部门的成立和AI产品的推出,标志着抖音在AI领域的深度布局和战略投入,对推动整个行业的AI发展具有重要意义。​
未来展望:随着技术的不断进步和应用场景的不断拓展,Flow部门将继续推动AI技术的创新和应用,为抖音集团乃至整个行业带来更多的价值和机会。​

五、总结​
Flow作为抖音集团专门成立的AI部门,通过推出一系列AI产品和服务,为抖音集团各核心业务部门提供了强大的技术支持。Flow部门在AI技术的研发和应用方面取得了显著成果,对推动整个行业的AI发展具有积极影响。未来,Flow部门将继续致力于AI技术的创新和应用,为行业带来更多的可能性和机遇。​

AI 生态布局​

一、核心AI战略部门与产品​
Flow部门:作为字节跳动AI战略的核心力量,Flow部门推出了多款AI相关产品,包括AI对话助手豆包(海外版为Cici)、AI bot开发平台扣子(海外版为Coze)以及面向二次元群体的话炉等。其中,豆包在2024年2-3月份的DAU一度超过百度文心一言,成为全球同类产品中的佼佼者。

Coze产品

使用入口:https://www.coze.cn​

一、产品概述​
Coze是由字节跳动推出的一款AI聊天机器人和应用程序编辑开发平台,可以理解为字节跳动版的GPTs。该平台允许用户无论是否具有编程基础,都能快速创建和部署基于AI模型的各类问答Bot,并将它们部署到不同的社交平台和消息应用程序上。​

二、产品特点​
多功能性:Coze支持用户快速创建和部署各类聊天机器人,不仅限于简单的问答功能,还能进行复杂的对话和任务处理。​
易用性:平台提供了友好的用户界面和简洁的操作流程,使用户无需编程经验也能轻松上手。​
插件集成:Coze集成了超过60种类型的插件,包括资讯阅读、旅游出行、效率办公、图片理解等API及多模态模型,极大地拓展了Bot的能力边界。​
模型支持:目前,Coze支持通过GPT-3.5(16K)和GPT-4(8K)来创建聊天机器人,为用户提供先进的AI技术支持。​
免费开放:Coze目前是免费开放的,用户可以免费使用GPT4模型及DALLE3、GPT4V插件等高级功能。​

三、应用场景​
个人用户:个人用户可以利用Coze快速搭建个性化的聊天机器人,用于娱乐、学习、信息获取等场景。​
企业用户:企业可以使用Coze创建智能客服聊天机器人,帮助企业处理客户咨询、提供产品推荐等,提升客户服务效率。​
教育培训:教育机构可以利用Coze搭建在线教育平台,提供智能问答、学习助手等功能,帮助学生更好地学习。​
其他行业:Coze还支持在医疗、旅游、金融等行业的应用,如提供智能咨询、旅行规划等服务。​

四、使用案例​
设计师在线商店:设计师可以使用Coze创建在线设计商店,通过聊天机器人与用户进行交互,展示和销售自己的设计作品。​
瑜伽在线课程:瑜伽老师可以利用Coze搭建在线瑜伽课程平台,通过聊天机器人提供课程咨询、预约等服务。​
TiDB文档助手:用户可以使用Coze搭建TiDB文档助手,帮助管理和查询TiDB相关文档,提升工作效率。​

五、总结​
Coze作为一款强大的AI聊天机器人和应用程序编辑开发平台,为用户提供了丰富的功能和便捷的操作体验。无论是个人用户还是企业用户,都可以通过Coze快速搭建符合自己需求的聊天机器人,并在不同的场景下实现高效的应用。同时,Coze还通过不断的更新和升级,为用户提供更加先进和完善的AI技术支持。​

字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费 ​
6月26日,字节跳动在北京发布了基于豆包大模型打造的智能开发工具 – 豆包MarsCode ,面向国内开发者免费开放。本场发布会以“用 AI 激发创造”为主题,在草地露营的轻松氛围中发布了豆包MarsCode 并介绍了其主要功能,同时发布开发者及社区共创计划,吸引了众多业界人士、开发者和科技爱好者的关注

海外产品(如Coze)和国内产品(如“扣子”)​

在AI Bot领域,字节跳动的海外产品(如Coze)和国内产品(如“扣子”)存在明显的区别,主要体现在以下几个方面:​

名称与定位:​
海外产品:
最初在海外推出的AI聊天机器人开发平台名为“Coze”,主要面向全球开发者。​

国内产品:
Coze的国内版本被称为“扣子”,主要面向国内市场,为非开发者提供快速创建、调试和优化AI聊天机器人的平台。​

功能特点:​
海外Coze:​
1、提供了更为强大的AI能力和更多的插件选择,比如可以调用GPT4系列模型,拥有更多更强大的插件,如谷歌搜索、GPT4V等。​
2、可能支持更多语言和文化背景,以满足全球用户的需求。​

国内“扣子”:
1、旨在降低开发门槛,让更多人能够参与到智能对话的创作中来。​
2、集成了超过60种不同的插件,覆盖新闻阅读、旅行规划、生产力工具等多个领域。​
3、提供了简单易用的知识库功能,支持管理和存储数据,以及数据库记忆能力,使机器人能够长期记住用户对话的重要参数或内容。​

模型选择:​
海外Coze:可以选择使用GPT3.5或GPT4等强大的AI模型。​
国内“扣子”:目前主要支持字节跳动的云雀大模型。​

市场定位与用途:​
海外Coze:主要面向全球开发者,满足他们在AI聊天机器人开发方面的需求。​
国内“扣子”:主要面向国内市场,为普通用户和非开发者提供便捷的AI聊天机器人开发平台,帮助他们快速构建个性化的AI Bot,并发布到多个社交平台和应用中。​

生态构建:​
无论是海外Coze还是国内“扣子”,都注重构建AI Bot的生态系统。海外Coze可能更注重与国际开发者社区的互动和合作,而国内“扣子”则更注重与国内开发者、企业和用户的合作与互动。​

数据隐私和安全:​
两者都注重用户数据的隐私和安全保护,采取了相应的措施来确保用户数据的安全和合规性。​
综上所述,字节跳动的海外Coze和国内“扣子”在名称、功能特点、模型选择、市场定位、生态构建和数据隐私安全等方面存在明显的区别。这些区别主要源于不同的市场定位和用户需求,以及公司在不同地区的战略布局和发展策略。​

豆包/Cici:
作为AI对话助手,豆包可以完成问答、文本生成、语言翻译等多种任务,其全球总DAU已达到300万左右,成为字节跳动旗下AI相关产品的领头羊。

AI基础设施与研发​

云雀大模型:字节跳动自研发的“云雀大模型”已经取得了显著进展,内部预期其在2024年将达到GPT4.0水平。这一大模型为字节跳动的AI应用提供了强大的算力支持。​

发展沿革​
发布时间:云雀大模型在2023年8月正式发布,并作为首批通过备案的AI大模型产品之一,向公众开放。​
重要更新:据公开报道,云雀大模型在2024年4月份迎来重大版本更新,这是自2023年8月份正式发布以来首次的重大版本更新。​
市场表现:作为字节跳动AI战略的核心力量,云雀大模型在市场上取得了显著的成绩,如基于云雀模型开发的AI工具“豆包”在全球范围内获得了广泛的用户认可。​

全球化产品Coze(扣子)
这是一个面向开发者的全球化产品,帮助开发者快速搭建基于AI模型的各类问答Bot,加强了字节跳动在AI领域的生态布局。​

AI硬件布局​

可穿戴AI设备:字节跳动正在以刚刚被收购的耳机品牌Oladance团队为基础,探索可穿戴AI设备。​
手持类AI设备:除了可穿戴设备,字节跳动还在探索手持类AI设备,这更接近对现有主流计算设备的AI化延展。​

AI大模型领域产品​

进入2024年,字节跳动加大产品研发速度,持续推出AI学习伙伴河马爱学、AI剧情互动产品猫箱、AI生图产品PicPci、多模态数字人产品以及AI生图、AI生视频产品等多款AI大模型领域产品。​

AI算力底层布局​

字节跳动旗下火山引擎发布了自研的视频编解码芯片,同时囤积了英伟达A100/H800等产品,为AI应用提供强大的算力支持。​

传闻中的AI处理器合作​

尽管字节跳动官方对与博通合作研发AI处理器的传闻不予置评,但据相关报道,字节跳动确实在与博通合作开发一款5nm AI专用芯片,以确保高端AI芯片的供应稳定。​
综上所述,字节跳动的AI生态布局已经全面展开,从基础设施、连接层到应用层都进行了深入探索,并且正在持续推出多款AI大模型领域的产品,以加强其在AI领域的竞争力。

豆包大模型

在这里插入图片描述

产品(豆包)​

豆包主力模型分为通用模型pro和lite两个版本,分别适配不同用户的使用需求。​

除此之外,还有7款功能性模型,涵盖角色扮演、语音识别、语音合成、声音复刻、文生图等方面。

在这里插入图片描述

1、豆包通用模型 pro

字节跳动自研 LLM 模型专业版,支持 128k 长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景;​

2、豆包通用模型 lite

字节跳动自研 LLM 模型轻量版,对比专业版提供更低 token 成本、更低延迟,为企业提供灵活经济的模型选择;​

3、豆包·角色扮演模型

个性化的角色创作能力,更强的上下文感知和剧情推动能力,满足灵活的角色扮演需求;​

4、豆包·语音合成模型

提供自然生动的语音合成能力,善于表达多种情绪,演绎多种场景;​

5、豆包·声音复刻模型

5 秒即可实现声音 1:1 克隆,对音色相似度和自然度进行高度还原,支持声音的跨语种迁移;​

6、豆包·语音识别模型

更高的准确率及灵敏度,更低的语音识别延迟,支持多语种的正确识别;​

7、豆包·文生图模型

更精准的文字理解能力,图文匹配更准确,画面效果更优美,擅长对中国文化元素的创作;​

8、豆包·Function call 模型

提供更加准确的功能识别和参数抽取能力,适合复杂工具调用的场景;​

9、豆包·向量化模型

聚焦向量检索的使用场景,为 LLM 知识库提供核心理解能力,支持多语言。

盘古(华为)​

盘古大模型​


华为盘古大模型官网地址​:https://www.huaweicloud.com/product/pangu.html

盘古大模型3.0是面向行业的大模型,包含L0中5类基础大模型、L1行业大模型及L2场景模型三层架构​

融合语言和视觉跨模态信息,实现图像生成、图像理解、3D生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。​


在这里插入图片描述

华为AI生态布局涵盖了从鸿蒙原生智能系统、AI基础设施与云服务、智能家居与物联网应用、智能客服与数字化服务、网络优化与智能化转型,到产业合作与创新等多个方面。华为通过持续的技术创新和应用实践,不断推动AI技术的发展和应用,为用户提供更加智能、便捷的服务和体验。

在这里插入图片描述

​华为 AI 生态布局​

(1)鸿蒙原生智能系统

华为在2024年HDC开发者大会上正式发布鸿蒙原生智能,HarmonyOS NEXT向开发者和先锋用户开放Beta,开启了全新AI时代。​

鸿蒙原生智能基于软硬芯云协同的硬件与基础设施架构,具备多模态理解、用户个性化数据理解以及隐私保护的能力,提供全场景感知与协同能力。​

鸿蒙原生智能的发布与华为“以消费者体验为核心,为消费者做伟大的产品”的战略目标相匹配,将为用户和开发者带来更高质量的智能体验。​

(2)AI基础设施与云服务​

华为通过鸿蒙与昇腾云的深度协同,打造智能时代最佳AI基础设施。鸿蒙可一次开发多端部署,昇腾AI云服务即开即用,两者结合提供全链路云化工具链,加速应用快速落地。​

鸿蒙与昇腾云的协同打破了算力及AI能力的瓶颈,为鸿蒙生态内的企业带来更快、更强、更可靠的智能化开发体验。​

(3)AI在智能家居与物联网的应用

华为全屋智能通过开放的鸿蒙生态和北向开放策略,为行业场景智能化提供解决方案。目前华为全屋智能已经拥有140+的API接口、40+的ISV伙伴、80+的应用客户和200+商用项目。​
华为全屋智能通过云组网、本地组网和中控屏卡片等多种开放方式,支持中控屏卡片联动场景、中控屏开放客需语音等功能,满足不同行业的需求。​

(4)AI在智能客服与数字化服务中的应用

华为云提供了智能AI客服助手,通过自然语言处理等技术,为企业和消费者提供智能问答、语音导航等服务,提升客户服务的效率和体验。​

(5)AI在网络优化与智能化转型中的应用

华为发布了AI入网“开城计划”,旨在与全球运营商合作,通过构建无线智能化生态,全面提升网络生产力。该计划第一阶段将在半年内赋能1000名站点工程师,管理超过10000站。​
华为推出全球首个站点工程师智能助手,基于海量专业知识和经验,自主生成问题解决策略,显著提升工程师的运维效率。​

(6)AI在产业合作与创新中的应用

华为在四川等地与多个行业合作伙伴探索合作试点,期待通过华为云盘古大模型为各行业的智能化转型贡献力量。​
华为与清华大学智能产业研究院AIR团队共同发布了《AI与人协作、服务于人——AI终端白皮书》,旨在促进行业对AI终端能力演进的共识,推动整个生态向更高质量的AI方向发展。

​AI开发平台ModelArts​


AI开发平台ModelArts地址​:https://www.huaweicloud.com/product/modelarts.html
AI平台ModelArts资源​:https://www.huaweicloud.com/product/modelarts/resources.html
AI开发平台ModelArts文档:​https://support.huaweicloud.com/wtsnew-modelarts/index.html
​​

面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级​
ModelArts是面向AI开发者的一站式开发平台,通过AI开发全流程管理助您智能、高效地创建AI模型和一键模型部署到云、边、端。​
ModelArts的AI Gallery中预置了大量的模型、算法、数据和Notebook等资产,供初学者快速上手使用;ModelArts的自动学习功能,可以帮助用户零代码构建AI模型;ModelArts同时也提供了开发环境,用户可以在云上的JupyterLab或者本地IDE中编写训练代码,进行AI模型开发。​
面向不同AI基础的开发者,本文档提供了相应的入门教程,帮助用户更快速地了解ModelArts的功能,您可以根据经验选择相应的教程。​

在这里插入图片描述

​AI Gallery 百模千态社区​

AI Gallery百模千态社区致力于构建一站式AI社区服务平台,包含丰富AI资产、服务、解决方案。提供基于昇腾AI云服务适配的业界主流开源大模型,易用开发工具和超强算力,助力企业和开发者快速创建模型应用,在大模型时代快人一步。​

昇腾云服务​

昇腾云服务​地址:https://www.huaweicloud.com/product/modelarts/ascend-cloud.html
​​

昇腾云服务提供了高性价比的AI算力,提供全链路云化工具链,支持高效迁移,全栈垂直优化,支持模型/算法高效运行,使能“百模千态”应用快速落地。

在这里插入图片描述

Kimi(月之暗面)​


官方地址:​​https://www.moonshot.cn

在这里插入图片描述

成立背景

Moonshot AI(月之暗面科技有限公司)成立于2023年3月,由杨植麟领导团队创立。​

杨植麟毕业于清华大学计算机科学与技术系,并在卡内基梅隆大学获得博士学位。他曾是苹果AI研究主管Ruslan Salakhutdinov和谷歌首席科学家William Cohen的学生。

Moonshot AI的成立基于对人工智能大模型技术的深厚理解和对未来智能应用的远见,创始团队成员曾参与Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,具有丰富的行业经验和技术积累。

公司简介​

月之暗面 (Moonshot AI) 创立于2023年3月,致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能,2023年10月推出全球首个支持输入20万汉字的智能助手产品Kimi。​

创始团队核心成员参与了 Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。​

月之暗面Kimi是一款由人工智能初创公司北京月之暗面科技有限公司推出的智能助手。以下是对Kimi的详细介绍:​

一、公司背景​
成立时间与地点:月之暗面科技有限公司成立于2023年4月,位于中国北京。​
创始团队:创始团队由5人组成,其中4人来自清华大学,包括创始人杨植麟、联合创始人兼CTO张宇韬、联合创始人周昕宇和吴育昕。​
股权结构:根据天眼查数据,杨植麟为月之暗面的实控人,持股78.968%,周昕宇为第二大股东,持股10%,吴育昕和张宇韬分别持股5.957%和5%。​

二、创始人简介​
姓名:杨植麟​
教育背景:本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院。​
工作经历:现任月之暗面的创始人,同时也是清华大学交叉信息研究院的助理教授。​
研究方向:包括大规模预训练、自然语言处理、自然语言理解与生成、少样本学习、零样本学习、多模态学习等。​

三、Kimi的特点​
智能助手功能:Kimi作为一款智能助手,具备强大的自然语言处理能力和多模态学习能力,可以为用户提供多种智能化服务。​
上下文处理能力:Kimi的上下文处理能力非常出色,最初支持20万汉字输入,后来提升至200万字无损上下文内测。这意味着Kimi能够一次性处理大量信息,为用户提供更为精准和全面的服务。​
应用场景:Kimi可以应用于多个领域,如帮助用户快速分析大量文件、进行信息查询和筛选、辅助财务研究、理解大型代码库等。此外,Kimi还可以用于娱乐和休闲领域,如帮助用户分析电视剧剧本等。​

四、市场反响​
用户访问量:根据SimilarWeb数据,Kimi的周访问量在短时间内实现了快速增长,从最初的10万次左右上升到了超过160万次。​
用户评价:虽然有些用户表示Kimi在某些时候表现出的人格并不完全符合预期,但总体来说,Kimi的智能化和高效性得到了用户的广泛认可。​

五、总结​
月之暗面Kimi作为一款由清华大学学霸团队打造的人工智能智能助手,凭借其强大的自然语言处理能力和多模态学习能力,在多个领域展现出了出色的应用潜力。随着技术的不断发展和完善,Kimi有望为用户带来更多智能化、高效化的服务体验。

发展历程:​

Moonshot AI在成立后不到一年的时间内,已经完成了百亿级别的通用大模型的训练,2023年推出全球首个支持输入20万汉字的智能助手产品。2023年10月9日,Moonshot AI推出首个大模型产品——智能助手Kimi Chat,该产品支持超长文本输入,最多可处理20w个中文字符。

智能助手Kimi Chat标志着公司在长文本领域取得了重要突破,成为市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度的记录保持者。

公司架构与产品线​

公司架构​

Moonshot AI具体公司架构信息未明确提及,但根据其快速的发展和产品推出,可以推测采用灵活高效的组织结构,以支持其技术创新和产品开发,作为一家初创公司架构方面正在快速扩大。

产品线

Moonshot AI目前主打产品Kimi Chat,一个基于大模型的智能助手,具备处理长文本输入能力,支持多语言,尤其在中文处理上具有显著优势。

AI时代下的大模型战略


Moonshot AI的大模型战略聚焦于开发和优化能够处理长文本输入智能助手,以及推动大模型技术在多语言和跨模态领域应用。​

公司致力于通过技术创新,推动大模型技术的发展和应用落地。而定位to C,完全显示出月之暗面要做中国的Open AI的雄心壮志。​

近年在大模型领域的关键动态:​
1、2023年4月,Moonshot AI成立​
2、2023年10月9日,首个大模型产品Kimi Chat,支持超长文本输入

混元(腾讯) ​


官网:https://hunyuan.tencent.com
腾讯元宝:https://yuanbao.tencent.com/chat​
腾讯元器:https://yuanqi.tencent.com​​

腾讯元宝​

(优势:接入了微信公众号的数据)​
腾讯元宝:https://yuanbao.tencent.com/chat​

主要功能
腾讯元宝是基于腾讯混元大模型的AI产品,提供AI搜索、AI总结、AI写作等核心能力。它能够解析多种格式的文档,支持超长的上下文窗口,帮助用户提高工作效率和生活体验。​

应用场景
腾讯元宝适用于办公、学习、创作、生活等多个领域,帮助用户快速获取信息、进行文档处理和内容创作。​

用户群体
主要面向需要快速获取信息、进行文档处理和内容创作的用户,包括商务人士、学生、创意工作者等。​

腾讯元器​

腾讯元器:https://yuanqi.tencent.com/​

主要功能
腾讯元器是一个AI智能体创作与开发平台,允许用户无需编写代码即可创建智能体,实现聊天对话、内容创作、图像生成等功能。它提供智能体商店、低代码开发、工作流模式、腾讯生态集成、全域分发支持等功能特性。​

应用场景
腾讯元器适用于客服、教育、娱乐等多种业务场景,能够根据不同行业的特点提供定制化的智能体解决方案。​

用户群体
主要面向开发者和企业,帮助他们快速构建和部署智能体,以适应不同的业务需求和应用场景。

腾讯混元大模型​

腾讯混元大模型(Tencent Hunyuan)是由腾讯研发的一款强大的中文语言处理工具,具备出色的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。该模型在2023年9月7日正式亮相,并通过腾讯云对外开放。​

腾讯最新开源的混元-DiT 图像生成模型 1.2 版本已正式上线 HuggingFace 页面。与此同时,公司还推出了全新的 Hunyuan-Captioner 模型,该模型能够从多个维度生成高质量的图像描述,涵盖物体描述、关系解析、背景信息以及图像风格等多个方面。​

由腾讯研发的大语言模型,具备强大的中文创作能力,​复杂语境下的逻辑推理能力,以及可靠的任务执行能力​。

腾讯混元大模型​:https://hunyuan.tencent.com​

主要功能​

(1)智能问答:能够理解用户的问题并提供准确的回答。​
(2)内容创作:支持文学创作、文本摘要等内容创作。​
(3)数据分析:能够处理和分析大量数据。​
(4)机器翻译:提供高质量的中文到英文翻译服务。​
(5)文档处理:支持文档生成、文本润色、文本校阅等功能。​

技术特点​

(1)万亿参数规模:基于Transformer神经网络架构,具有超万亿参数规模,使其在中文处理方面表现优异。​
(2)多模态交互:结合自然语言处理和图像生成技术,支持文本生成图像等功能。​
(3)高效的训练与推理:通过自研的Angel机器学习框架,混元在训练和推理速度上有显著提升。​

应用场景​

(1)零售:通过AI分析消费者行为,优化商品推荐。​
(2)教育:提供智能辅导和学习资源推荐。​
(3)金融:进行风险评估、智能投顾等。​
(4)医疗:辅助医生进行病例分析,提供医疗建议。

AI 生态布局​

一、基础设施与平台

腾讯云AI平台:腾讯云提供了全面的AI平台服务,包括机器学习、自然语言处理、图像识别等,为开发者提供从数据预处理、模型训练到部署的全流程支持。​
腾讯AI开放平台:该平台提供了丰富的AI能力,如人脸识别、文字识别、语音识别等,支持开发者快速构建AI应用。​
腾讯混元大模型:腾讯自研的通用大模型,具备强大的自然语言处理能力和跨模态理解能力,已扩展至万亿级参数规模,为腾讯内部多个业务场景提供支持。​

二、技术研发与创新​

自然语言处理:腾讯在自然语言处理领域取得了显著进展,推出了多项领先的技术和算法,如语义理解、情感分析等。​
计算机视觉:在计算机视觉领域,腾讯推出了高精度的人脸识别、物体检测等技术和应用。​
语音识别与合成:腾讯的语音识别和语音合成技术也处于行业领先水平,支持多语种、多场景的语音交互。​

三、应用场景与产品​

智能客服:腾讯的智能客服系统已经广泛应用于金融、电商、政务等多个行业,为企业提供高效的客户服务支持。​
智能家居:腾讯与多家合作伙伴共同推出智能家居解决方案,通过AI技术实现智能控制、场景联动等功能。​
智能医疗:腾讯在医疗领域推出了多款AI应用,如辅助诊断、健康管理等,助力医疗行业智能化升级。​
智能创作:腾讯的AI创作平台为创作者提供丰富的创作工具和能力,如AI写作、AI绘画等,降低创作门槛。​

四、生态合作与开放​

生态合作:腾讯与多家行业合作伙伴共同探索AI技术的创新应用,推动产业智能化升级。​
开放平台:腾讯AI开放平台向全球开发者开放AI能力,支持开发者构建创新应用。​
投资与孵化:腾讯还通过投资和孵化等方式,支持AI领域的创新企业和项目。​

五、大模型领域的产品与服务​

腾讯云TI平台:一站式机器学习生态服务平台,涵盖数据预处理、模型训练、评估、预测全流程。​
腾讯混元大模型的应用:内部超过600个业务及场景已接入混元大模型测试,推动了AI技术在腾讯内部业务的广泛应用。​

六、行业应用与实践​

金融领域:腾讯云与合作伙伴共同探索AI技术在金融领域的应用,如智能风控、智能投顾等。​
教育领域:腾讯AI在教育领域的应用也日益广泛,如智能辅助教学、个性化学习推荐等。​
智慧城市:腾讯积极参与智慧城市建设,通过AI技术提升城市治理和服务水平。​

综上所述,腾讯的AI生态布局涵盖了基础设施、技术研发、应用场景、生态合作、大模型领域以及行业应用与实践等多个方面,形成了全面、深入的AI生态体系。

讯飞星火(科大讯飞)​


科大讯飞的大模型,即讯飞星火认知大模型,是科大讯飞公司发布的一款重要的人工智能产品。​

官方地址:​​https://xinghuo.xfyun.cn/
在这里插入图片描述
在这里插入图片描述

讯飞星火认知大模型​

模型背景​
讯飞星火认知大模型是科大讯飞为对标OpenAI的ChatGPT而研发的一款大模型。自2022年OpenAI发布ChatGPT以来,人工智能领域迎来了新一轮的技术和产业革命。科大讯飞紧跟这一趋势,开始研发讯飞星火认知大模型。​
讯飞星火认知大模型已位列中国头部水平,并通过了中国信通院组织的AIGC大模型基础能力(功能)评测及可信AI大模型标准符合性验证,获得4+级评分。​

模型特点​
具有7大核心能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模交互。​
模型的命名“星火”有三层寓意,包括看清通用人工智能(AGI)的远景目标和实现路径、创业团队的决心以及中国传统文化中的吉祥象征。​

发展沿革​
2023年5月6日,科大讯飞正式发布讯飞星火认知大模型,并开始不断迭代。​
2023年6月9日,星火大模型V1.5正式发布;8月15日,星火大模型V2.0正式发布;9月5日,星火大模型正式面向全民开放;10月24日,星火大模型V3.0正式发布。​
2024年1月30日,星火大模型V3.5正式发布;4月26日,讯飞星火大模型V3.5更新;5月22日,讯飞星火Lite版永久免费。​
6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升,全面对标GPT-4 Turbo,在8个国际主流测试集中排名第一。​

模型能力​
1、在文本生成方面,可以进行多风格多任务长文本生成,如邮件、文案、公文等。​
2、在语言理解方面,能够进行多层次跨语种语言理解,包括语法检查、要素抽取等。​
3、在知识问答方面,可以回答生活知识、工作技能、医学知识等广泛领域的问题。​
4、此外,还具备逻辑推理、数学能力、代码理解与生成能力等多方面的能力。

科大讯飞AI生态布局​

AI+行业​

科大讯飞在AI+行业方面的布局十分广泛,涵盖了教育、医疗、智慧城市、金融、运营商、汽车等多个领域。在教育领域,科大讯飞通过智能语音和人工智能技术,为教育行业提供智慧教育解决方案,助力教育公平与质量提升。在医疗领域,科大讯飞利用自然语言处理和语音识别技术,打造智慧医疗系统,提高医疗服务的效率和质量。在智慧城市领域,科大讯飞通过大数据和人工智能技术,为城市管理提供智能化支持,提升城市治理水平。在金融领域,科大讯飞利用人工智能技术,为金融机构提供智能客服、智能风控等解决方案,提高金融服务效率和安全性。

AI+办公​

在AI+办公方面,科大讯飞推出了多款智能办公产品,如智能语音鼠标、智能录音笔等,旨在通过人工智能技术,提升办公效率和体验。这些产品利用科大讯飞的语音识别、自然语言处理等技术,实现语音转文字、智能翻译等功能,让办公更加便捷高效。

AI+生活​

科大讯飞在AI+生活方面的布局主要聚焦于智能家居和智能穿戴设备等领域。通过人工智能技术,科大讯飞为用户提供了更加智能化、便捷化的生活方式。例如,通过智能家居系统,用户可以实现远程控制家电、智能安防等功能;通过智能穿戴设备,用户可以实时监测健康状况、运动数据等。

在这里插入图片描述

AI+数字化​

在AI+数字化方面,科大讯飞利用大数据和人工智能技术,为企业提供了数字化转型的解决方案。通过数据分析、数据挖掘等技术手段,科大讯飞帮助企业实现业务优化、决策支持等功能,推动企业实现数字化转型和升级。​
在这里插入图片描述

​AI+生态​

科大讯飞在AI+生态方面的布局主要是打造一个开放、共赢的AI生态圈。通过开放平台、开发者社区等方式,科大讯飞吸引了众多开发者、合作伙伴加入其中,共同推动人工智能技术的发展和应用。同时,科大讯飞还积极与高校、科研机构等合作,推动产学研深度融合,为人工智能技术的发展提供源源不断的动力。

在这里插入图片描述

科大讯飞其他相关AI平台​

讯飞开放平台​

官网https://www.xfyun.cn
简介:以语音交互为核心的人工智能开放平台,提供了语音识别、语音合成、自然语言处理等多项AI能力。​
平台特点:​
1、提供百万级免费服务,涵盖全领域行业方案。​
2、提供1V1专属支持,助力用户快速接入AI技术。​
3、语音识别技术精准,支持39个语种自动判别,适用于多种场景。​

讯飞机器人超脑平台​

官网https://aibot.xfyun.cn
简介:专注于智能机器人开发,提供覆盖多场景的解决方案。​
平台特点:​
1、支持多语种、多方言播报,结合AI对口唇、表情、动作的精准控制。​
2、提供webapi、sdk等接入方式,满足不同应用场景的需求。​
3、提供公有云和私有云等不同的部署方案,满足用户的不同需求。​

讯飞A.I.开发栈​

官网https://aidev.xfyun.cn/​
简介:为开发者提供一系列A.I.开发工具,平台将打造集数据标注、模型训练、模型快速服务化、服务编排组合等能力于一体的一站式A.I.能力及方案开发栈,帮助A.I.开发者更好的实现A.I.能力的研究创造和接入使用,A.I.开发栈将成为讯飞连接A.I.引擎开发者、行业方案开发者以及行业应用开发者的重要平台。​
平台优势:​
1、A.I.算法引擎的无服务全托管式平台,通过简单的接口适配 ,即可快速实现高可用、低成本、安全可控的A.I.能力服务。​
2、可视化A.I.能力组合编排平台,通过简单拖拽即可实现A.I.能力、应用服务组合 ,满足开发者快速定制A.I.应用服务诉求。​
3、在引擎训练的过程中,可以提供专业的数据标注服务,帮助A.I.引擎得到更好的训练优化。​

AIUI开放平台​

官网https://aiui.xfyun.cn/​​
简介:以自然语言理解为核心的全链路人机交互平台,致力于用AI打造领先的人机交互体验。​
平台亮点:​
汇聚了降噪算法、语音识别、图像识别、数字虚拟人交互等全链路人机交互软硬件核心能力。​
引入星火交互认知大模型,实现人机交互的自然化、人性化。​

星火内容运营大师APP​

旨在为企业和个人提供从内容策划到发布的全流程支持。在内容策划阶段,提供了丰富的模板和创意灵感库,帮助用户轻松构思和设计内容。这些模板覆盖了各种主题和行业,确保了内容的多样性和吸引力。同时,其内置的智能创作功能利用人工智能技术,如文本自动生成和智能摘要,大大降低了内容创作的难度和时间成本。​

支持多平台内容发布,允许用户一键将内容分发至微博、抖音、知乎等多个社交媒体和内容平台。这种高效的发布机制极大地提升了内容的曝光度和传播效率。而且,该工具还能实时追踪和分析内容的表现数据,如阅读量和互动情况,使用户能够深入了解内容效果,并据此优化后续内容策略。​

对于团队来说,它提供了协作编辑和管理的功能,支持多人在线协作,提高了团队工作效率。此外,它还具备版权检测和保护机制,确保用户内容的原创性和合法权益,避免了侵权风险。对于有特定需求的用户提供个性化定制服务,根据用户的行业特点和品牌需求,提供定制化的内容运营解决方案。

​言犀(京东)​


言犀大魔性官网:https://yanxi.jd.com/​​​

7月13日,2023京东全球科技探索者大会(JDD)在京举行。会上,京东健康正式发布面向医疗健康行业的大模型“京医千询”,并宣布推出医疗健康开放生态平台“京医星脉”,这是京东健康在新时期加速推进科技与产业融合,进一步推动远程医疗生态建设所迈出的坚实一步。​

京医千询

发布时间:2023年7月13日​

特点:​
1、覆盖全流程医疗需求,实现智能决策,支持多模态的医疗大模型。​
2、基于京东言犀通用大模型基础之上,融合了京东健康丰富的医疗知识和数据。​
3、拥有行业内首个实物与服务相联通、知识与数据相融合的百万级大规模健康知识图谱。​
4、沉淀了超过亿级的覆盖线上、线下医患场景的高质量健康档案。​
5、可以根据用户侧个性化的诊疗建议、健康管理、自诊,以及医生侧的知识管理和文献挖掘、自动报告生成和病例生成来辅助医生的工作。​
6、基于循证医学来训练,具有共情和交互的能力,可以理解复杂模态,包括图片影像等医疗数据来做自主的推理决策。​

应用场景:​
1、针对医生的智能医生助理​
2、针对个人用户的数字医生+AI健康管家​
3、面向企业/机构用户,建设高价值健康档案数据库,提供行业健康解决方案​
4、智能云诊室,提供线上线下一体化的医疗解决方案​

言犀大模型​

发布时间:2023年7月13日(与“京医千询”同时发布)​

特点:​
1、源于产业、服务产业的大模型,融合了70%通用数据与30%数智供应链原生数据。​
2、致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。​
3、具有“更高产业属性、更强泛化能力、更多安全保障”的优势。​
4、京东集团通过其丰富的产业布局和每年数百亿条优质交互数据来训练这一大模型。​

配套工具与平台:​
京东还推出了一套大模型的完整工具,包括言犀AI开发计算平台、向量数据库、混合多云操作系统云舰等。​
同时,发布了全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。​

言犀大模型​

以AI技术驱动,从文字、语音到多模态交互,从对话智能到情感智能,聚焦体验、效率与转化,旨在打造新一代智能人机交互平台,面向不同行业和客户场景助力企业服务和营销实现数智化转型升级​

言犀大模型是京东集团推出的一款产业级大模型,它源于产业、服务产业,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。这款大模型融合了70%的通用数据与30%的数智供应链原生数据,具有更高的产业属性、更强的泛化能力和更多的安全保障。​
言犀大模型的开发基于京东集团丰富的产业布局和每年数百亿条优质交互数据,使得它能够更好地理解用户需求,提供更加精准和个性化的服务。通过融合通用数据和行业特定数据,言犀大模型在多个领域展现出强大的能力,例如零售、物流、金融、健康、政务等。​

言犀大模型的推出,不仅为京东自身的业务发展提供了有力支持,也为整个产业带来了创新机遇。通过提供智能客服、智能营销、智能风控等解决方案,言犀大模型可以帮助企业提升效率、降低成本、优化用户体验。同时,它还可以为政府机构提供智能政务解决方案,推动数字化转型和智能化升级。​
除了言犀大模型本身,京东还推出了一系列配套工具与平台,如言犀AI开发计算平台、向量数据库、混合多云操作系统云舰等。这些工具与平台为大模型的训练、部署和应用提供了全面支持,使得企业和开发者能够更加方便地利用言犀大模型的能力来构建自己的智能应用。​

总之,言犀大模型是京东集团在人工智能领域的一项重要创新成果,它不仅为京东自身的业务发展提供了强大支持,也为整个产业带来了创新机遇。通过深入产业场景、解决真实问题,言犀大模型正逐步成为推动产业智能化升级的重要力量。

特征

言犀大模型是京东科技推出的一款大型语言模型,它具备以下三大特征:​
1、产业原生:AI能力从京东优质的产业场景与数据中锤炼而来,具备更强的产业属性。​
2、价值驱动:使用源于业务应用需求的前沿算法,提升推理速度,降低成本,让模型应用价值更高。​
3、开放协同:基于京东自研向量数据库与领先的计算集群,模型迭代效率更高。​

言犀大模型具备基础层、模型层、MaaS、SaaS四层体系,旨在提供高效的大模型开发环境,支持以少量企业数据精调出客户专属模型。​

应用场景​

言犀大模型已在多个业务场景中落地,包括智能客服、多模态数字人、交互式营销、智能政务热线、协同办公等。这些应用旨在让即使欠缺AI基础能力的传统企业也能达到开箱即用。​

用户群体​

京东云针对不同客户的诉求,提供一系列的大模型,从10亿级、百亿级到千亿级,也会提供大模型和小模型的搭配使用,因为在B端“1分钱都能影响成本”。​

技术优势​

言犀大模型融合了70%的通用数据与30%京东数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势。​

京东云在AI领域的布局​

京东云依托智能城市操作系统,打造了城市运行支撑平台和城市运行能力中心的智能交互平台,服务普陀区推进“一网统管”,实现一屏发现、一口派单、一站处置、一网评效、一键智搜,打造特大城市“智”理新样板。

言犀大模型​产品
在这里插入图片描述

​AI 生态布局​

一、AI品类与产品布局​

在这里插入图片描述

1、12大AI品类发布:在京东618前夕,京东正式发布了包括AI电脑、AI手机、AI耳机、AI相机、AI学习机、AI键鼠、AI手表、AI路由器、AI眼镜、AI门锁、AI摄像头和AI音箱在内的12大AI品类。​
2、AI硬件市场的洞察:京东基于对AI硬件市场发展趋势的深刻洞悉和对消费需求的精准洞察,为消费者提供了清晰的AI硬件区分认知。​
3、AI硬件的普及目标:京东公布了“618 AI普惠百万用户”的目标,预计在618期间推动超300万用户换新AI产品。

二、AI技术与应用​


1、AI数字人带货:京东成功打造了以刘强东为原型的AI数字人“采销东哥”,并在直播带货领域取得了显著成效。AI数字人直播等成本是真人的十分之一,闲时直播转化率超过30%。​
2、AI技术的多领域应用:京东在内容创意、广告投放、自动化营销、客户管理等多个领域应用AI技术,帮助商家实现生意增长。​

三、AI基础设施与云服务​

鸿蒙原生智能系统:鸿蒙原生智能基于软硬芯云协同的硬件与基础设施架构,提供全场景感知与协同能力。​
昇腾云:通过鸿蒙与昇腾云的深度协同,打造智能时代最佳AI基础设施,提供全链路云化工具链,加速应用快速落地。​

四、AI生态合作与开放​

品牌合作:京东与联想、小米、OPPO等品牌达成了深度战略合作,推动AI大模型在更多终端设备上的广泛应用。​
开放策略:京东的开放策略为行业场景智能化提供解决方案,目前已经拥有140+的API接口、40+的ISV伙伴、80+的应用客户和200+商用项目。​

五、AI在特定领域的应用​

智能家居:通过鸿蒙与昇腾云的协同,为用户提供更智能的家居体验。​
智能客服:京东的智能AI客服助手通过自然语言处理等技术,为企业和消费者提供智能问答、语音导航等服务。​

综上所述,京东的AI生态布局涵盖了从AI品类与产品、AI技术与应用、AI基础设施与云服务、AI生态合作与开放,到AI在特定领域的应用等多个方面。通过不断的技术创新和应用实践,京东正在构建一个全面、深入的AI生态体系,为用户提供更加智能、便捷的服务和体验。

京东人工智能研究院​


地址:https://yanxi.jd.com/ai-lab/public


京东人工智能研究院成立于2017年,专注于人工智能技术的前沿创新和基础研究,研究领域涵盖语音语义、计算机视觉、多模态内容智能、知识获取与推理、情感智能、人机对话与交互、决策智能等。​
研究内容是由业务场景需求驱动,致力于解决京东复杂、真实场景中的问题,对内满足京东集团对于人工智能技术的需求,对外助力数智化产业发展及变革。

商汤日日新(商汤科技)​


一、日日新SenseNova大模型体系​

官网https://platform.sensenova.cn/​​​

迭代历程​
1、自从2023年首次发布以来,“日日新SenseNova”大模型体系已经历了多个版本的迭代更新。​
2、2023年7月,商汤科技在世界人工智能大会上推出了迭代后的“商汤日日新SenseNova”大模型体系,并展示了在该体系下的一系列大模型产品更新和落地成果。​
3、2024年2月,商汤科技发布了“日日新SenseNova 4.0”,进行了多维度全面升级。​
4、2024年4月,商汤科技再次升级至“日日新SenseNova 5.0”,并宣布了行业首个“云、端、边”全栈大模型产品矩阵。​
5、最新消息显示,商汤科技将在2024年7月的世界人工智能大会上发布“日日新5.5”版本。​

技术特点​
参数量与数据量:商汤的大模型参数量达到6000亿,基于1.5万亿token和6000亿中文高质量数据进行训练。​
模型性能:商汤科技表示,其大模型在综合能力上全面对标GPT-4 Turbo,是行业内首个“云、端、边”全栈大模型产品矩阵。​
推理能力:推理合成数据高达数千亿Token,推理时上下文窗口可以有效到200K左右。​
应用场景:商汤的大模型旨在满足不同规模场景的应用需求,加速生成式AI向产业落地的全面跃迁。

其他相关AI模型​

商量-对话大模型 5.0​

官网:https://chat.sensetime.com/​​​
百科问答、图片理解、代码编写、数学解答、概要总结、概念解释、观点讨论、文案创作

在这里插入图片描述

商量·大医​

官网:https://sensecare-chat.sensetime.com/login​​

“商量·大医”是基于海量医学知识和真实医患互动对话数据打造的中文医疗语言大模型。它旨在支持导诊、问诊、健康咨询、辅助决策等多场景多轮会话,为医院诊疗效率及患者服务提升持续赋能。

在这里插入图片描述

紫东太初(中国科学院自动化研究所)​

地址:https://taichu-web.ia.ac.cn/​​​

紫东太初​

关于“紫东太初”大模型“紫东太初”大模型由中国科学院自动化研究所和武汉人工智能研究院联合打造。研发之初,“紫东太初”大模型即坚持以多模态技术为核心,利用海量无标记数据进行跨模态统一表征和学习,实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”,向发展通用人工智能迈出了坚实的一步。​

“紫东太初”全模态大模型是在全球首个千亿参数多模态大模型“紫东太初”1.0基础上升级打造的2.0版本,在语音、图像和文本三模态的基础上,加入视频、传感信号、3D点云等模态数据,率先实现认知增强的多模态关联,具备全模态理解能力、生成能力和关联能力,面向数字物联时代加速通用人工智能的实现。​

以国产化基础软硬件平台昇腾AI为基础,依托武汉人工智能计算中心算力支持,有力推动了国产基础软硬件与大模型技术的适配,协同构建我国通用人工智能自主可控发展生态。​

紫东太初是中国科学院自动化研究所研发的一款跨模态通用人工智能平台,以下是对其的详细介绍:​

一、核心技术与特点​

跨模态通用人工智能平台:紫东太初是一个以多模态大模型为核心的平台,具备跨模态理解与跨模态生成能力,是全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer)。​

突破性进展:紫东太初在预训练模型领域取得了突破性进展,通过引入语音模态后的多模态预训练模型,实现了共性图文音语义空间表征和利用,并突破性地直接实现三模态的统一表示。​
全栈国产化基础软硬件平台:紫东太初基于全栈国产化基础软硬件平台,可支撑全场景AI应用,推动国产基础软硬件与大模型技术的适配,协同构建我国通用人工智能自主可控发展生态。​

二、版本更新与功能拓展​

紫东太初2.0:2023年6月16日,中国科学院自动化研究所在上海发布了紫东太初2.0版本。相较于1.0版本,2.0版本在语音、图像和文本三模态的基础上,加入了视频、传感信号、3D点云等模态数据,研究突破了认知增强的多模态关联等关键技术,具备全模态理解能力、生成能力和关联能力。​
功能展示:紫东太初2.0展示了在音乐理解与生成、三维场景导航、信号理解、多模态对话等多项强大功能,如音乐生成、视频理解、跨模态搜索等,体现了其在不同领域的应用潜力。​

三、应用场景与前景​

紫东太初已在多个领域展现出一定的产业应用前景,包括神经外科手术导航、短视频内容审核、法律咨询、医疗多模态鉴别诊断、交通违规图像研读等。随着技术的不断进步和应用场景的不断拓展,紫东太初有望为更多行业带来智能化升级和效率提升。​

四、总结​

紫东太初作为中国科学院自动化研究所研发的跨模态通用人工智能平台,在核心技术、版本更新、功能拓展以及应用场景等方面均取得了显著成果。该平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用,具有广泛的应用前景和深远的社会意义。​

AI布局

中国科学院自动化研究所在AI领域的布局非常广泛且深入,以下是对其布局的详细介绍:​

一、研究板块与平台建设​

研究板块:自动化所紧密围绕国家人工智能发展战略,面向新一代人工智能的挑战,布局了多个研究板块,包括“脑与类脑研究、仿人视听觉智能、自主机器智能、博弈进化智能、复杂系统智能、AI基础软硬件支撑体系、AI创新应用”等。​
平台建设:自动化所牵头建设了怀柔国家综合性科学中心的“脑认知功能图谱与类脑智能交叉研究平台”和中科院香港创新研究院人工智能与机器人创新中心,这些平台为AI研究提供了强大的支持。​

二、技术突破与产品发布​

通用AI平台:自动化所发布了名为“紫东太初”的跨模态通用人工智能平台,该平台基于国产化基础软硬件,仅采用一个大模型即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。该平台实现了图、文、音三种模态的统一表达,为AI在更多元场景的应用提供了可能。​
AI芯片与产品战略:自动化所南京人工智能芯片创新研究院(AiRiA)发布了基于量化神经处理器QNPU的“普惠AI,芯向边缘”AI产品及战略,包括瓦特(watt)芯片、QNPU架构、深度学习引擎QEngine、模型压缩工具QTrainer等软硬产品,致力于解决AI发展的瓶颈。​

三、人形机器人研发​

自动化所在人形机器人领域取得了显著进展。在人形机器人攻关团队的带领下,基于原始创新积累,自主突破了高爆发一体化关节、AI赋能设计、机器人大模型、类人柔顺控制等核心技术,研制了人形机器人设计组装“大工厂”,可以快速设计构建人形机器人硬件和软件系统。目前,已设计出多台Q系列人形机器人样机,初步实现了面向不同场景的技术验证。​

四、总结​

中国科学院自动化研究所在AI领域的布局涵盖了从基础研究到技术突破、再到产品发布的完整链条。通过布局多个研究板块、建设重要平台、发布创新产品和技术,自动化所在AI领域取得了显著成果,并致力于成为国际一流科研机构,打造智能科学与技术国际创新发源地与人才高地。

昆仑万维(天工)​


地址:https://www.tiangong.cn

天工3.0​

天工大模型 3.0 API 在 2.0 版本基础上,提供了搜索增强模式,显著提升信息检索和知识整合能力。结合搜索引擎技术,能够快速找到相关信息并进行智能分析,提供更精准和丰富的回答。在复杂对话和深度内容创作中表现更佳,如广告文案、小说写作、知识类写作和代码生成等场景。
在这里插入图片描述
昆仑万维是中国领先的互联网平台出海企业,业务覆盖包含AIGC、信息分发、社交、娱乐、元宇宙、游戏等多个领域,旗下包含AGI与AIGC、海外信息分发与元宇宙、科技股权投资/支付等三大业务板块​

天工大模型:最多支持10000字以上文本对话,实现20轮以上问答交互,擅长语义理解、文本写作,实测能力出众。采用蒙特卡洛搜索树算法进行优化,采用千亿参数的超大规模结构。