Cube Studio:开源云原生一站式机器学习平台

Cube Studio:开源云原生一站式机器学习平台

cube-studio cube studio开源云原生一站式机器学习/深度学习/大模型AI平台,支持sso登录,大数据平台对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式训练,超参搜索,推理服务VGPU,边缘计算,标注平台,自动化标注,大模型微调,vllm大模型推理,llmops,私有知识库,AI模型应用商店,支持模型一键开发/推理/微调,支持国产cpu/gpu/npu芯片,支持RDMA,支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式,deepseek微调推理 cube-studio 项目地址: https://gitcode.com/gh_mirrors/cub/cube-studio

1. 项目介绍

Cube Studio 是一个开源的云原生一站式机器学习平台,它支持从数据管理、开发环境、模型训练到模型部署的全流程操作。平台提供了丰富的功能模块,包括项目组管理、网络配置、用户管理、计量计费、单点登录、算力支持、多资源组集群、边缘集群、Serverless 集群模式、数据库存储、机器资源管理、存储盘管理、国际化能力、数据管理、开发环境、模型训练、模型管理以及模型应用市场等。

2. 项目快速启动

快速启动 Cube Studio 的基本步骤如下:

首先,确保您的环境中已经安装了 Docker 和 Kubernetes。

# 拉取 Cube Studio 镜像
docker pull data-infra/cube-studio:latest

# 启动 Cube Studio 容器
docker run -d -p 8080:8080 data-infra/cube-studio:latest

启动容器后,您可以通过浏览器访问 http://localhost:8080 来使用 Cube Studio。

3. 应用案例和最佳实践

数据管理

  • 数据集管理:用户可以随时上传样本集(图片、音频、文本等),并通过 SDK 进行数据集对接。
  • 数据标注:支持多种类型的数据标注能力,包括自动化标注功能。

开发环境

  • Notebook:提供在线的交互式开发调试工具,支持多种开发环境和语言。
  • 镜像功能:支持镜像仓库、镜像管理和在线构建镜像。

模型训练

  • 拖拉拽任务流编排调试:通过拖拽方式完成业务逻辑的 PIPLINE,支持多种资源规格和卡型选择。
  • 主流功能算子:包括自定义镜像、逻辑节点、Python、数据处理、特征处理等。

模型管理

  • 模型管理:用于对模型多版本管理,支持模型发布为推理服务。
  • 推理服务:支持多版本服务的发布、滚动升级和回滚。

4. 典型生态项目

Cube Studio 作为一个开源平台,支持与多个生态项目集成,例如:

  • 数据中台:与公司数据中台相应计算/调度引擎对接,进行数据 ETL 任务流编排。
  • AIHub:提供预训练模型和应用对接,实现模型的一键部署和服务化。
  • 分布式框架:集成 MPI、Colossal-AI 等分布式加速框架,提升模型训练效率。

通过上述介绍,您可以开始使用 Cube Studio 来构建和管理您的机器学习项目。更多详细配置和高级功能,请参考官方文档。

cube-studio cube studio开源云原生一站式机器学习/深度学习/大模型AI平台,支持sso登录,大数据平台对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式训练,超参搜索,推理服务VGPU,边缘计算,标注平台,自动化标注,大模型微调,vllm大模型推理,llmops,私有知识库,AI模型应用商店,支持模型一键开发/推理/微调,支持国产cpu/gpu/npu芯片,支持RDMA,支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式,deepseek微调推理 cube-studio 项目地址: https://gitcode.com/gh_mirrors/cub/cube-studio