Inscreva-se agora | Salão de compartilhamento da indústria de aceleração de treinamento de modelo de IA


Histórico de atividades

A velocidade geralmente determina o sucesso ou o fracasso nos negócios.

A aceleração do treinamento de modelos significa que as empresas podem desenvolver novos produtos ou serviços de IA com mais rapidez, trazendo-os ao mercado mais rapidamente e atendendo às necessidades dos clientes. Esta capacidade de resposta rápida ajuda as empresas a aproveitar oportunidades na concorrência e a obter vantagens de mercado. Além disso, a aceleração também significa que as empresas podem reduzir o tempo necessário para a formação, reduzindo assim a ocupação de recursos de hardware e o consumo de energia, resultando num maior ROI.


Como plataforma líder mundial de acesso a dados de IA de alto desempenho, o Alluxio tem sido amplamente utilizado nos estágios principais de treinamento e inferência de modelos de IA. Desta vez, nos unimos à conhecida marca de incubadoras de Zhongguancun, Taili Station, e à DataFun, uma comunidade vertical de desenvolvedores de inteligência de dados , para convidar especialistas em AI Infra da Internet, automóveis e grandes indústrias de modelos para trazer aos parceiros da indústria um modelo de IA acelerado treinamento Um maravilhoso salão offline com temas.


Sinceramente, convidamos líderes técnicos/de TI relacionados à IA Infra, arquitetos, desenvolvedores e pesquisadores, e parceiros ecológicos a se inscreverem e participarem.


Reconhecer código QR

Inscreva-se agora para participar



Informações do evento

Horário do evento: 26 de abril de 2024 (sexta-feira) 14h00-17h10

Co-organizador: Alluxio x Inno.EcoS Lab x DataFun

Local: Sala 401, 4º andar, Torre A, Edifício Dongsheng, No. 8 Zhongguancun East Road, Distrito de Haidian, Pequim



Tópico 1: Aplicação e implantação do Alluxio no treinamento de modelos de direção autônoma


Resumo do discurso

A Huixi Intelligence mudará o cache de arquivos para treinamento de algoritmo de direção autônoma do NAS para o Alluxio em 2023. O sistema de cache baseado no Alluxio resolve os problemas que atormentam a pesquisa e o desenvolvimento há muito tempo: graves atrasos no acesso simultâneo aos dados, downloads repetidos de dados, desperdício de espaço devido à repetição de dados, ineficiência e altos riscos operacionais causados ​​pelo gerenciamento manual de armazenamento capacidade , melhorando a disponibilidade do sistema de dados em 10 vezes. O custo é reduzido pela metade e a facilidade de uso é bastante melhorada, ajudando assim a equipe a melhorar muito a eficiência do desenvolvimento de algoritmos.

Por que Huixi escolheu o Alluxio?

Como usá-lo na direção autônoma em clusters?

Como sua funcionalidade e desempenho podem ser testados e verificados adequadamente?

Como melhorar a capacidade de operação e manutenção do Alluxio?



Tópico 2: Como o Alluxio acelera o armazenamento de IA em nuvem híbrida


Resumo do discurso

Em 2023, Zhihu adotou o Alluxio pela primeira vez no cenário de distribuição de modelo, o que não apenas resolveu o problema de largura de banda de linha dedicada entre nuvens, mas também trouxe uma melhoria de 2 a 3 vezes no desempenho de leitura.


Com o desenvolvimento de treinamento de grandes modelos de linguagem em Zhihu, a equipe de algoritmos também apresentou requisitos mais elevados para armazenamento. A interface Fuse fornecida pela Alluxio atendeu bem às necessidades do lado comercial e estabeleceu uma posição firme em Zhihu, e rapidamente. O desenvolvimento, a partir do cluster inicial, desenvolveu-se em vários clusters.


Zhihu possui uma arquitetura de nuvem híbrida para reduzir o atraso no acesso aos dados durante o treinamento do modelo, um conjunto de clusters Alluxio é implantado em cada nuvem pública. Os recursos de cache transparente do Alluxio são usados ​​para distribuir rapidamente dados de treinamento em clusters HDFS offline para cada público. nuvem Em uma máquina GPU, e sem qualquer migração ou cópia de dados, melhora muito a utilização da GPU nas tarefas de treinamento.



Tópico 3: Alluxio AI - uma nova geração de solução de E/S de dados de plataforma de treinamento AI/ML


Resumo do discurso

Na era da IA ​​orientada por dados, o acesso eficiente a grandes quantidades de dados armazenados é fundamental para o treinamento e a veiculação de modelos. No entanto, os desafios de E/S muitas vezes prejudicam o desempenho e limitam a utilização da GPU.


Neste compartilhamento, apresentaremos como a camada de acesso a dados de alto desempenho construída no Alluxio pode superar os desafios de I/O e melhorar significativamente a utilização da GPU. Através de casos de usuários avançados e dados experimentais, você aprenderá como armazenar conjuntos de dados e modelos em cache no Alluxio e como melhorar o desempenho.



Tema 4: O acúmulo técnico e as vantagens da comunidade Moda na direção do treinamento e inferência de grandes modelos


Resumo do discurso

A comunidade MoTa afiliada ao Tongyi Lab fez muitas explorações em treinamento na direção de LLM/MLLM/SD. A fim de facilitar os desenvolvedores da comunidade a treinar e aplicar LLM e realmente alcançar IA inclusiva, a comunidade MoTa desenvolveu código aberto. treinamento A estrutura de inferência SWIFT tem recursos de treinamento para mais de 200 LLM e mais de 100 conjuntos de dados de código aberto e pode ser facilmente estendida para novos modelos. Na direção do SD AIGC, a Moda Community e a equipe de visão básica do Laboratório Tongyi desenvolveram a estrutura de treinamento Scepter. Esta estrutura usa LoRA e tecnologia SCEdit autodesenvolvida para obter ajuste fino e inferência convenientes de modelos gráficos vicentinos e pode suportar controláveis. gerar.


...
e há conteúdos mais interessantes esperando para você descobrir no site

......



agenda do evento

14h00-14h05 Apresentador abre o show

14h05-14h45 Alluxio AI solução de E/S de dados da plataforma de treinamento AI/ML de nova geração

14h45-15h25 Como o Alluxio acelera o armazenamento de IA em nuvem híbrida

15h25-15h40 Pausa para chá

15h40-16h20 Aplicação e implantação do Alluxio no treinamento de modelos de direção autônoma

16h20-17h00 O acúmulo técnico e as vantagens da comunidade Moda na direção de treinamento e inferência de grandes modelos

17h00-17h10 Intercâmbio técnico e encerramento



Reconhecer código QR

Inscreva-se agora para participar


Presentes interativos

Participe deste evento

Todos que comparecerem ao evento receberão uma lembrancinha

Ao mesmo tempo, há uma atividade no local para preenchimento de questionários e sorteio de presentes requintados que estão esperando por você.


Informações de contato

Se você tiver alguma dúvida, escaneie o código QR do assistente no final do artigo e entre em contato conosco ~




Aluxio

A Alluxio é fornecedora líder mundial de plataformas de dados de alto desempenho para análise e IA, acelerando a realização de valor de produtos empresariais de IA e maximizando o retorno sobre o investimento em infraestrutura. A plataforma de dados Alluxio fica entre os sistemas de computação e armazenamento, fornecendo uma visão unificada das cargas de trabalho na plataforma de dados em todas as fases do fluxo de trabalho de dados. A plataforma fornece acesso a dados de alto desempenho, não importa onde os dados residam, simplifica a engenharia de dados, melhora a utilização da GPU e reduz os custos de computação e armazenamento em nuvem. As empresas podem acelerar significativamente o treinamento e o atendimento de modelos e construir infraestrutura de IA em data lakes existentes sem usar armazenamento dedicado.

Com o apoio dos principais investidores, o Alluxio presta serviços para empresas globais de tecnologia, Internet, financeiras e de telecomunicações. Atualmente, 9 das 10 maiores empresas de Internet do mundo utilizam o Alluxio. Para mais informações, visitewww.alluxio.com.cn.


Laboratório Inno.EcoS

Inno.EcoS Lab Taili Station é a marca de incubadora do Parque de Ciência e Tecnologia Zhongguancun Dongsheng. É uma rede de aceleração de incubação de inovação industrial e plataforma de inovação estabelecida com o ecossistema de crescimento empresarial de alta tecnologia Inno.EcoS como núcleo. A Estação Taili concentra-se nos três principais campos industriais de ciências da vida, economia digital e novas energias/novos materiais. Ela está profundamente envolvida em serviços industriais há mais de 10 anos. Ela reúne inovação e recursos empresariais de todo o mundo para fornecer múltiplos. escolhas para empresas de alta tecnologia nas fases de pré-incubação, aceleração e crescimento. Vários tipos e localizações de espaços de escritório e apoio a serviços tecnológicos empresariais inovadores.


DataFun

Fundada no final de 2017, a DataFun é uma comunidade vertical focada em atender desenvolvedores de inteligência de dados. Impulsionados pela missão de “criar milhões de desenvolvedores inteligentes de dados e ajudar dezenas de milhares de empresas a se tornarem digitalmente inteligentes”, ao longo de quase 6 anos de operação contínua, mais de 4.000 especialistas na área foram convidados a compartilhar suas experiências e muito mais. mais de 100.000 especialistas acumularam experiência na forma de vídeos, imagens e textos, 2.000 casos de aplicação e influenciaram 500.000 desenvolvedores precisos em toda a rede. Na DataFun, você pode se conectar a especialistas autorizados, tecnologias de ponta, melhores práticas e grupos de desenvolvedores excepcionais na área de inteligência de dados. Espero que o DataFun possa acompanhar desenvolvedores, empresas e indústrias para entrar na era da inteligência de dados.


[Adicione assistente para saber mais detalhes do evento]


【Popularidade recente】


【Mercado Baodiano】

Este artigo é compartilhado na conta pública do WeChat - Alluxio (Alluxio_China).
Se houver alguma violação, entre em contato com [email protected] para exclusão.
Este artigo participa do “ Plano de Criação da Fonte OSC ”. Você que está lendo é bem-vindo para participar e compartilhar juntos.

《庆余年2》盗版资源被上传到 npm,导致 npmmirror 不得已暂停 unpkg 服务 周鸿祎:留给谷歌的时间不多了,建议把所有的产品都开源 请教各位,此处的 time.sleep(6) 起到了什么作用? Linus “吃狗粮”最积极! 新款 iPad Pro 使用了 12GB 内存颗粒,但却声称是 8GB 内存 人民网评办公软件套娃式收费:积极解“套”,才有未来 Flutter 3.22 和 Dart 3.4 发布 Vue3 开发新范式,不用`ref/reactive`,不用`ref.value` MySQL 8.4 LTS 中文手册发布:助力您掌握数据库管理新境界 通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens
{{o.name}}
{{m.name}}

Acho que você gosta

Origin my.oschina.net/u/5904778/blog/11054234
Recomendado
Clasificación