Prefácio
A Reunião Anual do Fórum Zhongguancun de 2024 e o Fórum de Investimento e Desenvolvimento em Tecnologia Dura foram realizados recentemente no Centro Internacional de Inovação de Zhongguancun. 180 investidores, financiadores, empresários, especialistas da indústria e líderes governamentais relevantes de todo o mundo, com foco em "globalização do capital e tecnologia no exterior", "estabelecimento e fracasso do investimento em tecnologia dura" e "novas práticas globais de tecnologia dura", Foram realizadas trocas e discussões aprofundadas.
![](https://oscimg.oschina.net/oscnet/aa5b141e-b0f0-4117-9f91-db9db896bb0e.png)
Han Geng, vice-secretário-geral do Governo Popular Municipal de Pequim, disse em seu discurso que na jornada da nova era, a inovação e o desenvolvimento da ciência e da tecnologia duras, como o elemento central das novas forças produtivas, tornaram-se um elemento indispensável. e uma força importante no esforço de modernização da China. O número de empresas unicórnios em Pequim sempre ficou em primeiro lugar no país, das quais as empresas unicórnios de tecnologia dura representam mais de 60%. Olhando para o futuro, Pequim estabeleceu 20 indústrias subdivididas em 6 grandes campos científicos e tecnológicos e estabeleceu 4 dezenas de milhares de milhões de fundos de inovação científica e tecnológica. Estes fundos concentrar-se-ão em indústrias emergentes estratégicas, como a inteligência artificial, a robótica e a saúde médica. .
![](https://oscimg.oschina.net/oscnet/1caddfc5-e271-4821-b454-e712eb121365.png)
Han Geng, vice-secretário-geral do Governo Popular Municipal de Pequim
Alluxio, como uma plataforma de dados de IA de nova geração que tem atraído muita atenção no mundo, o arquiteto-chefe Dr. Fu Zhengjia foi convidado a participar do fórum e se encontrou com líderes de inovação de destaque em 2023-2024 no show TED com o tema "Novo Práticas Globais de Tecnologia Dura", incluindo Wang Shaolan, presidente da Zhipu AI, He Huajie, presidente do Pathfinder Group, Bu Xiangwei, cofundador e co-CEO da Oriental Space, Zhao Yongjie, CMO da Origin Quantum, e Zhong Haizheng, fundador da Zhijing Technology, compartilhou as mais recentes tecnologias e tecnologias básicas de várias empresas.
Alluxio compartilha o tema:
“Plataforma de dados de IA de nova geração”
Dr. Fu Zhengjia, Arquiteto Chefe da Alluxio
Evolução acelerada da IA versus desafios de gerenciamento de dados
Atualmente, a IA está evoluindo rapidamente e tem recebido ampla atenção nos campos verticais e horizontais de vários setores. Ray Kurzwell, um investidor e futurista dos Estados Unidos, prevê que “a inteligência artificial atingirá o nível da inteligência humana em 2029 e, em 2045, as capacidades da inteligência biológica da máquina criada pela tecnologia inteligente e pela civilização humana serão expandidas em um bilhão vezes; o CEO da NVIDIA, Jen-Hsun Huang, acredita que estamos testemunhando um aumento na demanda por reestruturação global de data centers. Esta reciclagem e utilização de data centers existentes, ao longo de uma década, acabará por levar a uma jornada de transformação de computação acelerada. e muito mais. Muitas empresas estão a começar a preparar-se ou a utilizar a IA para capacitar os seus negócios, treinando modelos e aplicando-os a negócios reais para melhorar a eficiência da produção e criar maior valor.
Ao mesmo tempo, com a nova geração de IA a partir do ChatGPT, a estrutura do modelo tornou-se cada vez mais complexa, o número de parâmetros envolvidos tornou-se cada vez maior e os requisitos de poder de computação também aumentaram. óbvio. Portanto, geralmente acredita-se que os três núcleos mais importantes para o desenvolvimento da IA são o poder de computação, algoritmos e dados. No entanto, todos muitas vezes ignoram a importância da construção da infraestrutura de IA. A prática provou isso somente construindo bem a infraestrutura de IA. , os três aspectos principais da IA podem ser resolvidos. Somente com grandes habilidades essenciais eles podem ser melhor utilizados.
As empresas também enfrentam uma série de desafios ao construir infraestruturas de IA:
Atualmente, as empresas nacionais geralmente enfrentam problemas de escassez de GPU, alto preço e baixa taxa de utilização. Mas mesmo que o problema da GPU possa ser aliviado, outro problema surgirá, que é como gerenciar e servir melhor os dados da computação da GPU. , como alcançar a eficiência de acesso aos dados exigida pela GPU (quando a E/S de dados se torna um gargalo, a utilização da GPU se torna insuficiente e você precisa esperar que os dados sejam carregados na GPU antes que o treinamento possa ser realizado);
Os líderes de algoritmos e de negócios geralmente exigem ciclos de construção de modelos e velocidades de iteração mais rápidos. Também vemos uma tendência de crescimento muito clara nos dados, como a coleta de dados para condução inteligente e veículos sem motorista, e após a coleta e anotação de dados de vários setores. as empresas precisam se preparar para o tamanho crescente dos dados.
O crescimento da escala tem duas dimensões. Por um lado, é o crescimento de todo o volume de dados. Por exemplo, quantos bilhões de imagens e quantas vozes existem? também imagens multimodais baseadas em texto, vídeos baseados em texto e vários modelos O treinamento requer preparação de dados, portanto a quantidade de dados continuará a aumentar.
Por outro lado, o tamanho dos dados em si está aumentando. Há alguns anos, vimos que uma imagem de reconhecimento facial poderia ter apenas 100 KB ou 200 KB. Mas agora estamos vendo imagens de vídeo, imagens de alta definição em 4K e uma imagem. é 1MB, 4MB, 8MB, os dados em si estão crescendo constantemente, então quando essas duas dimensões são multiplicadas, o tamanho de todos os dados aumenta ao nível do quadrado.
Portanto, precisamos de uma melhor solução de armazenamento e E/S de dados para toda a plataforma de treinamento para melhorar o efeito do treinamento.
Alluxio Soluções
Existem algumas soluções no mercado que podem atender até certo ponto as necessidades, mas trarão muitos problemas, principalmente algumas soluções originalmente voltadas para centros de supercomputação, como armazenamento comercial, que são muito caras, mas não foram projetadas para resolver os problemas atuais Projetado para os desafios enfrentados por cenários típicos de IA.
Portanto, Alluxio espera usar uma plataforma de acesso a dados distribuído de alto desempenho para melhor resolver os problemas enfrentados pela plataforma de dados e E/S de dados em toda a IA. Alluxio está entre estruturas de computação (estruturas de plataforma de treinamento), como Pytorch, TensorFlow, Ray e armazenamento de dados. Ele pode coordenar e orquestrar estruturas de armazenamento lento e poder de computação.
Através do Alluxio, os dados podem ser aproximados dos nós de computação, como o poder de computação da GPU e da CPU, e os dados podem ser separados de forma rápida e automática de quentes e frios, para que os dados possam ser adquiridos rapidamente por tarefas de treinamento de GPU. Ao mesmo tempo, o Alluxio pode combinar diferentes tipos de fontes de dados subjacentes para formar uma solução geral econômica e de alto ROI, composta de armazenamento frio de baixo custo e cache quente Alluxio.
O primeiro cenário que esta solução resolve principalmente é quando uma empresa possui seus próprios dados, que não podem ser colocados na nuvem porque são relativamente sensíveis. Ao mesmo tempo, o poder de computação local é insuficiente e necessário. para emprestar GPUs de outros data centers. Neste momento, as empresas precisam de uma solução que possa suportar a implantação flexível de GPU e utilizar de forma flexível o agendamento de dados e poder de computação.
O segundo cenário é que, após a conclusão do treinamento do modelo, ele precisa ser distribuído para clusters de inferência. Há um grande número de clusters de inferência que precisam atualizar modelos com frequência. Pode haver gargalos de E/S no processo de implantação de inferência. neste caso, o Alluxio pode ser muito eficiente para resolver problemas encontrados durante a implantação de inferência.
O valor que o Alluxio traz
No geral, na nova geração de plataformas de treinamento de IA, o Alluxio pode não apenas fornecer serviços de aceleração para todo o processo de treinamento, mas também fornecer melhor inferência e distribuição quando o modelo treinado é implantado no cluster de inferência. A solução pode implantar e usar o Alluxio rapidamente em comparação com a compra de hardware adicional muito caro. As empresas só precisam usar hardware padrão de baixo custo, obtendo realmente redução de custos e melhoria de eficiência.
Através da verificação do teste, podemos ver intuitivamente que uma tarefa de treinamento leva 85 minutos sem Alluxio, mas leva apenas 17 minutos com Alluxio, e a eficiência do DataLoader é responsável por 10% de todo o tempo de treinamento. caiu significativamente de 82% para 1%. O valor trazido por isso é que o Alluxio pode aumentar a taxa de utilização de GPUs que as empresas gastam muito dinheiro para comprar dos 17% originais para 93%, o que não apenas melhora muito a infraestrutura da empresa. ROI, ao mesmo tempo que acelera o lançamento final do negócio.
Atualmente, o Alluxio está sendo amplamente adotado por empresas e instituições em vários setores ao redor do mundo. Esperamos trabalhar com todos para acelerar a evolução da IA e trazer retorno do investimento para as empresas de forma mais eficiente.
✦
[Adicione assistente para obter mais informações]
✦
![](https://oscimg.oschina.net/oscnet/e309bd3a-82ba-4a22-9386-d6e15c96ccfa.png)
✦
【Popularidade recente】
✦
✦
【Mercado Baodiano】
✦
![](https://oscimg.oschina.net/oscnet/796dc831-489e-4ef6-b348-de7250887cd2.png)
![](https://oscimg.oschina.net/oscnet/26567e78-44cd-4309-bd6b-c8809ea5914f.png)
![](https://oscimg.oschina.net/oscnet/318102c3-78aa-46fd-b555-07c5a3f62581.png)
![](https://oscimg.oschina.net/oscnet/8bf90b69-23d8-486f-9c62-1c530a68f1dd.png)
Este artigo é compartilhado na conta pública do WeChat - Alluxio (Alluxio_China).
Se houver alguma violação, entre em contato com [email protected] para exclusão.
Este artigo participa do “ Plano de Criação da Fonte OSC ”. Você que está lendo é bem-vindo para participar e compartilhar juntos.