Alluxio apareció en la Reunión Anual del Foro Zhongguancun 2024 · Foro de Desarrollo e Inversión en Tecnología Dura

Prefacio

La Reunión Anual del Foro Zhongguancun 2024 y el Foro de Desarrollo e Inversión en Tecnología Dura se celebraron recientemente en el Centro Internacional de Innovación de Zhongguancun. 180 inversores, financieros, empresarios, expertos de la industria y líderes gubernamentales relevantes de todo el mundo, centrándose en "globalización del capital y tecnología en el extranjero", "establecimiento y fracaso de la inversión en tecnología dura" y "nuevas prácticas globales de tecnología dura". Se llevaron a cabo intercambios y debates en profundidad.



Han Geng, subsecretario general del Gobierno Popular Municipal de Beijing, dijo en su discurso que en el viaje de la nueva era, la innovación y el desarrollo de la ciencia y la tecnología duras, como elemento central de las nuevas fuerzas productivas, se ha convertido en un elemento indispensable. y una fuerza importante en el impulso de modernización de China. El número de empresas unicornio en Beijing siempre ha ocupado el primer lugar en el país, de las cuales las empresas unicornio de tecnología dura representan más del 60%. De cara al futuro, Beijing ha establecido 20 industrias subdivididas en seis campos principales de ciencia y tecnología y ha establecido cuatro decenas de miles de millones de fondos de innovación en ciencia y tecnología. Estos fondos se centrarán en industrias estratégicas emergentes como la inteligencia artificial, la robótica y la salud médica. .


Han Geng, Secretario General Adjunto del Gobierno Popular Municipal de Beijing


Alluxio, como plataforma de datos de IA de nueva generación que ha atraído mucha atención en el mundo, el arquitecto jefe Dr. Fu Zhengjia fue invitado a asistir al foro y se reunió con destacados líderes de innovación en 2023-2024 en la feria TED con el tema "Nueva Prácticas globales de tecnología dura", incluidos Wang Shaolan, presidente de Zhipu AI, He Huajie, presidente de Pathfinder Group, Bu Xiangwei, cofundador y codirector ejecutivo de Oriental Space, Zhao Yongjie, CMO de Origin Quantum y Zhong Haizheng. Fundador de Zhijing Technology, compartió las últimas tecnologías y prácticas de aplicación de varias empresas.


Alluxio comparte el tema:
"Plataforma de datos de IA de nueva generación"

Dr. Fu Zhengjia, arquitecto jefe de Alluxio


Evolución acelerada de la IA frente a los desafíos de la gestión de datos

Actualmente, la IA está evolucionando rápidamente y ha recibido una atención generalizada en los campos verticales y horizontales de diversas industrias. Ray Kurzwell, inversor y futurista de Estados Unidos, predice que "la inteligencia artificial alcanzará el nivel de la inteligencia humana en 2029, y para 2045, las capacidades de la inteligencia biológica de las máquinas creadas por la tecnología inteligente y la civilización humana se ampliarán en mil millones". veces; el director ejecutivo de NVIDIA, Jen-Hsun Huang, cree que estamos presenciando un aumento en la demanda de reestructuración de los centros de datos globales. Esta década de reciclaje y utilización de los centros de datos existentes eventualmente conducirá a un viaje de transformación de la computación acelerada. y más, muchas empresas están comenzando a preparar o están utilizando la IA para potenciar sus negocios mediante la capacitación de modelos y aplicándolos a negocios reales para mejorar la eficiencia de la producción y crear mayor valor.


Al mismo tiempo, con la nueva generación de IA a partir de ChatGPT, la estructura del modelo se ha vuelto cada vez más compleja, la cantidad de parámetros involucrados se ha vuelto cada vez mayor y los requisitos de potencia informática también han aumentado. obvio. Por lo tanto, en general se cree que los tres núcleos más importantes para el desarrollo de la IA son la potencia informática, los algoritmos y los datos. Sin embargo, a menudo todo el mundo ignora la importancia de la construcción de la infraestructura de la IA. La práctica ha demostrado que sólo se puede construir bien la infraestructura de la IA. , los tres aspectos centrales de la IA se pueden resolver solo con grandes habilidades centrales se pueden aprovechar mejor.


Las empresas también enfrentan una serie de desafíos al construir una infraestructura de IA:


1. Desde la perspectiva de la potencia informática.

En la actualidad, las empresas nacionales generalmente enfrentan problemas de escasez de GPU, alto precio y baja tasa de utilización, pero incluso si se puede aliviar el problema de la GPU, surgirá otro problema, que es cómo administrar y servir mejor los datos de la GPU. , cómo lograr la eficiencia de acceso a datos requerida por la GPU (cuando los datos IO se convierten en un cuello de botella, la utilización de la GPU será insuficiente y deberá esperar a que los datos se carguen en la GPU antes de poder realizar el entrenamiento);


2. Desde el lado empresarial

Los líderes empresariales y de algoritmos a menudo requieren ciclos de construcción de modelos y velocidades de iteración más rápidos. También vemos una tendencia de crecimiento muy clara en los datos, como la recopilación de datos para la conducción inteligente y los vehículos sin conductor, y después de la recopilación y anotación de datos de diversas industrias. Las empresas deben prepararse para el creciente tamaño de los datos.


El crecimiento de escala tiene dos dimensiones. Por un lado, es el crecimiento de todo el volumen de datos. Por ejemplo, ¿cuántos miles de millones de imágenes y cuántas voces hay en particular, además de los grandes modelos de lenguaje? también la capacitación multimodal, imágenes basadas en texto, videos basados ​​en texto y varios modelos requiere preparación de datos, por lo que la cantidad de datos seguirá aumentando.


Por otro lado, el tamaño de los datos en sí está creciendo. Hace unos años, vimos que una imagen de reconocimiento facial podía tener solo 100 KB o 200 KB, pero ahora estamos viendo imágenes de video, imágenes de alta definición 4K y una imagen. es 1 MB, 4 MB, 8 MB, los datos en sí crecen constantemente, por lo que cuando estas dos dimensiones se multiplican, el tamaño de todos los datos crece al nivel del cuadrado.


Por lo tanto, necesitamos una mejor solución de almacenamiento de datos y E/S de datos para toda la plataforma de capacitación para mejorar el efecto de la capacitación.


Soluciones Alluxio

Hay algunas soluciones en el mercado que pueden satisfacer las necesidades hasta cierto punto, pero traerán muchos problemas, especialmente algunas soluciones originalmente destinadas a centros de supercomputación, como el almacenamiento comercial, que son muy caras, pero no están diseñadas para resolver los problemas actuales. Diseñado para los desafíos que enfrentan los escenarios típicos de IA.


Por lo tanto, Alluxio espera utilizar una plataforma de acceso a datos distribuidos de alto rendimiento para resolver mejor los problemas que enfrentan las plataformas de datos y la E/S de datos en toda la IA. Alluxio se encuentra entre los marcos informáticos (marcos de plataforma de capacitación), como Pytorch, TensorFlow, Ray y el almacenamiento de datos. También lo llamamos una herramienta de orquestación de datos distribuidos.


A través de Alluxio, los datos se pueden acercar a los nodos informáticos, como la potencia informática de GPU y CPU, y los datos se pueden separar rápida y automáticamente de frío y calor, de modo que las tareas de entrenamiento de GPU puedan adquirirlos rápidamente. Al mismo tiempo, Alluxio puede combinar diferentes tipos de fuentes de datos subyacentes para formar una solución general rentable y de alto retorno de la inversión compuesta por almacenamiento en frío de bajo costo y caché caliente de Alluxio.


El primer escenario que resuelve principalmente esta solución es cuando una empresa tiene sus propios datos y no se puede colocar en la nube porque es relativamente sensible. Al mismo tiempo, la potencia informática local es insuficiente y necesaria. Para tomar prestadas GPU de otros centros de datos. En este momento, las empresas necesitan una solución que pueda admitir la implementación flexible de GPU y utilizar de manera flexible la programación de datos y potencia informática. Alluxio puede hacer frente a tales escenarios.


El segundo escenario es que una vez completado el entrenamiento del modelo, es necesario distribuirlo a grupos de inferencia en línea. Hay una gran cantidad de grupos de inferencia que necesitan actualizar el modelo con frecuencia. Puede haber cuellos de botella de E/S en el proceso de implementación de inferencia. En este caso, Alluxio puede ser muy eficiente para resolver los problemas encontrados durante la implementación de la inferencia.


El valor que aporta Alluxio

En general, en la nueva generación de plataformas de entrenamiento de IA, Alluxio no solo puede proporcionar servicios de aceleración para todo el proceso de entrenamiento, sino que también puede brindar una mejor inferencia y distribución cuando el modelo entrenado se implementa en el grupo de inferencia. La solución puede implementar y usar Alluxio rápidamente en comparación con la compra de hardware adicional muy costoso. Las empresas solo necesitan usar hardware estándar de bajo costo, logrando realmente una reducción de costos y una mejora de la eficiencia.


A través de la verificación de la prueba, podemos ver intuitivamente que una tarea de capacitación toma 85 minutos sin Alluxio, pero solo toma 17 minutos con Alluxio, y la eficiencia de DataLoader también representa el 10% de todo el tiempo de capacitación. cayó significativamente del 82% al 1%. El valor aportado por esto es que Alluxio puede aumentar la tasa de utilización de las GPU en las que las empresas gastan mucho dinero para comprar del 17% original al 93%, lo que no solo mejora en gran medida la infraestructura de la empresa. ROI, al tiempo que se acelera el lanzamiento final del negocio.


Actualmente, Alluxio está siendo ampliamente adoptado por empresas e instituciones de diversas industrias en todo el mundo. Esperamos trabajar con todos para acelerar la evolución de la IA y brindar un retorno de la inversión a las empresas de manera más eficiente.


[Agrega asistente para obtener más información]


【Popularidad reciente】


【Mercado Baodiano】

Este artículo se comparte desde la cuenta pública de WeChat: Alluxio (Alluxio_China).
Si hay alguna infracción, comuníquese con [email protected] para eliminarla.
Este artículo participa en el " Plan de creación de fuentes OSC ". Los que están leyendo pueden unirse y compartir juntos.

《庆余年2》盗版资源被上传到 npm,导致 npmmirror 不得已暂停 unpkg 服务 周鸿祎:留给谷歌的时间不多了,建议把所有的产品都开源 请教各位,此处的 time.sleep(6) 起到了什么作用? Linus “吃狗粮”最积极! 新款 iPad Pro 使用了 12GB 内存颗粒,但却声称是 8GB 内存 人民网评办公软件套娃式收费:积极解“套”,才有未来 Flutter 3.22 和 Dart 3.4 发布 Vue3 开发新范式,不用`ref/reactive`,不用`ref.value` MySQL 8.4 LTS 中文手册发布:助力您掌握数据库管理新境界 通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens
{{o.name}}
{{m.name}}

Supongo que te gusta

Origin my.oschina.net/u/5904778/blog/11106093
Recomendado
Clasificación