Alluxio est apparu à la réunion annuelle du Forum Zhongguancun 2024·Forum sur l'investissement et le développement des technologies dures

Préface

La réunion annuelle du Forum Zhongguancun 2024 et le Forum sur l'investissement et le développement des technologies dures se sont récemment tenus au Centre international d'innovation de Zhongguancun. 180 investisseurs, financiers, entrepreneurs, experts de l'industrie et dirigeants gouvernementaux concernés du monde entier, se concentrant sur « la mondialisation du capital et la technologie à l'étranger », « l'établissement et l'échec des investissements dans les technologies dures » et « les nouvelles pratiques mondiales des technologies dures ». Des échanges et des discussions approfondis ont été menés.



Han Geng, secrétaire général adjoint du gouvernement populaire municipal de Pékin, a déclaré dans son discours que dans le voyage vers la nouvelle ère, l'innovation et le développement de la science et de la technologie dures, en tant qu'élément central des nouvelles forces productives, sont devenus un élément indispensable. et une force importante dans la dynamique de modernisation de la Chine. Le nombre d'entreprises licornes à Pékin a toujours été au premier rang dans le pays, parmi lesquelles les entreprises licornes de technologie dure représentent plus de 60 %. Face à l'avenir, Pékin a réparti 20 industries subdivisées dans 6 domaines scientifiques et technologiques majeurs et a créé 4 dizaines de milliards de fonds d'innovation scientifique et technologique. Ces fonds se concentreront sur les industries stratégiques émergentes telles que l'intelligence artificielle, la robotique et la santé médicale. .


Han Geng, secrétaire général adjoint du gouvernement populaire municipal de Pékin


Alluxio, en tant que plate-forme de données d'IA de nouvelle génération qui a attiré beaucoup d'attention dans le monde, l'architecte en chef Dr. Fu Zhengjia a été invité à assister au forum et a rencontré des leaders exceptionnels de l'innovation en 2023-2024 dans le salon TED sur le thème « Nouveau ». Global Practices of Hard Technology", dont Wang Shaolan, président de Zhipu AI, He Huajie, président de Pathfinder Group, Bu Xiangwei, co-fondateur et co-PDG d'Oriental Space, Zhao Yongjie, directeur marketing d'Origin Quantum, et Zhong Haizheng, fondateur de Zhijing Technology, a partagé les dernières technologies et technologies de base de diverses entreprises.


Alluxio partage le sujet :
"New Generation AI Data Platform"

Dr Fu Zhengjia, architecte en chef d'Alluxio


Évolution accélérée des défis de l’IA par rapport à la gestion des données

L’IA évolue actuellement rapidement et a reçu une large attention dans les domaines verticaux et horizontaux de diverses industries. Ray Kurzwell, un investisseur et futuriste américain, prédit que « l'intelligence artificielle atteindra le niveau de l'intelligence humaine en 2029 et que d'ici 2045, les capacités de l'intelligence biologique des machines créées par la technologie intelligente et la civilisation humaine seront étendues d'un milliard ». Le PDG de NVIDIA, Jen-Hsun Huang, estime que nous assistons à une augmentation de la demande de restructuration des centres de données à l'échelle mondiale. Ce recyclage et l'utilisation des centres de données existants, qui durent une décennie, mèneront à terme à un parcours de transformation de l'informatique accélérée. et bien plus encore. De nombreuses entreprises commencent à se préparer ou à utiliser l'IA pour responsabiliser leurs entreprises en formant des modèles et en les appliquant à des entreprises réelles afin d'améliorer l'efficacité de la production et de créer une plus grande valeur.


Dans le même temps, avec la nouvelle génération d'IA à partir de ChatGPT, la structure du modèle est devenue de plus en plus complexe, le nombre de paramètres impliqués est devenu de plus en plus grand et les besoins en puissance de calcul ont également augmenté. évident. Par conséquent, on pense généralement que les trois noyaux les plus importants pour le développement de l'IA sont la puissance de calcul, les algorithmes et les données. Cependant, tout le monde ignore souvent l'importance de la construction de l'infrastructure de l'IA. La pratique ne l'a prouvé qu'en construisant bien l'infrastructure de l'IA. , les trois aspects fondamentaux de l'IA peuvent être résolus Ce n'est qu'avec de grandes capacités de base qu'ils pourront être mieux utilisés.


Les entreprises sont également confrontées à une série de défis lors de la création d’une infrastructure d’IA :


1. Du point de vue de la puissance de calcul

À l'heure actuelle, les entreprises nationales sont généralement confrontées aux problèmes de pénurie de GPU, de prix élevé et de faible taux d'utilisation. Mais même si le problème du GPU peut être atténué, un autre problème suivra, à savoir comment mieux gérer et servir les données du GPU Computing. , comment atteindre l'efficacité d'accès aux données requise par le GPU (lorsque les E/S de données deviennent un goulot d'étranglement, l'utilisation du GPU deviendra insuffisante et vous devrez attendre que les données soient chargées dans le GPU avant de pouvoir effectuer l'entraînement) ;


2. Du côté des entreprises

Les algorithmes et les dirigeants d'entreprise ont souvent besoin de cycles de construction de modèles et de vitesses d'itération plus rapides. Nous constatons également une tendance à la croissance très claire des données, telles que la collecte de données pour la conduite intelligente et les véhicules sans conducteur, et après la collecte et l'annotation de données provenant de diverses industries. les entreprises doivent se préparer à la taille croissante des données.


La croissance de l'échelle a deux dimensions. D'une part, il s'agit de la croissance de l'ensemble du volume de données. Par exemple, combien de milliards d'images et combien de voix existe-t-il en plus des grands modèles de langage ? également des images multimodales basées sur du texte, des vidéos basées sur du texte et divers modèles. La formation nécessite une préparation des données, de sorte que la quantité de données continuera d'augmenter.


D’un autre côté, la taille des données elles-mêmes augmente. Il y a quelques années, nous avons vu qu’une image de reconnaissance faciale ne faisait que 100 ou 200 Ko. Mais nous voyons maintenant des images vidéo, des images 4K haute définition et une image. est de 1 Mo, 4 Mo, 8 Mo, les données elles-mêmes augmentent constamment, donc lorsque ces deux dimensions sont multipliées, la taille de l'ensemble des données augmente au niveau du carré.


Par conséquent, nous avons besoin d'une meilleure solution de stockage de données et d'E/S de données pour l'ensemble de la plate-forme de formation afin d'améliorer l'effet de la formation.


Alluxio Solutions

Il existe sur le marché certaines solutions qui peuvent répondre aux besoins dans une certaine mesure, mais qui poseront beaucoup de problèmes, notamment certaines solutions initialement destinées aux centres de calcul intensif, comme le stockage commercial, qui sont très coûteuses, mais ne sont pas conçues pour résoudre les problèmes actuels. Conçu pour les défis rencontrés par les scénarios d’IA typiques.


Par conséquent, Alluxio espère utiliser une plate-forme d'accès aux données distribuées hautes performances pour mieux résoudre les problèmes rencontrés par la plate-forme de données et les E/S de données dans l'ensemble de l'IA. Alluxio se situe entre les frameworks informatiques (frameworks de plateforme de formation), tels que Pytorch, TensorFlow, Ray et le stockage de données. Il peut coordonner et orchestrer des frameworks de stockage lent et de puissance de calcul. Nous l'appelons également un outil d'orchestration de données distribuées.


Grâce à Alluxio, les données peuvent être rapprochées des nœuds informatiques, tels que la puissance de calcul du GPU et du CPU, et les données peuvent être rapidement et automatiquement séparées du chaud et du froid, afin que les données puissent être rapidement acquises par les tâches de formation GPU. Dans le même temps, Alluxio peut combiner différents types de sources de données sous-jacentes pour former une solution globale rentable et à haut retour sur investissement composée d'un stockage froid à faible coût et d'un cache chaud Alluxio.


Le premier scénario que cette solution résout principalement est celui où une entreprise dispose de ses propres données, qui ne peuvent pas être placées sur le cloud car elles sont relativement sensibles. Dans le même temps, la puissance de calcul locale est insuffisante et nécessaire. Pour emprunter des GPU à d'autres centres de données, les entreprises ont actuellement besoin d'une solution capable de prendre en charge un déploiement flexible de GPU et d'utiliser de manière flexible la planification des données et de la puissance de calcul. Alluxio peut très bien faire face à de tels scénarios.


Le deuxième scénario est qu'une fois la formation du modèle terminée, il doit être distribué aux clusters d'inférence en ligne qui doivent fréquemment mettre à jour les modèles. Il peut y avoir des goulots d'étranglement d'E/S dans le processus de déploiement d'inférence. dans ce cas, Alluxio peut être très efficace pour résoudre les problèmes rencontrés lors du déploiement d'inférence.


La valeur qu'apporte Alluxio

Dans l'ensemble, dans la nouvelle génération de plates-formes de formation d'IA, Alluxio peut non seulement fournir des services d'accélération pour l'ensemble du processus de formation, mais également fournir une meilleure inférence et une meilleure distribution lorsque le modèle formé est déployé sur le cluster d'inférence. La solution peut déployer et utiliser Alluxio rapidement par rapport à l'achat de matériel supplémentaire très coûteux. Les entreprises n'ont besoin que d'utiliser du matériel standard à faible coût, ce qui permet de véritablement réduire les coûts et améliorer l'efficacité.


Grâce à la vérification des tests, nous pouvons voir intuitivement qu'une tâche de formation prend 85 minutes sans Alluxio, mais ne prend que 17 minutes avec Alluxio, et l'efficacité est multipliée par 5. DataLoader représente 10 % du temps total de formation. a chuté de manière significative, passant de 82 % à 1 %. La valeur apportée par cela est qu'Alluxio peut augmenter le taux d'utilisation des GPU pour lesquels les entreprises dépensent beaucoup d'argent de 17 % à 93 %, ce qui non seulement améliore considérablement l'infrastructure de l'entreprise. ROI, tout en accélérant le lancement final de l'entreprise.


Actuellement, Alluxio est largement adopté par les entreprises et les institutions de divers secteurs à travers le monde. Nous sommes impatients de travailler avec tout le monde pour accélérer l'évolution de l'IA et apporter plus efficacement un retour sur investissement aux entreprises.


[Ajouter un assistant pour obtenir plus d'informations]


【Popularité récente】


【Marché Baodian】

Cet article est partagé à partir du compte public WeChat - Alluxio (Alluxio_China).
En cas d'infraction, veuillez contacter [email protected] pour suppression.
Cet article participe au « Plan de création de sources OSC ». Vous qui lisez, êtes invités à vous joindre et à partager ensemble.

《庆余年2》盗版资源被上传到 npm,导致 npmmirror 不得已暂停 unpkg 服务 周鸿祎:留给谷歌的时间不多了,建议把所有的产品都开源 请教各位,此处的 time.sleep(6) 起到了什么作用? Linus “吃狗粮”最积极! 新款 iPad Pro 使用了 12GB 内存颗粒,但却声称是 8GB 内存 人民网评办公软件套娃式收费:积极解“套”,才有未来 Flutter 3.22 和 Dart 3.4 发布 Vue3 开发新范式,不用`ref/reactive`,不用`ref.value` MySQL 8.4 LTS 中文手册发布:助力您掌握数据库管理新境界 通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens
{{o.name}}
{{m.name}}

Je suppose que tu aimes

Origine my.oschina.net/u/5904778/blog/11106093
conseillé
Classement