Alluxio erschien auf der Jahrestagung des Zhongguancun Forums 2024·Hard Technology Investment and Development Forum

Vorwort

Das Jahrestreffen des Zhongguancun-Forums 2024 und das Hard Technology Investment and Development Forum fanden kürzlich im Zhongguancun International Innovation Center statt. 180 Investoren, Finanziers, Unternehmer, Branchenexperten und relevante Regierungsführer aus der ganzen Welt mit Schwerpunkt auf „Globalisierung des Kapitals und Technologie im Ausland“, „Etablierung und Scheitern von Investitionen in harte Technologien“ und „neue globale Praxis von harten Technologien“. Es wurden intensive Austausche und Diskussionen geführt.



Han Geng, stellvertretender Generalsekretär der Volksregierung der Stadt Peking, sagte in seiner Rede, dass auf dem Weg in die neue Ära die Innovation und Entwicklung der harten Wissenschaft und Technologie als Kernelement der neuen Produktivkräfte unverzichtbar geworden sei und wichtige Kraft in Chinas Modernisierungsbemühungen. Die Zahl der Unicorn-Unternehmen in Peking steht landesweit seit jeher an erster Stelle, wobei Unicorn-Unternehmen mit harter Technologie mehr als 60 % ausmachen. Mit Blick auf die Zukunft hat Peking 20 unterteilte Branchen in sechs große Wissenschafts- und Technologiebereiche angelegt und 4 Dutzende Milliarden an Wissenschafts- und Technologieinnovationsfonds eingerichtet. Diese Fonds werden sich auf strategische aufstrebende Industrien wie künstliche Intelligenz, Robotik und medizinische Gesundheit konzentrieren .


Han Geng, stellvertretender Generalsekretär der Volksregierung der Stadt Peking


Als Alluxio, eine KI-Datenplattform der neuen Generation, die weltweit viel Aufmerksamkeit erregt hat, wurde Chefarchitekt Dr. Fu Zhengjia zur Teilnahme am Forum eingeladen und traf sich in den Jahren 2023 bis 2024 in der TED-Show zum Thema „Neu“ mit herausragenden Innovationsführern Global Practices of Hard Technology“, darunter Wang Shaolan, Präsident von Zhipu AI, He Huajie, Präsident der Pathfinder Group, Bu Xiangwei, Mitbegründer und Co-CEO von Oriental Space, Zhao Yongjie, CMO von Origin Quantum, und Zhong Haizheng, Der Gründer von Zhijing Technology teilte die neuesten Kerntechnologien und Anwendungspraktiken verschiedener Unternehmen.


Alluxio teilt das Thema:
„KI-Datenplattform der neuen Generation“

Dr. Fu Zhengjia, Chefarchitekt von Alluxio


Beschleunigte Entwicklung von KI im Vergleich zu Herausforderungen im Datenmanagement

KI entwickelt sich derzeit rasant weiter und hat sowohl in vertikalen als auch horizontalen Bereichen verschiedener Branchen große Aufmerksamkeit erhalten. Ray Kurzwell, ein Investor und Zukunftsforscher aus den Vereinigten Staaten, prognostiziert, dass „künstliche Intelligenz im Jahr 2029 das Niveau menschlicher Intelligenz erreichen wird und bis 2045 die Fähigkeiten der biologischen maschinellen Intelligenz, die durch intelligente Technologie und menschliche Zivilisation geschaffen wurden, um eine Milliarde erweitert werden.“ Jen-Hsun Huang, CEO von NVIDIA, ist davon überzeugt, dass wir einen Anstieg der Nachfrage nach einer globalen Umstrukturierung von Rechenzentren erleben werden und mehr. Viele Unternehmen beginnen mit der Vorbereitung oder nutzen KI, um ihre Unternehmen zu stärken, indem sie Modelle trainieren und sie auf tatsächliche Unternehmen anwenden, um die Produktionseffizienz zu verbessern und mehr Wert zu schaffen.


Gleichzeitig ist mit der neuen Generation der KI ausgehend von ChatGPT die Modellstruktur immer komplexer geworden, die Anzahl der beteiligten Parameter ist immer größer geworden und auch der Bedarf an Rechenleistung hat zugenommen offensichtlich. Daher wird allgemein angenommen, dass die drei wichtigsten Kerne für die Entwicklung von KI Rechenleistung, Algorithmen und Daten sind. Allerdings wird die Bedeutung des Aufbaus der KI-Infrastruktur oft ignoriert Nur mit großen Kernfähigkeiten können die drei Kernaspekte der KI besser genutzt werden.


Auch Unternehmen stehen beim Aufbau einer KI-Infrastruktur vor einer Reihe von Herausforderungen:


1. Aus Sicht der Rechenleistung

Derzeit sind inländische Unternehmen im Allgemeinen mit den Problemen der GPU-Knappheit, des hohen Preises und der geringen Auslastung konfrontiert. Aber selbst wenn das Problem der GPU gemildert werden kann, wird ein weiteres Problem entstehen, nämlich wie die Daten des GPU-Computings besser verwaltet und bereitgestellt werden können , wie man die von der GPU geforderte Datenzugriffseffizienz erreicht (wenn Daten-E/A zu einem Engpass wird, wird die GPU-Auslastung unzureichend und Sie müssen warten, bis die Daten in die GPU geladen sind, bevor das Training durchgeführt werden kann);


2. Von der geschäftlichen Seite

Algorithmen- und Unternehmensführer fordern häufig schnellere Modellkonstruktionszyklen und Iterationsgeschwindigkeiten. Wir sehen auch einen sehr klaren Wachstumstrend bei der Datenerfassung für intelligentes Fahren und fahrerlose Fahrzeuge sowie bei der Erfassung und Kommentierung von Daten aus verschiedenen Branchen Unternehmen müssen sich auf die wachsende Datenmenge vorbereiten.


Das Größenwachstum hat zum einen das Wachstum des gesamten Datenvolumens. Wie viele Milliarden Bilder und wie viele Stimmen gibt es insbesondere? Auch multimodale, textbasierte Bilder, textbasierte Videos und verschiedene Modelle erfordern eine Datenaufbereitung, sodass die Datenmenge weiter zunehmen wird.


Andererseits wächst die Größe der Daten selbst. Vor ein paar Jahren haben wir gesehen, dass ein Gesichtserkennungsbild möglicherweise nur 100 KB oder 200 KB groß ist. Heute sehen wir jedoch Videobilder, hochauflösende 4K-Bilder und ein Bild ist 1 MB, 4 MB, 8 MB, die Daten selbst wachsen ständig. Wenn diese beiden Dimensionen multipliziert werden, wächst die Größe der gesamten Daten auf quadratischer Ebene.


Daher benötigen wir eine bessere Datenspeicher- und Daten-I/O-Lösung für die gesamte Trainingsplattform, um den Trainingseffekt zu verbessern.


Alluxio-Lösungen

Es gibt einige Lösungen auf dem Markt, die die Anforderungen bis zu einem gewissen Grad erfüllen können, aber viele Probleme mit sich bringen, insbesondere einige Lösungen, die ursprünglich für Supercomputing-Zentren gedacht waren, wie z. B. kommerzielle Speicher, die sehr teuer sind, aber nicht darauf ausgelegt sind Lösen Sie die aktuellen Probleme. Entwickelt für die Herausforderungen typischer KI-Szenarien.


Daher hofft Alluxio, eine leistungsstarke verteilte Datenzugriffsplattform nutzen zu können, um die Probleme der Datenplattform und der Daten-E/A in der gesamten KI besser zu lösen. Alluxio liegt zwischen Computer-Frameworks (Trainingsplattform-Frameworks) wie Pytorch, TensorFlow, Ray und Datenspeicher. Es kann langsame Speicher- und Rechenleistungs-Frameworks koordinieren und orchestrieren.


Durch Alluxio können Daten näher an Rechenknoten wie GPU- und CPU-Rechenleistung gebracht werden, und die Daten können schnell und automatisch von heiß und kalt getrennt werden, sodass die Daten schnell durch GPU-Trainingsaufgaben erfasst werden können. Gleichzeitig kann Alluxio verschiedene Arten von zugrunde liegenden Datenquellen kombinieren, um eine kostengünstige Gesamtlösung mit hohem ROI zu bilden, die aus kostengünstigem Cold Storage und Alluxio Hot Cache besteht.


Das erste Szenario, das diese Lösung hauptsächlich löst, besteht darin, dass ein Unternehmen über eigene Daten verfügt, die nicht in der Cloud abgelegt werden können, da diese relativ sensibel sind. Gleichzeitig reicht die lokale Rechenleistung nicht aus Um GPUs von anderen Rechenzentren auszuleihen, benötigen Unternehmen derzeit eine Lösung, die eine flexible GPU-Bereitstellung unterstützt und die Daten- und Rechenleistungsplanung sehr gut bewältigen kann.


Das zweite Szenario besteht darin, dass das Modelltraining an Online-Inferenzcluster verteilt werden muss. Es gibt möglicherweise eine große Anzahl von Inferenzclustern, bei denen es zu E/A-Engpässen im Inferenzbereitstellungsprozess kommt In diesem Fall kann Alluxio die bei der Inferenzbereitstellung auftretenden Probleme sehr effizient lösen.


Der Wert, den Alluxio bietet

Insgesamt kann Alluxio in der neuen Generation von KI-Trainingsplattformen nicht nur Beschleunigungsdienste für den gesamten Trainingsprozess bereitstellen, sondern auch eine bessere Inferenz und Verteilung bereitstellen, wenn das trainierte Modell im Inferenzcluster bereitgestellt wird Die Lösung kann Alluxio im Vergleich zum Kauf zusätzlicher, sehr teurer Hardware schnell bereitstellen und nutzen. Unternehmen müssen nur kostengünstige Standardhardware verwenden und erzielen so eine echte Kostensenkung und Effizienzsteigerung.


Durch die Testüberprüfung können wir intuitiv erkennen, dass eine Trainingsaufgabe ohne Alluxio 85 Minuten dauert, mit Alluxio jedoch nur 17 Minuten, und dass die Effizienz um das Fünffache der gesamten Trainingszeit ausmacht Der Wert ist dadurch deutlich gesunken, dass Alluxio die Auslastung der GPUs, für deren Anschaffung Unternehmen viel Geld ausgeben, von ursprünglich 17 % auf 93 % steigern kann, was nicht nur die Infrastruktur des Unternehmens erheblich verbessert ROI und beschleunigt gleichzeitig den endgültigen Geschäftsstart.


Derzeit wird Alluxio von Unternehmen und Institutionen in verschiedenen Branchen auf der ganzen Welt weit verbreitet. Wir freuen uns darauf, mit allen zusammenzuarbeiten, um die Entwicklung der KI zu beschleunigen und den Unternehmen eine effizientere Kapitalrendite zu ermöglichen.


[Assistent hinzufügen, um weitere Informationen zu erhalten]


【Aktuelle Popularität】


【Baodian-Markt】

Dieser Artikel wurde über das öffentliche WeChat-Konto – Alluxio (Alluxio_China) – geteilt.
Bei Verstößen wenden Sie sich bitte zur Löschung an [email protected].
Dieser Artikel ist Teil des „ OSC Source Creation Plan “. Alle, die ihn lesen, sind herzlich eingeladen, mitzumachen und ihn gemeinsam zu teilen.

《庆余年2》盗版资源被上传到 npm,导致 npmmirror 不得已暂停 unpkg 服务 周鸿祎:留给谷歌的时间不多了,建议把所有的产品都开源 请教各位,此处的 time.sleep(6) 起到了什么作用? Linus “吃狗粮”最积极! 新款 iPad Pro 使用了 12GB 内存颗粒,但却声称是 8GB 内存 人民网评办公软件套娃式收费:积极解“套”,才有未来 Flutter 3.22 和 Dart 3.4 发布 Vue3 开发新范式,不用`ref/reactive`,不用`ref.value` MySQL 8.4 LTS 中文手册发布:助力您掌握数据库管理新境界 通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens
{{o.name}}
{{m.name}}

Ich denke du magst

Origin my.oschina.net/u/5904778/blog/11106093
Empfohlen
Rangfolge