今すぐサインアップ|AIモデルトレーニング加速産業シェアリングサロン


活動背景

ビジネスにおいてはスピードが成否を決めることがよくあります。

モデル トレーニングの高速化は、企業が新しい AI 製品やサービスをより迅速に開発できることを意味し、それによってそれらをより早く市場に投入し、顧客のニーズを満たすことができます。この迅速な対応能力は、企業が競争でチャンスを掴み、市場での優位性を獲得するのに役立ちます。それだけでなく、高速化は企業がトレーニングに必要な時間を短縮できることも意味し、それによってハードウェア リソースの占有とエネルギー消費が削減され、ROI が向上します。


Alluxio は、世界をリードする高性能 AI データ アクセス プラットフォームとして、AI モデルのトレーニングと推論の中核段階で広く使用されています。今回、私たちは中関村の有名なインキュベーター ブランド Taili Station およびデータ インテリジェンス開発者の垂直コミュニティである DataFunと提携し、インターネット、自動車、大型モデル業界から AI インフラの専門家を招待し、業界パートナーに加速する AI モデルを提供します。をテーマにした素敵なオフラインサロン。


AI インフラ関連の IT/技術リーダー、アーキテクト、開発者、研究者、エコロジカル パートナーの皆様のサインアップと参加を心より歓迎いたします。


QRコードを認識する

今すぐサインアップして参加してください



イベント情報

開催時間:2024年4月26日(金)14:00~17:10

共催: Alluxio x Inno.EcoS Lab x DataFun

会場: 北京市海淀区中関村東路8号、東勝ビル、タワーA、4階401号室



トピック 1: 自動運転モデル​​のトレーニングにおける Alluxio のアプリケーションと展開


講演要旨

Huixi Intelligence は、2023 年に自動運転アルゴリズム トレーニング用のファイル キャッシュを NAS から Alluxio に切り替える予定です。 Alluxio をベースとしたキャッシュ システムは、研究開発を長年悩ませてきた問題、つまり同時データ アクセスにおける重大な遅延、繰り返しのデータ ダウンロード、繰り返しのデータによるスペースの無駄、ストレージの手動管理による非効率性と高い運用リスクを解決します。容量が増加し、データ システムの可用性が 10 倍向上し、コストが半分になり、使いやすさが大幅に向上するため、チームはアルゴリズム開発の効率を大幅に向上させることができます。

Huixi が Alluxio を選んだ理由は何ですか?

クラスタ間での自動運転にどのように使用しますか?

その機能とパフォーマンスを適切にテストおよび検証するにはどうすればよいでしょうか?

Alluxio の運用および保守能力を向上するにはどうすればよいですか?



トピック 2: Alluxio がハイブリッド クラウドで AI ストレージを高速化する方法


講演要旨

2023 年、Zhihu はモデル分散シナリオに初めて Alluxio を採用しました。これにより、クロスクラウド専用線の帯域幅の問題が解決されただけでなく、読み取りパフォーマンスが 2 ~ 3 倍向上しました。


Zhihu 内での大規模な言語モデルのトレーニングの開発に伴い、アルゴリズム チームはストレージに対するより高い要件も提示しました。Alluxio が提供する Fuse インターフェイスはビジネス側のニーズを十分に満たし、Zhihu 内で確固たる足場を急速に確立しました。開発は、最初のクラスターから複数のクラスターに発展しました。


Zhihu はハイブリッド クラウド アーキテクチャを採用しており、モデルのトレーニング中のデータ アクセスの遅延を軽減するために、Alluxio クラスターのセットが各パブリック クラウドにデプロイされ、オフライン HDFS クラスター上のトレーニング データを各パブリック クラウドに迅速に配布します。 GPU マシン上で、データの移行やコピーを行うことなく、トレーニング タスクの GPU 使用率が大幅に向上します。



トピック 3: Alluxio AI - 新世代の AI/ML トレーニング プラットフォーム データ I/O ソリューション


講演要旨

データ駆動型 AI の時代では、モデルのトレーニングと提供には、ストレージ内の大量のデータに効率的にアクセスすることが重要です。ただし、I/O の課題によりパフォーマンスが妨げられ、GPU の使用率が制限されることがよくあります。


この共有では、Alluxio 上に構築された高性能データ アクセス レイヤーが I/O の課題を克服し、GPU 使用率を大幅に向上させる方法を紹介します。豊富なユーザー ケースと実験データを通じて、Alluxio でデータセットとモデルをキャッシュする方法と、パフォーマンスを向上させる方法を学びます。



テーマ 4: 大規模モデルのトレーニングと推論における Moda コミュニティの技術的蓄積と利点


講演要旨

Tongyi Lab に所属する MoTa コミュニティは、LLM/MLLM/SD の方向に向けたトレーニングで多くの探求を行い、コミュニティ開発者が LLM をトレーニングして適用し、真に包括的な AI を実現できるようにするために、オープンソースを開発しました。トレーニング 推論フレームワーク SWIFT には、200 以上の LLM と 100 以上のオープンソース データセットのトレーニング機能があり、新しいモデルに簡単に拡張できます。 SD AIGC の方向性で、Moda Community と Tongyi Laboratory の基本ビジョン チームは、トレーニング フレームワーク Scepter を開発しました。このフレームワークは、LoRA と自社開発の SCEdit テクノロジーを使用して、Vincentian グラフ モデルの便利な微調整と推論を実現し、制御可能なものをサポートできます。生成する。


...
そして、サイトではさらにエキサイティングなコンテンツがあなたを待っています

……



イベントの議題

14:00-14:05 司会者がショーを開きます

14:05-14:45 Alluxio AI 新世代 AI/ML トレーニング プラットフォーム データ I/O ソリューション

14:45-15:25 Alluxio がハイブリッド クラウド下で AI ストレージを加速する方法

15:25-15:40 ティーブレイク

15:40-16:20 自動運転モデル​​トレーニングにおける Alluxio の応用と展開

16:20-17:00 大規模モデルのトレーニングと推論における Moda コミュニティの技術的蓄積と利点

17:00-17:10 技術交流&終了



QRコードを認識する

今すぐサインアップして参加してください


インタラクティブなギフト

このイベントに参加する

イベント参加者全員に記念品をプレゼント

同時に、アンケートに答えたり、豪華なプレゼントを抽選したりするアクティビティも開催されます。


連絡先

ご質問がある場合は、記事の最後にあるアシスタントのQRコードをスキャンして、お問い合わせください〜




アルクシオ

Alluxio は、分析と AI 用の高性能データ プラットフォームの世界有数のプロバイダーであり、エンタープライズ AI 製品の価値実現を加速し、インフラストラクチャの投資収益率を最大化します。 Alluxio データ プラットフォームはコンピューティング システムとストレージ システムの間に位置し、データ ワークフローのあらゆる段階でデータ プラットフォーム上のワークロードの統一されたビューを提供します。このプラットフォームは、データがどこに存在しても高性能のデータ アクセスを提供し、データ エンジニアリングを簡素化し、GPU 使用率を向上させ、クラウド コンピューティングとストレージのコストを削減します。企業は、専用ストレージを使用せずに、モデルのトレーニングとモデルの提供を大幅に加速し、既存のデータ レイク上に AI インフラストラクチャを構築できます。

Alluxio は、有力投資家の支援を受けて、世界のテクノロジー、インターネット、金融、通信企業にサービスを提供しており、現在、世界のインターネット企業トップ 10 社のうち 9 社が Alluxio を使用しています。詳細については、www.alluxio.com.cn をご覧ください。


Inno.EcoS Lab

Inno.EcoS Lab Taili Stationは、中関村東勝科技園区のインキュベーターブランドであり、Inno.EcoSハイテク企業成長エコシステムを核として設立された産業イノベーションインキュベーション加速ネットワークおよびイノベーションプラットフォームです。 Taili Station は、ライフサイエンス、デジタル経済、新エネルギー/新素材の 3 つの主要な産業分野に焦点を当て、10 年以上にわたって産業サービスに深く取り組んでおり、世界中からイノベーションと起業家リソースを集めています。準備段階、加速段階、成長段階にあるハイテク企業向けのさまざまなタイプと場所のオフィス スペースの選択肢と、革新的なエンタープライズ テクノロジー サービスをサポートします。


データファン

2017 年末に設立された DataFun は、データ インテリジェンス開発者へのサービスに重点を置いた垂直コミュニティです。 「何百万人ものデータインテリジェントな開発者を創出し、数万の企業のデジタルインテリジェント化を支援する」という使命のもと、6 年近くの継続的な運営を通じて、4,000 人を超えるその分野の専門家が経験などを共有するために招待されてきました。 100,000 人を超える専門家が 2,000 件のアプリケーション ケースの経験を蓄積し、ネットワーク全体の 500,000 人の正確な開発者に影響を与えました。 DataFun では、データ インテリジェンスの分野における権威ある専門家、最先端のテクノロジー、ベスト プラクティス、優れた開発者グループとつながることができます。 DataFun が開発者、企業、業界とともにデータ インテリジェンスの時代に突入できることを願っています。


[イベントの詳細を確認するにはアシスタントを追加してください]


【最近の人気】


【保電市場】

この記事は WeChat 公開アカウント - Alluxio (Alluxio_China) から共有されたものです。
侵害がある場合は、削除について [email protected] までご連絡ください。
この記事は「OSC ソース作成計画」に参加していますので、読んでいる方もぜひ参加して共有してください。

《庆余年2》盗版资源被上传到 npm,导致 npmmirror 不得已暂停 unpkg 服务 周鸿祎:留给谷歌的时间不多了,建议把所有的产品都开源 请教各位,此处的 time.sleep(6) 起到了什么作用? Linus “吃狗粮”最积极! 新款 iPad Pro 使用了 12GB 内存颗粒,但却声称是 8GB 内存 人民网评办公软件套娃式收费:积极解“套”,才有未来 Flutter 3.22 和 Dart 3.4 发布 Vue3 开发新范式,不用`ref/reactive`,不用`ref.value` MySQL 8.4 LTS 中文手册发布:助力您掌握数据库管理新境界 通义千问 GPT-4 级主力模型降价 97%,1 块钱 200 万 tokens
{{o.name}}
{{m.name}}

おすすめ

転載: my.oschina.net/u/5904778/blog/11054234