Open Source Daily | 大規模なモデルの価格競争における推論の最適化、Mistral AI は独自の Lu Xun を使用して米国市場をターゲットにしています。

OSCHINA 編集部が作成し、毎日更新されるオープンソースの日刊紙へようこそ。

#2024.5.29

今日のハイライト

Angular v18が正式リリースされました

「OpenHarmony Device Unified Interconnect Technology Standard」をリリース

この標準では、統一オブジェクトモデルに加えて、アクセスおよび制御インターフェイス、画面投影、ファイル共有、コンプライアンステスト仕様、その他の標準を含む一連の他の標準も定義されていると報告されています。アクセスおよび制御インターフェイス仕様では、デバイスの検出と配布、登録とログイン、セキュリティ認証、管理制御などの具体的なプロセスとインターフェイスをシステムアーキテクチャの観点から詳細に定義します。スクリーンキャストとファイル共有は、ファイル、ビデオ、その他のデータの送信、暗号化、およびマルチメディアデバイス間での共有のためのインターフェイスを定義します。コンプライアンステスト仕様は、標準仕様へのコンプライアンスと一貫性を確保するために、各仕様の技術要件と指標テストの方法と手順を厳密に定義します。

GreenplumのGitHubリポジトリ「404」

TiDB 8.1 LTS がリリースされました

TiDB 8.1 LTS は、特にマルチテナントアプリケーションや SaaS タイプのユーザーシナリオ向けに、一連の革新的な機能を通じて大規模クラスターの安定性と運用および保守機能を強化します。

オープンソースの Llama3v が新たにリリース: GPT4-V と競合、価格は 500 ドル

GPT-4V に相当する Llama 3-V が登場しました。これは、わずか 500 ドルで構築された Llama3 をベースにしたマルチモーダルモデルです。

ほぼすべての指標において、Llama 3-V は、GPT-4V、Gemini Ultra、Claude Opus などの 100 倍規模のクローズドソースモデルと同等のパフォーマンスを示します。唯一の例外は MMMU (マルチモーダルメモリタスク) で、Llama 3-V はわずかに劣っています。

Llama3-V のアーキテクチャは、Llama3 8B と siglip-so400m によって駆動されるビジュアルモデルと言語モデルを組み合わせています。

YC が投資した ChatGPT のオープンソースコードバージョン

Bloop はコードに重点を置いた ChatGPT とみなされ、2021 年の夏に YC からの投資を受けました。これは Rust ベースの AI コード検索エンジンで、MacOS/Linux/Windows をサポートしており、現在 GitHub に 8.6K のスターが付いています。

Bloop の機能は次のとおりです。

1. コードを解釈する
2. コンテキストに基づいてコードを作成する
3. 自然言語を使用してコードを検索して特定する
4. 問題を修正する
5. 多言語に対応
する 6. コードの検出と重複除去

Bloop は現在 10 以上のプログラミング言語をサポートし、ローカルリポジトリと GitHub リポジトリの同期をサポートしています。

GitHub アドレス: https://github.com/BloopAI/bloop

今日の観察

社会観察

オープンソース音声 TTS の天井を突破

この ChatTTS は、対話シナリオ用に特別に設計された音声生成モデルで、主に LLM アシスタントの対話タスク、対話音声、およびビデオの紹介に使用されます。中国語と英語の混合テキストをサポートして音声を合成するだけでなく、さらに重要なことに、音色のパフォーマンスが非常に優れているため、真と偽の区別が困難になります。

GitHub：github.com/2noise/ChatTTS

- Weibo GitHubDaily

2024年、AI彼氏・彼女は爆発的な成長を迎える

CB Insights は 6 つのトレンドを挙げています:
1. AI コンパニオンスタートアップ Character AI は、モバイル利用において ChatGPT に僅差で遅れています。
——AI コンパニオンは、2 番目に重要なコンシューマ AI アプリケーションシナリオになる可能性があります。
2. Character AI の 400 万人のユーザーのうち半数以上が 24 歳未満です。
——Z 世代は AI コンパニオンの受け入れが非常に高く、大規模言語モデル (LLM) の機能が向上するにつれて、この受け入れはさらに強まるでしょう。
3. スマートフォンの時代において、Z 世代は友人と顔を合わせて過ごす時間が減少しています
4. 孤独を感じる人が増えています
5. 配偶者やパートナーのいないアメリカの成人が増えています
6. 若者の性生活は悪化するますます少なくなる

-Weibo Baoyuxp

楊力坤の畳み込みニューラルネットワークは信念を強化する標識です

AI の貢献に関して、ヤン氏と他の 3 人の巨人の 20 年間の粘り強さがなければ、その後の AI 革命はどこから来たでしょうか?その「長い夜」の期間中、ヤンの畳み込みニューラルネットワークは信念を強化する光の灯でした。その後、FB の Llama シリーズモデルとそのオープンソースコンセプトも、この AI の波に参加したいと考えていた多くの人々に恩恵をもたらしました。馬一龍はこの点で楊立坤と比較したいのだろうか？

-ベイエリアのウェイボー・チェン・シャオミン

大型モデルの値下げの背景にある国産大型モデルの競争論理の変化

大規模なモデル API の価格引き下げは、業界の混乱に警鐘を鳴らしています。パラメータ、コンピューティング能力、価格を単に積み重ねることは、業界の健全な発展にとって最適な解決策ではありません。将来的には差別化のみが解決策を見つけることができます。すべての業界と同様、混乱から混乱への移行は、しばしば残酷な価格競争によって特徴付けられます。現在、大型モデルの熱狂的な「100モデルの戦い」を経て、価格競争が始まり、同質競争の影響が徐々に現れ始めています。

-私たち-メディア劉光

大規模モデルの価格競争下での推論の最適化

大規模なモデルアーキテクチャのレベルでは、MLA 作業や Dense-MoE、あるいは Google MoD、Medusa、SplitWise などの作業であっても、システムの観点から推論の計算能力の最適化を検討し、逆算して最適な最適化を見つけます。残念なことに、ほとんどの草の根チームは、何をコピーするか、または漏洩したデータを使用してリストを作成することしかわかっておらず、日々 GPT-N を超えようとしています。

- WeChat ザートボット

メディアウォッチ

人工知能は今、どれほど「人間に似ている」のでしょうか？

スタンフォード大学コンピューターサイエンス学部のリー・フェイフェイ教授も、最近タイム誌に、一般知性への道においては「感情」、つまり主観的な経験を持つ能力が重要なステップであるとする記事を発表した。現在の大型モデルは人間のように「感じる」ことはなく、足の指がまったくないにもかかわらず「足の指が痛い」と言うことができ、シリコンチップ上にエンコードされた単なる数学モデルにすぎません。

「私たちはまだ感覚を持ったAIを実現しておらず、より大きな言語モデルも実現できません。AIシステムでこの現象を再現するには、システム内で生成される具体的な生き物に感覚がどのように存在するのかをより深く理解する必要があります」と彼女は述べた。

- 新華社通信

Mistral AI はオープンソースモデルで米国市場をターゲットにしています

ヨーロッパの生成人工知能ツール開発会社であるフランスのミストラル AI は、米国市場に照準を合わせています。同社は今月、元フォースクエア最高収益責任者のマージョリー・ジャニウィッツ氏を初代米国ゼネラルマネージャーとして雇用したとブルームバーグが火曜日（5月28日）に報じた。

Janiewicz氏はレポートの中で、Mistral AIは、OpenAIやGoogleなどの大手テクノロジー企業が提供する人工知能モデルやサービスの代替品を求める企業からの需要の高まりを利用することを目指していると述べた。

同社の米国市場への進出は勢いを増していると伝えられている。このスタートアップは、より多くの従業員を雇用する予定であり、AI ソリューションにより多くの選択肢と柔軟性を求める企業の間ですでに注目を集めています。

ミストラルのオープンソースアプローチ (基盤となるコードは公開されており、カスタマイズ可能) は、競合他社が提供するクローズドシステムに代わる、より安全で汎用性の高い代替手段とみなされています。

-バイアスニュース

より効率的なスケーリングテクノロジ: MoE アーキテクチャが大手モデルメーカーに好まれるのはなぜですか?

2023 年、1 年間の乱暴な運用を経て、大型モデルはすぐにボトルネックに遭遇しました。スケーリング則 (パラメータの数が増えるとモデルのパフォーマンスも向上することを意味します) の存在により、大規模モデルの能力には上限がないように見えますが、大規模モデルのトレーニングに使用されるデータと計算能力は非常に大きくなります。限定。このような背景から、業界はより効率的なモデルアーキテクチャを模索する必要があり、MoE (Mixture of Experts、ハイブリッドエキスパートモデル) アーキテクチャの出現は業界に希望を与えています。

- 21世紀ビジネスヘラルド

シリコンバレーには魯迅がいる！ AI王ルカン氏の暴走は止まらず、マスク氏からOpenAIまで全員が批判されている

Llama はもともと LeCun 氏率いる FAIR によって開発されましたが、現在は技術と製品開発に重点を置く GenAI 部門に引き継がれています。一方、FAIR は、次の目標を達成できる新しい AI アーキテクチャと手法の開発という長期的な目標に重点を置いています。人間レベルの知能。

ヤン・ルカン氏は物議を醸すような発言をするのが好きだと思われている人も多いが、より重要な背景は将来のAIの発展から生じる現在の問題だ。人工知能の分野で最もよく知られた人物の 1 人であるヤン・ルカン氏は、この物議をかもしている分野について一歩踏み出て明確に説明する義務を負っています。

LeCun 氏は、AGI の実装は製品設計の問題や技術開発の問題ではなく、大部分が科学の問題であると述べました。

この発言が本当であれば、AGI を探究する道には明らかに彼のような「魯迅」がもっと必要だということになります。

-ピンワン

男性モデルとしてデフォルトで設定されている「成功者」にジェンダーバイアスはあるのでしょうか？

Qiu Xipeng 教授は、過去 2 年間の大型モデルの進歩をデータを通じて確認しました。大規模なモデルのトレーニングでは値の調整が重要な項目であり、人間が割り当てた値がターゲットとなります。これにはジェンダーの問題も含まれます。しかし、単語分析によって形成されたワードクラウドは、AIGC (生成人工知能) の固有の印象も示しています。たとえば、男性を表す言葉は世界、発見、人生、単純さなどに焦点を当てます。夫、挑戦、母親などの言葉。

Qiu Xipeng 氏は、「実際の研究では、コーパスの性別修正には非常に多額の投資が必要です。モデルの調整を実行する必要があり、人間の嗜好モデリングや価値の調整などの方法を通じて、よりポジティブなコンテンツが生成されるようにモデルの出力が調整されます。」と述べています。

- 済寧ニュースネットワーク

今日のおすすめ

オープンソースプロジェクト

vuejs/言語ツール

https://github.com/vuejs/言語-ツール

Volar は、Vue 用の VS Code プラグインであり、Vue 用の公式 IDE/TS サポートツールです。強調表示、構文プロンプトなどの Vetur 関連機能の統合に加えて、いくつかの独自の機能も含まれています。

日々のブログ

数百億枚の大規模画像を広告シナリオに応用

この記事では、検索レコメンデーションアイテムを使用して、テイクアウト検索広告の供給不足を補い、トラフィックの収益化効率を向上させます。テイクアウト検索・レコメンデーションビジネスのマルチチャネルかつリアルタイムの課題を解決するため、テイクアウトマルチシナリオ異種大画像の進化ルートと異種大画像オンラインモデリング技術を提案します。関連する結果は、CIKM2023 会議で論文として発表されました。共同機械学習プラットフォームは、大規模なグラフトレーニングとオンライン推論エンジン GraphET を構築し、100 億近くのエッジと複雑なグラフ構造を備えた複数のビジネス実装のニーズに対応します。

イベントコメント

世界初のオープンソース超並列データベース- Greenplum の GitHub リポジトリが突然「404」を受け取りました Broadcom はそのクローズドソースに対して料金を請求する予定ですか?

有名なオープンソース MPP データベース Greenplum は、ソースコードウェアハウスのアクセス許可を変更して「読み取り専用」のみをサポートし、元のブランチ、タグ、PR、問題、その他の情報をすべてクリアしました。バナー通知は、リポジトリが 5.25 にアーカイブステータスに入ったことを示します。

レビュー

オープンソース MPP データベースとしてよく知られている Greenplum のソースコードリポジトリは読み取り専用となり、関連情報が消去されました。これは、データベースに依存するオープンソースコミュニティにとって大きな打撃となる可能性があります。コミュニティのメンバーや貢献者はプロジェクトの将来について不安を感じ、Greenplum の将来の方向性と維持についての疑問を引き起こす可能性があります。

Greenplum Database を使用しているユーザーおよび企業にとって、この変更はビジネスの継続性とテクノロジーの選択に影響を与える可能性があります。 Greenplum への変更は、他のオープンソースプロジェクト、特に Greenplum に依存しているプロジェクトや同じ会社によって維持されているプロジェクトに波及効果をもたらす可能性があります。

BroadcomによるVMware買収の影響が本当に大きいのであれば、これもオープンソースプロジェクトが商業化に向かう例となり、オープンソースコミュニティに不満や反発を引き起こす可能性がある。この事件はまた、オープンソースプロジェクトと商業的利益の間の緊張を浮き彫りにしました。 Greenplum がクローズドソースになった場合、オープンソース文化に悪影響を及ぼし、コミュニティの信頼とオープンソースプロジェクトへの参加が減少する可能性があります。

調査によると、AI エンジニアは他のエンジニアよりもはるかに多くの収入を得ています

Levels.fyiが発表した2024年第1四半期のAIエンジニア給与調査データでは、 AIを専門とするソフトウェアエンジニアと非AIソフトウェアエンジニアの給与に大きな差があることが指摘されています。

レビュー

AI エンジニアの給与の高さは、AI の専門スキルに対する市場の強い需要を反映しています。 AI テクノロジーが開発され、応用され続けるにつれて、企業はこれらのスキルを持つ人材に対して積極的にプレミアムを支払うようになります。 AI分野に参入する企業が増えるにつれ、AIエンジニアの獲得競争は激化しています。優秀な人材を惹きつけて維持するために、企業はより競争力のある報酬を提供する必要があります。

エントリーレベルからシニアレベルに至るまで、AI エンジニアは非 AI エンジニアよりも高い報酬を得ており、キャリア開発のあらゆる段階で AI スキルが高く評価されていることを示しています。 AI人材市場が成熟するにつれて、企業は給与を市場標準に近づけ、AI職と非AI職の給与格差を縮めるために採用戦略や報酬戦略を調整する可能性がある。

給与が高いと、より多くの学生や専門家が AI 分野の学習やキャリア開発に専念するようになる可能性があり、その結果、教育やキャリア計画の方向性に影響を与える可能性があります。企業は、AI 人材の重要性を認識し、競争力を維持するために戦略計画においてこれらの人材をどのように引き付け、育成し、維持するかを検討する必要があります。

OpenAIの元セキュリティ責任者がライバルのAnthropicに加わる

今月初め、OpenAI の元セキュリティディレクターで Superalignment チームの責任者である Jan Leike 氏が OpenAI からの辞任を発表し、同社のセキュリティ問題を公に批判しました。今回、ライケ氏は、OpenAIの競合企業であるAnthropicに加わり、新しい「スーパーアラインメント」チームを率いることになると投稿した。

レビュー

OpenAIのセキュリティディレクターおよび超連携チームのリーダーとして、ライク氏の参加はAnthropicのAIセキュリティ分野の研究開発を強化し、それによってAIセキュリティ分野での競争が激化する可能性がある。一方、ライク氏はOpenAIのセキュリティ問題を公に批判した後、競合他社に加わることを選択したが、この問題は他の従業員の士気や忠誠心に影響を与える可能性がある。

この動きはOpenAIの評判に一定の影響を与える可能性がある。同時に、OpenAIは頭脳流出後もAI分野でのリーダーシップを維持する方法を検討する必要がある。

さらに、ライク氏の行動や発言により、AIの倫理とガバナンスの問題に対する世間の注目が高まる可能性がある。 AI テクノロジーが発展するにつれて、その安全性と倫理性の確保はますます重要になります。 Anthropic での Leike の新しい役割は、AI の安全性と倫理における同社のイノベーションを推進する可能性が高く、これは業界全体にとって明るい兆しです。

この事件は、AI業界における人材争奪戦の激しさ、そして競争上の優位性を獲得するための企業間の戦略調整を示しているのかもしれない。

オープンソースの声

メディアの意見

AIは「OS」がないのでお金を払っても使いにくい

現在のテクノロジーと価格のブームにもかかわらず、AI 機能をうまく活用できる企業は限られているのが現状です。現段階では、「価格は高いが市場性がない」大型モデルの実装は明らかな問題点です。

-ギーク パーク

マスク氏の最新インタビュー: 人工知能の価値を心配している; AI 時代に働く必要はない、誰もが高収入を手に入れている?

行き過ぎたポリティカル・コレクトネスの傾向は、人工知能の将来について私を心配させます。この傾向は非常に危険だと思います。

xAI の目標は、たとえ不人気な真実であっても、絶対的な真実を追求することです。

-金融 シンクタンク

AI アートはなぜいつも悪く見えるのでしょうか?

しかし、時間が経つにつれて、AI アートワークの背後に空洞があることに気づき始める人が増えています。 AIの絵画ではフェルメールの静かな生活の繊細な描写を見ることはできませんし、ピカソの純化と写実から抽象への流れを見ることもできません。

-アイファナー

ユーザーの視点

世界初のオープンソース超並列データベース- Greenplum の GitHub リポジトリが突然「404」を受け取りました Broadcom はそのクローズドソースに対して料金を請求する予定ですか?

視点 1: ブロードコムは本当に業界でトップクラスの存在です。当時、運営資金がクアルコムを本当に食い尽くしていたら、今のモバイル市場はどうなっていたか想像できません。

視点 2: ブロードコムのボスであるチェン氏は金融資本型の M&A に取り組んでいます。 VMware はオープンソースですが、なぜわざわざこのオープンソースデータベース製品を商用化する必要があるのでしょうか?

視点 3: VMware はオープンソースではなく、個人ユーザーのみが無料で利用できます

視点 4: いつか Spring フレームワークが企業向けの課金に統合されたら、とても楽しいでしょう。

意見 5: はは、このデータベースを使う勇気はない

視点6：家主が変わったらすぐに家を取り壊す

Tencent App StoreとMicrosoft Storeが提携、Windowsでモバイルアプリケーションを直接実行可能に

視点 1: Amazon: 誰かを置き換えたい場合は、そう言ってください

観点 2: WSA の使用経験があまりにもひどすぎる。

視点3：TencentブランドのAndroidエミュレータ

JavaScript、Python、Java が開発者にとって依然として第一の選択肢である理由

視点: 1: エコロジーが決定的な役割を果たす

視点２：言葉が使いにくくてはエコロジーは成り立ちません。

意見 3: 「さらに、Java がトップにランクされているのは、その歴史的な強さだけではありません。Java は 6 か月ごとに主要な機能とパフォーマンスのアップデートが行われ、マイナーな改善、バグ修正、セキュリティのアップデートが行われます。」しかし、多くの人は特にそう思っていません。 Java8 が提供する新機能に関心があり、多くの企業でさえ Java8 が千年紀に入っています。

【Java ormフレームワーク比較】その13、新qdbcフレームワーク比較

意見: 1: mybatis-mp は非常に使いやすく、使用する価値のある新しい ORM フレームワークです。

視点 2: それぞれに独自の長所と短所があります。mybatis に基づいた二次開発は、Solon を優先するなど、多くの適応を節約できます。

観点 3: Mybatis の XML は非常に臭くて長いです。もう 2024 年ですが、依然として結果のマッピングを手動で設定する必要があります。

視点4：実は設定する必要はない

観点5: mybatis-mpはORMとxmlが可能、テーブル接続は小規模なケース

観点6：jooqの追加を推奨

意見7：調べてみると重く、生成するものがたくさん必要な気がする。

- -終わり - -

最後に、QR コードをスキャンして「オープンソース中国 APP」をダウンロードし、プログラマーやマニアからの大量の技術レポートや共有情報を読んでください。