最近、大規模モデルがプログラミング、コード生成、自動テスト、その他の分野でますます強力な機能を発揮するにつれて、考えさせられる質問が浮上しています。「最終的に大規模モデルはプログラマーの仕事に取って代わるのでしょうか?」
世の中には絶対に安全な仕事など存在せず、機械が人間に取って代わるのも時間の問題だと信じている人もいます。 GitHub Copilot、ChatGPTから国産のTongyi Lingmaまで、さまざまな代替ツールが次々と登場しています。 AIはますます多くのことを行うようになり、人間のできることはますます少なくなります。 Baidu CEO の Robin Li 氏はかつて、将来的には基本的に「プログラマー」などの職業はなくなるだろうと述べました。なぜなら、誰もが話せる限り、誰もがプログラマーになる能力を持っているからです。
しかし、別の見方をする人もいます。 「下級プログラマーは消え、クリエイティブなプログラマーはビッグになるだろう。」 「プログラミングはやはり基礎であり、学ぶ必要がある。プログラムを理解できなければ、いくらクリエイティブであっても役に立たない。」 彼らはそう信じている。 」 360 CEO の周宏儀氏は、プログラマーに対する熱意は 10 年以内に衰えることはないと考えています。将来的には誰もがコンピューターを使用し、誰もがプログラマーになりますが、コンピューターを使用してさまざまな人々が作成する製品はまったく異なります。AI 時代にはコンピューターの専門家やプログラマーがさらに必要とされており、彼らはあらゆる分野で最も発言力があるかもしれません。人生の。 。
では、実際の状況はどうなっているのでしょうか?大規模モデル技術はどのような仕事に取って代わることができるのでしょうか?また、それはプログラマーのキャリアにどのような影響を与えるのでしょうか?普通のプログラマとして、変化にどのように適応すべきでしょうか?
第 12 回 [オープンソース トーク] では、iFlytek AI Engineering Institute のエージェント研究責任者である Yang Yanbo 氏、PingCAP AI Lab チームのデータ サイエンティストである Sun Yishen 氏、Infra のエンジニアである Ma Gong 氏を招き、今後何が起こるかについて話し合います。大規模モデルの開発 未来のテクノロジー職場をどのように形成するか?
ゲストを共有する:
ヤン・ヤンボ
iFlytek AI Engineering Institute のエージェント研究責任者であり、シニア R&D エンジニアであり、オープンソースを愛し、大規模モデル微調整プラットフォーム (Maas) とエージェント関連技術の研究を担当しています。
スン・イーシェン
PingCAP AI Lab データ サイエンティスト。ChatGPT の衝撃的なリリース以来、LLM アプリケーション開発とマルチエージェントおよびその他のアプリケーションの方向性の探求に重点を置き、TiDB Bot や LinguFlow などのアプリケーションを開発し、AutoGen コミュニティの開発に参加してきました。 。
ホスト:
馬の労働者
Nordicのインフラエンジニア、公開アカウント「Swedish Horseman」のマネージャー。 「オープンソーストーク」のレギュラーゲスト。
01現在の大型モデルはどの段階まで発展しているのですか?代替できる仕事は何ですか?
Ma Gong:これまでに大型モデルはどの程度まで開発されましたか?プログラマーの交代はどこまで進んでいますか?すでに好調な製品は何ですか?何か教えてもらえますか?
Yang Yanbo:今日私たちが話しているテーマは、大規模モデルがプログラマーに取って代わられるかどうかということです。まず、プログラマーの定義を見てみましょう。ウィキペディアによると、プログラマーは当初は純粋なソフトウェア開発者を指していたとのことですが、現在ではプログラマーがソフトウェア開発者のみを指すものではなくなり、プログラマーの仕事がコードを書くことに限定されなくなったことは明らかです。スクリプト作成やソフトウェアテストなどの仕事は、現在徐々に置き換えられる可能性があります。現在、翻訳、ドキュメントの並べ替え、データの注釈などの一部の単純なシナリオでは、一部のエージェント フレームワークで大規模なモデルを使用する方が、比較的簡単に大規模なモデルに置き換えることができます。
Sun Yishen: ChatGPT が登場したとき、これは本当に驚くべきもので、以前のいくつかの AI アプリケーションにとっては次元削減の打撃でした。しかし、誰もが経験すると、明るい点もありますが、多くの欠点もあることに気づくでしょう。プログラマーの場合、実際に運用環境で使用する必要がある場合、私はその上限ではなく、平均レベル、つまり収益がどこにあるのかを確認します。これがサービスの品質を保証することに焦点を当てているからです。
今見てみると、テキスト フィールドで比較的初歩的なことしか実行できません。たとえば、要約や読解には優れていますが、非常に高度なテキスト関係を実際に実行したい場合は、それほど得意ではないか、精度がそれほど高くありません。
プログラマーの分野を見ても、実は似たようなことが言えます。いくつかの基本的なタスクを実行できます。しかし、高度な仕事には、理論上、いわゆる論理的推論能力がありません。なぜ論理的な推論能力があるように見えるかというと、言語を学習する過程において、学習した文章が十分なものである限り、自然に何らかの論理が含まれているからです。実はこのこと自体を理解していません。非常に複雑なもの、または非常に新しいものの開発を実際に要求した場合、基本的にはそれを行うことはできません。
Ma Gong:はい、Copilot がいくつかのコードを提供してくれました。非常に便利で便利ですが、それでも自分で読まなければなりません。そうしないと、コードを入力すると大惨事になります。しかし、上司が私を解雇した場合、彼は副操縦士のコードを自分で調べなければなりません。私にそれを見るように頼んだ方がよいと思います。
高度なことはできないとおっしゃいましたが、プログラマーの日常業務の中で高度なことはどれくらいあるのでしょうか?おそらく私たちの仕事の 99% は低レベルのものです。どう思いますか?
Yang Yanbo:大きなモデル自体には、基本的なダイアログや独自のページ上のいくつかの機能など、いくつかのアトミックな機能が含まれています。これらは、大規模モデルの効果を体験できる比較的簡単な使用方法です。
より複雑なタスクの場合は、通常、大規模なモデル API を使用して、クライアント上で、またはプログラムでより高度なアプリケーションを実行します。私たちが今話している大規模モデルは、独自のアトミック機能の開発だけでなく、今年最も人気のあるプログラミング パラダイム、つまりエージェント パラダイムでもあります。この作品も大型モデルの開発の一環です。将来的には、複雑なタスクはインテリジェント エージェントの概念によってさらに解決される可能性があります。これが私の見解です。
馬公:このパラダイムシフトとは一体何でしょうか?将来的には、プログラマーがコードを作成し、テストし、適用し、本番環境にデプロイする必要がなくなるということですか、それとも...?
ヤン・ヤンボ:例を挙げましょう。現実の世界では、プロジェクトを開発する際には、プロジェクト リーダー、プロジェクト マネージャー、開発とテスト、運用と保守の展開、その他のさまざまな役割が存在し、協力してプロジェクトを軌道に乗せることがよくあります。大きなモデルがリリースされたら、その大きなモデルを使用してこれらの役割を果たし、プロジェクトのさまざまな目標を達成し、一緒にプロジェクトを完了することができます。これが最近みんなが取り組んでいるインテリジェントエージェントプラットフォームです。実際、プログラミングのような比較的特殊な環境では、複数の役割を使用してコーディングを調整することが非常に有望です。
02 人間のプログラマーは今後も必要ですか?
Ma Gong:つまり、あなたが言っているのは、大規模モデルはプログラマーに取って代わるだけでなく、IT チーム全体を殺すことになるということです。つまり、将来的にはプロダクト マネージャーがエージェントと直接やり取りするようになるため、人は必要なくなるということです。または企業です。
ヤン・ヤンボ氏:私の見解はもっと過激かもしれません。おそらく次のようなものでしょう。もちろん、これらの役職を置き換えた後、いくつかの新しい役職が確実に作成されます。
馬公:なんと恐ろしい光景でしょう。
Sun Yishen:そうです。今日のテーマは、最終的に置き換えられるかどうかについて議論しているため、最終的に置き換えられるかどうかを判断するのは困難です。それには期限を追加する必要があります。
私の経験から言えば、ヤンボが言ったように、エージェントにチームを形成させる方が問題解決プロセスをより適切に抽象化できます。このレベルに抽象化のレイヤーも追加しました - 自分のタスクをどのように実行するか?タスクにはタスクの実行方法をサポートする対応する SOP があり、さまざまな SOP にはワークフローの完全なセットがあるため、このグループを使用してさまざまな役割を組み合わせてこれを実行できます。
しかし、これら 2 つの抽象化レベルを完了した後でも、実際の制作作業のニーズを満たすのはまだ困難でした。たとえば、データ分析作業を依頼すると、実際の操作では大量のトークンを入力する可能性があり、このプロセス中にコンテキストの交換や相互作用も非常に頻繁に行われる可能性があります。実際には10万以上を超えています。
この場合、最終的にタスクを完了できる可能性は実際には非常に小さいです。なぜなら、プロセスのあらゆる側面にエラーが発生する可能性があり、最終的には掛け算の原理だからです。乗算が完了した後でも、全体としての成功率は依然としてかなり低いです。
なぜなら、誰かが論文を書くとき、その人は間違いなくその最高のハイライトを見せてくれるからです。ただし、このハイライトを 100 回繰り返した場合、90% がこのようになるかどうかはわかりません。実際、私はついにそれを使用しました。コンテキストが十分に長い場合、またはロジックが十分に複雑な場合、PM だけで通信するのは非常に困難です。
PM が生成されたすべてのコードをレビューする能力を持っている場合、彼は実際にはプログラマーと同等ではないでしょうか?基本的にPMには非常に複雑なプロジェクトをレビューする能力はないと思いますし、インプットとアウトプットを見ただけでは正確に把握することさえできないかもしれません。
馬公:あなたの言った現象は一時的な現象で、2、3 年後には全く状況が変わってくるのでしょうか?たとえば、先ほどおっしゃった 100K コンテキストですが、将来的には 10 MB コンテキストしかなくなるかもしれません。あるいは、複雑さが増し、作業がスムーズでなくなった場合は、別のプログラマーを追加することで問題を解決できます。しかし、以前は 100 人のプログラマーが必要だったのに比べ、現在は 1 人追加するだけで、99% のプログラマーを置き換えることに相当しますか?
Sun Yishen: Ultraman によると、chatGPT5 の後にさらなる飛躍があるとのことなので、これを予測するのはまだ非常に困難です。しかし、現在の Transformer モデルに基づくと、率直に言って、依然として確率に基づいており、前の状態に基づいて次の状態を予測するマルコフ意思決定プロセスが好まれています。この点が根本的に変わらない限り、あるいは人間が自らの認知科学を完全に理解していないのであれば、少なくともここ数年はプログラマーの交代は起こらないだろう。
現在、コンテキストが増加した後の大きなモデルの品質と、コンテキストのサイズをどのように拡張するかに誰もが注目しています。ただし、100K200K を超えるレベルでは、その精度は現在 50% 未満になる可能性があります。この場合、ブレークスルーはそれほど速くない可能性があります。
今年の前半、私は AutoGen にグループを作成して、人々と順番にチャットできるように依頼しようとしましたが、それはできませんでした。今、あなたはグループ全体のワークフローがニーズを満たさなければならないだけでなく、ビジネス全体のSOPも業務上のニーズを満たさなければならないと言いましたが、そのステップ全体を組み合わせると、少なくともそれは非常に貧弱だと思います。
Ma Gong:分散データベースの構築に対する要件が高すぎるためでしょうか?プログラマーの要件が非常に低い医療情報管理システムを作成し、そのシステムを医療アプリケーションに適用した場合、その効果は許容できるでしょうか?
Sun Yishen:同じような問題が、異なる分野でも比較的似ていると思います。 LLM はアシストとしては確かに OK ですが、本当に自動運転させるとなると、これは絶対に OK ではありません。プログラマー以外にもう一つ重要な点があります。それは企業倫理の問題、あるいは企業責任の問題を誰が負うのかということです。
医療業界では、この分野で画像認識CTがよく使われていることは誰もが知っています。実際、AIは映画を見ながらある程度の結論を導き出すことができますが、最終的には医師がハンコを押して署名する必要があります。プログラマーも同様です。 PMはこのタスクをAIに引き渡すことができますが、最終的にはやはり署名する人が必要です。 PM がこれに署名する可能性は低いですが、最終的にはプログラマがこれに署名する必要があり、プログラマは結果を確認する必要があります。チェックしない場合、上司がサインすれば商業的責任を負わなければなりません。
Ma Gong:これは非常に興味深い点です。大型モデルは責任を負うことができません。
03 最も危険な体位は何ですか?
ヤン・ヤンボ氏:自動運転の例には同意しません。実際、多くの都市では現在、いくつかのバス路線が試験的に導入されており、実際の例では無人急送が行われていますが、実際の人間に取って代わられるまでには時間がかかります。ただし、プログラマーという職業についても同様で、いくつかの単純なシナリオから始めて、徐々により複雑なシナリオに置き換えられます。
たとえば、当社には単純で反復的なコード開発が発生しやすい仕事がいくつかあり、これを行うためにインターンを採用していましたが、大規模なモデルが登場した後、大規模なモデルに依存するいくつかのエージェント テクノロジーの使用を検討しました。このタイプの作業では人件費が大幅に削減されます。
馬公:先ほど話した知的エージェントとは何ですか? chatGPTとの違いは何ですか?
Yang Yanbo:インテリジェント エージェントの概念は、大型モデルが登場する前から存在していました。英語名は Agent です。エージェントは中国語でエージェントと呼ばれます。これは、何かを完了するときに、自分で行う必要はないかもしれませんが、それを支援するツールまたは物理的な人が必要であることを意味します。さて、このエージェントはモデルを調整するだけではありません。大規模なモデルと対話する方法や、この分野でいくつかの外部ツールを呼び出す方法を知っています。 。これが知性の概念です。これも本質的に大規模なモデルですが、大規模なモデルに基づいており、特定の分野でのタスク計画や知識がカプセル化されており、実際のユーザーに近いものと同等です。
Ma Gong:私はこのように理解しています。以前 Ctrip に電話したとき、カスタマー サービスにその旨を伝え、チケットを予約してもらう必要がありました。現在、この顧客サービスは LLM に変更される可能性があります。私にとって、彼は知的なエージェントです。
Sun Yishen:はい、コントローラーまたはロボットと考えることができます。主に行うことは、まず特定の入力を受け入れて環境を認識できるようになり、次に入力された情報を通じて自ら特定の決定を下し、最後に環境を変えるためのいくつかのアクションを出力することです。
04 交代した場合はどうすればよいですか?
Ma Gong:質問させてください。もし私たちプログラマーが本当に入れ替わったら、その出口は何でしょうか?先ほどヤン坊さんは新たな雇用が生まれると言いましたが、その新たな雇用とは何でしょうか?これにどのように備えるべきでしょうか?
ヤン・ヤンボ:私たちはもともと何のために AI を発明したのでしょうか?私たち人間を解放し、効率を向上させるために。したがって、大規模モデルの機能境界がますます大きくなり、より多くのことを実行できるようになると、より注意を払う必要があるのは、大規模モデルが代わりに実行することの品質と、出力が適切かどうかです。倫理的ではない場合、より良い出力を生成するにはどうすればよいでしょうか?たとえば、大規模モデルのコンテンツ セキュリティの分野では、いくつかの新しいポジションが創設されました。
もう一つの立場は、大型モデルをより高度に活用するにはどうすればよいかということです。たとえば、エージェントの開発は新しい立場です。初心者でも大規模なモデルを使用できるようにエージェントを開発するにはどうすればよいでしょうか?そういうポジションはこれからどんどん増えていくと思いますし、それぞれの分野でエージェントも違うかもしれませんし、皆さんの開発手法も少しずつ変わってきていると思います。
Ma Gong:まず、一般のプログラマーがどのようにしてインテリジェント エージェントを開発する能力を身につけることができるのでしょうか?そうなると、私はその種の知的なエージェントのちょっとしたアシスタントになって、エージェントが書いたものをレビューすることしかできません。つまり、今は私のアシスタントですが、数年後には私がそのアシスタントになるということです。私にとってはあまりエキサイティングな旅とは思えません。
Sun Yishen: Yanbo は、基本的な能力の一部を大型モデルで置き換えても構わないと先ほど言いました。実際、それは依然としてあなたのアシスタントであり、雑用や価値が低く付加価値の低いタスクを手伝ってくれます。プログラマーとしては、「stcの入力を受け取ってプログラムを出力する」という単純なことは不可能です。多くの作業が進めば進むほど、それがビジネスの方向に向かう可能性が高くなります。そうすると、別の分野にいる場合でも、その分野の知識に基づいて多くのことを行う必要があるかもしれません。
CSもシステムアーキテクチャは常に進化しています。新しいものであればあるほど、大型機種はそれほど能力が高くないと考えられます。本質的には、まだ既存の知識を要約しているだけだからです。既存の知識に基づいて創造する場合、その創造性は非常に予測不可能になります。場合によっては、ひらめきによって役立つ情報が得られることもありますが、ほとんどの場合はそうではありません。
さらに、物理法則の理解は実際には存在しません。私が非常に複雑な BI シナリオを実行している場合、または CAE ソフトウェアを開発している人で、微積分すら理解できない場合、AI もそれを理解できません。どの分野でも専門的な知識は本当にたくさんあると感じます。
Ma Gong:わかります。私がプログラマーで、自分のキャリアの安全を確保したい場合は、リーダーにできるだけ新しい言語を使用するように依頼する必要があります。言語が出てくるとすぐに使ってしまいます。 LLM 役に立つほど十分なテキストがまだ読み込まれていません。ははは。
さらにライブ コンテンツについては、コードをスキャンしてリプレイをご覧ください↓↓↓
[オープンソーストーク]
OSCHINA ビデオ アカウントのチャット コラム [Open Source Talk] には、毎号技術的なトピックがあり、3 人か 5 人の専門家が座ってオープンソースについて意見を表明し、チャットします。業界の最新フロンティア、最もホットな技術トピック、最も興味深いオープンソース プロジェクト、最も鋭いイデオロギーの交換をお届けします。新しいアイデアや良いプロジェクトがあり、それを同僚と共有したい場合は、フォーラムはいつでもオープンしていますので、ご連絡ください。