Cliquez pour voir la revue complète de l'événement : https://my.oschina.net/u/4489239/blog/11105657
Cliquez pour accéder à l'aperçu de la conférence Shenzhen Yuanchuang du 18 mai : https://www.oschina.net/event/2332004
Le 20 avril, la 102e Conférence de Yuanchuang s'est tenue avec succès à Wuhan. Ce numéro invite des experts en intelligence artificielle de l'Institut de recherche sur l'intelligence artificielle de Wuhan, Huawei, MindSpore, JD Cloud et Gitee AI à prononcer des discours sur le thème de [Concurrence de grands modèles et optimisation des performances].
Yuan Lijiang, directeur produit de JD Cloud, a prononcé un discours sur « Inspirer l'avenir avec l'intelligence - Yanxi Large Model Platform ». Yuan Lijiang a présenté cinq défis majeurs dans la mise en œuvre de grands modèles au niveau de l'entreprise : le temps réel, l'explicabilité, la sécurité et la contrôlabilité, la prise de décision complexe et le professionnalisme. La clé de la mise en œuvre est de savoir comment prendre les bonnes décisions en temps réel. et dans un environnement incertain et en évolution dynamique.

Yuan Lijiang a expliqué qu'il existe deux manières principales de mettre en œuvre de grands modèles : l'une est le modèle Copilot. L'IA ne sert que d'assistant dans certains scénarios, comme la génération de contenu textuel. traitement. , Vincent Tu, etc. En fait, les entreprises doivent libérer autant de main-d'œuvre que possible. L'autre mode est le mode Agent, plus adapté aux scénarios complexes dans les entreprises. Dans ce mode, les humains se situent dans une perspective de dimension supérieure et agissent comme « mentor » ou « coach » de l'intelligence artificielle, fixant des objectifs et supervisant les résultats. Le grand modèle peut exercer sa capacité de raisonnement, utiliser des outils et des excuses appropriés, et enfin donner un retour sur les résultats correspondants.
Les principales technologies utilisées pour la mise en œuvre de grands modèles dans les entreprises ont également changé. Le pré-entraînement initial a le coût le plus élevé et un investissement énorme. Plus tard, le coût du mode SFT a diminué, mais l'effet de mise en œuvre n'a pas été bon ; Le mode RAG a été amélioré par la base de données vectorielles, mais l'effet a été amélioré. En fin de compte, les équipes techniques compétentes accordent plus d'attention au mode Agent et peuvent prendre en charge plusieurs scénarios.
Dans le secteur financier de JD.com, il est difficile d'améliorer la capacité des grands modèles à résoudre des problèmes pratiques simplement en s'appuyant sur de grands modèles SFT ou LoRA. Au lieu de cela, il est basé sur la technologie Agent pour permettre aux machines d'utiliser des outils pour résoudre les problèmes commerciaux. Plus précisément, il utilise l'agent pour comprendre les objectifs de l'utilisateur, démonter chaque sous-tâche et sélectionner les outils appropriés pour chaque sous-tâche. Ces outils sont quelques interfaces de l'activité d'origine de JD.com, et enfin combinés avec des capacités de modèle étendu pour fournir des commentaires. . De cette manière, les réponses aux questions complexes de certains utilisateurs seront plus précises.
À l'heure actuelle, la plate-forme de modèles complets de JD Yanxi a construit une matrice de produits multicouche. La couche la plus basse est la prise en charge des ressources, notamment les ressources informatiques, les ressources de stockage, le réseau haut débit et la planification des ressources. Dans la couche de ressources du modèle, il fournit des fonctionnalités telles que la gestion et la formation des modèles, le traitement des ensembles de données, ainsi que l'évaluation et le déploiement des modèles. Au-dessus de la couche de ressources du modèle se trouve la construction d'agents intelligents, axés sur l'intégration de divers outils. La couche supérieure est la couche de services d'application, qui s'adapte à plusieurs scénarios d'entreprise.
La plate-forme de grands modèles de JD Yanxi comporte 6 fonctions principales : la collaboration en matière de planification des ressources, qui permet une gestion et une planification efficaces des ressources informatiques, garantissant l'optimisation des performances et le contrôle des coûts du développement et de la gestion des données des applications de grands modèles, qui assure la gestion et la prise en charge de la formation de grands modèles ; La pré-formation, le réglage fin, l'apprentissage par renforcement, l'évaluation, etc. sont effectués efficacement ; la formation, la formation et le réglage fin du modèle via de grands modèles permettent aux entreprises de disposer de modèles personnalisés pour améliorer la précision et la pertinence. déployer des agents intelligents, combinés avec les systèmes informatiques existants de l'entreprise pour effectuer des tâches complexes ; la conformité en matière de sécurité garantit que toutes les applications à grand modèle sont conformes aux normes de sécurité et aux exigences légales et réglementaires ; que les entreprises peuvent déployer directement ou fournir des plug-ins Accès rapide au système.
Scannez le code QR pour regarder la rediffusion du discours « Inspiring the Future——Yanxi Large Model Platform »⬇️

{{o.name}}
{{m.nom}}