Introduction : Le 18 avril, Meta a publié deux modèles open source Llama 3 8B et Llama 3 70B pour une utilisation gratuite par les développeurs externes. Cette version n'est pas seulement une vitrine de l'innovation technologique, mais aussi une manifestation de l'esprit de l'open source, indiquant qu'un nouveau chapitre dans les applications d'IA est sur le point de commencer.
Cette fois, Meta a open source deux modèles, Llama 3 8B et Llama 3 70B, avec deux versions : pré-formation et mise au point des instructions respectivement.
Lien plateforme
Visitez le lien ci-dessous et entrez sur la plateforme pour en faire l'expérience (code d'invitation : lama3) :
https://ai.gitee.com/hf-models/meta-llama/Meta-Llama-3-8B-Instruct
Maximum 400 milliards de paramètres
Meta Llama 3 introduit un certain nombre d'innovations techniques, notamment la prise en charge de fenêtres contextuelles plus longues, de plusieurs tailles de modèles et des performances améliorées. En outre, le nouveau modèle a obtenu des performances au plus haut niveau dans plusieurs tests de référence du secteur, en particulier ses améliorations en matière de raisonnement logique et de suivi des instructions de programmation, ce qui le rend unique parmi les modèles open source similaires.
Les points forts et les caractéristiques de Llama 3 sont les suivants :
-
Sur la base d'un entraînement avec plus de 15 T de jetons, la taille est plus de 7 fois supérieure à celle de l'ensemble de données Llama 2 ;
-
L'efficacité de l'entraînement est 3 fois supérieure à celle de Llama 2 ;
-
Prend en charge le texte long de 8 Ko et le tokenizer amélioré dispose d'un vocabulaire de 128 Ko pour obtenir de meilleures performances ;
-
Performances de pointe sur un large éventail de critères importants ;
-
Améliorer les compétences de raisonnement et de codage ;
-
Il y a une avancée majeure en matière de sécurité. Les nouveaux outils de confiance et de sécurité avec Llama Guard 2, Code Shield et CyberSec Eval 2 peuvent également avoir de meilleures « performances de rejet d'erreurs » que Llama 2.
Durabilité et engagement communautaire
Meta Llama 3 est plus qu'un simple produit technologique, il représente également l'engagement de Meta en faveur d'un développement continu. En rendant ce modèle open source, Meta espère stimuler le potentiel d'innovation de la communauté mondiale des développeurs et promouvoir conjointement l'avancement de la technologie de l'intelligence artificielle. Cette décision favorise non seulement la vulgarisation de la technologie, mais garantit également que les commentaires de la communauté sont pleinement pris en compte lors du processus de développement.
Réflexion prospective sur la sécurité et l'éthique
En développant Meta Llama 3, Meta a accordé une attention particulière à la sécurité et à la responsabilité éthique. Des outils récemment introduits tels que Llama Guard 2 et CyberSec Eval 2 fournissent aux développeurs davantage de ressources pour utiliser et déployer ces modèles de manière responsable. Cela démontre le leadership de Meta dans l’industrie pour garantir un déploiement sûr et fiable de l’IA.
La sortie de Meta Llama 3 n'est pas seulement une avancée technologique, mais aussi une manifestation de l'esprit d'innovation ouverte. Il fournit non seulement aux développeurs de nouveaux outils puissants, mais établit également de nouvelles normes pour le développement futur de l’écosystème mondial de l’IA. Dans la vague de l'IA, Meta a démontré le pouvoir de la coopération et de l'innovation grâce à Llama 3, et espère que cette plate-forme inspirera des applications plus innovantes de l'intelligence artificielle.