Face Wall Intelligence lance le grand modèle open source Eurux-8x22B - on peut l'appeler le « champion de la science »

Face Wall Intelligence a récemment publié le grand modèle open source Eurux-8x22B, comprenant Eurux-8x22B-NCA et Eurux-8x22B-KTO, axé sur les capacités de raisonnement.

L'introduction officielle disait :

Comparé au célèbre Llama3-70B, Eurux-8x22B a été publié plus tôt et a des performances globales similaires, en particulier des performances d'inférence plus fortes - rafraîchissant les performances d'inférence SOTA des grands modèles open source, et peut être appelé le « champion scientifique » parmi l'open source. grands modèles.

Eurux-8x22B a surpassé Llama3-70B dans les tests LeetCode (180 vraies questions de programmation LeetCode) et TheoremQA, et a surpassé le GPT-3.5-Turbo à source fermée dans les tests LeetCode.

Selon les rapports, le paramètre d'activation du modèle Eurux-8x22B est 39B, prend en charge le contexte 64k, est aligné sur le modèle Mixtral-8x22B et est formé sur l'ensemble de données aligné UltraInteract.

Le modèle Eurux-8x22B + l'ensemble de données d'alignement sont tous open source :

Je suppose que tu aimes

Origine www.oschina.net/news/291040
conseillé
Classement