O modelo grande de código aberto mais poderoso, Llama 3, é lançado no Gitee AI

Introdução: Em 18 de abril, a Meta lançou dois modelos de código aberto Llama 3 8B e Llama 3 70B para uso gratuito por desenvolvedores externos. Este lançamento não é apenas uma vitrine de inovação tecnológica, mas também uma manifestação do espírito do código aberto, indicando que um novo capítulo nas aplicações de IA está prestes a começar.

Desta vez, a Meta abriu o código-fonte de dois modelos, Llama 3 8B e Llama 3 70B, com duas versões: pré-treinamento e ajuste fino de instrução, respectivamente.

Link da plataforma

Acesse o link abaixo e entre na plataforma para vivenciar (código convite: llama3):

https://ai.gitee.com/hf-models/meta-llama/Meta-Llama-3-8B-Instruct

Máximo de 400 bilhões de parâmetros

Meta Llama 3 apresenta uma série de inovações técnicas, incluindo suporte para janelas de contexto mais longas, vários tamanhos de modelo e desempenho aprimorado. Além disso, o novo modelo teve um desempenho de alto nível em vários benchmarks do setor, especialmente suas melhorias no raciocínio lógico e no acompanhamento de instruções de programação, tornando-o único entre modelos similares de código aberto.

Os destaques e recursos do Llama 3 são os seguintes:

  • Com base no treinamento com mais de 15T tokens, o tamanho é mais de 7 vezes maior que o conjunto de dados Llama 2;

  • A eficiência do treinamento é 3 vezes maior que o Llama 2;

  • Suporta texto longo de 8K e o tokenizer aprimorado possui um vocabulário de tokens de 128K para obter melhor desempenho;

  • Desempenho de última geração em uma ampla gama de benchmarks importantes;

  • Melhorar as habilidades de raciocínio e codificação;

  • Há um grande avanço na segurança. As novas ferramentas de confiança e segurança com Llama Guard 2, Code Shield e CyberSec Eval 2 também podem ter melhor “desempenho de rejeição de erros” do que Llama 2.

Sustentabilidade e envolvimento da comunidade

Meta Llama 3 é mais do que apenas um produto tecnológico, também representa o compromisso da Meta com o desenvolvimento contínuo. Ao tornar este modelo de código aberto, a Meta espera estimular o potencial inovador da comunidade global de desenvolvedores e promover conjuntamente o avanço da tecnologia de inteligência artificial. Esta medida não só promove a popularização da tecnologia, mas também garante que o feedback da comunidade seja totalmente considerado durante o processo de desenvolvimento.

Pensando no futuro em segurança e ética

Ao desenvolver o Meta Llama 3, a Meta prestou atenção especial à segurança e à responsabilidade ética. Ferramentas recém-introduzidas, como Llama Guard 2 e CyberSec Eval 2, fornecem aos desenvolvedores mais recursos para usar e implantar esses modelos com responsabilidade. Isto demonstra a liderança da Meta no setor em garantir a implantação segura e confiável de IA.

O lançamento do Meta Llama 3 não é apenas um avanço tecnológico, mas também uma manifestação do espírito de inovação aberta. Ela não apenas fornece aos desenvolvedores novas ferramentas poderosas, mas também estabelece novos padrões para o desenvolvimento futuro do ecossistema global de IA. Na onda da IA, a Meta demonstrou o poder da cooperação e da inovação através do Llama 3 e espera que esta plataforma inspire aplicações mais inovadoras de inteligência artificial.

Acho que você gosta

Origin www.oschina.net/news/288516
Recomendado
Clasificación