5 principais desafios e soluções para implementação de grandes modelos em nível empresarial

Clique para ver a análise completa do evento: https://my.oschina.net/u/4489239/blog/11105657

Clique para acessar a prévia da Conferência Shenzhen Yuanchuang em 18 de maio: https://www.oschina.net/event/2332004

Em 20 de abril, a 102ª Conferência Yuanchuang foi realizada com sucesso em Wuhan. Esta edição convida especialistas em inteligência artificial do Instituto de Pesquisa de Inteligência Artificial de Wuhan, Huawei, MindSpore, JD Cloud e Gitee AI para fazer palestras sobre o tema [Competição de Grandes Modelos e Otimização de Desempenho]. Yuan Lijiang, diretor de produto da JD Cloud, fez um discurso sobre "Inspirando o Futuro com Inteligência - Yanxi Large Model Platform". Yuan Lijiang apresentou que existem cinco desafios principais na implementação de grandes modelos em nível empresarial: tempo real, explicabilidade, segurança e controlabilidade, tomada de decisões complexas e profissionalismo. e em um ambiente incerto e em mudança dinâmica.
 
Yuan Lijiang introduziu que existem duas maneiras principais de implementar modelos grandes. Uma é o modelo Copilot. A IA de relacionamento é liderada apenas por humanos. Em alguns cenários, a IA completa o trabalho. processamento, Vincent Tu, etc. Na verdade, as empresas precisam liberar mão de obra tanto quanto possível. O outro é o modo Agente, mais adequado para cenários complexos em empresas. Neste modo, o ser humano se posiciona em uma perspectiva de dimensão superior e atua como “mentor” ou “treinador” da inteligência artificial, estabelecendo metas e supervisionando os resultados. . O modelo grande pode exercer sua capacidade de raciocínio, usar ferramentas e desculpas apropriadas e, finalmente, fornecer feedback de resultados correspondente.
 
As principais tecnologias utilizadas para a implementação de grandes modelos nas empresas também mudaram. O pré-treinamento inicial tem o custo mais elevado e o enorme investimento posterior, o custo do modo SFT diminuiu, mas o efeito de implementação não foi bom; modo RAG aprimorado do banco de dados vetorial, mas o efeito foi melhorado. No final, ele só pode ser limitado a cenários de perguntas e respostas de conhecimento, equipes técnicas proficientes prestam mais atenção ao modo Agente e podem obter suporte multicenário;
 
Nos negócios financeiros da JD.com, é difícil melhorar a capacidade de grandes modelos para resolver problemas práticos simplesmente contando com SFT ou LoRA de grandes modelos. Em vez disso, é baseado na tecnologia de agente para permitir que as máquinas usem ferramentas para resolver problemas de negócios. Especificamente, ele usa o Agente para entender os objetivos do usuário, desmontar cada subtarefa e selecionar ferramentas apropriadas para cada subtarefa. Essas ferramentas são algumas interfaces do negócio original da JD.com e, finalmente, combinadas com grandes recursos de modelo para fornecer feedback. . Desta forma, as respostas às perguntas complexas de alguns usuários serão mais precisas.
 
Atualmente, a plataforma de modelo completo da JD Yanxi construiu uma matriz de produtos multicamadas. A camada mais baixa é o suporte de recursos, incluindo recursos de computação, recursos de armazenamento, rede de alta velocidade e agendamento de recursos. Na camada de recursos do modelo, ele fornece recursos como gerenciamento e treinamento de modelos, processamento de conjuntos de dados e avaliação e implantação de modelos. Acima da camada de recursos do modelo está a construção de agentes inteligentes, com foco na integração de diversas ferramentas. A camada superior é a camada de serviço de aplicação, que se adapta a vários cenários empresariais.
 
A plataforma de modelo grande da JD Yanxi tem 6 funções principais: colaboração de agendamento de recursos, que pode realizar gerenciamento e agendamento eficientes de recursos de computação, garantindo otimização de desempenho e controle de custos de desenvolvimento e gerenciamento de dados de grandes modelos, que fornece gerenciamento e suporte para treinamento de modelos grandes; Pré-treinamento, ajuste fino, aprendizagem por reforço, avaliação, etc. são realizados de forma eficiente. O treinamento, o treinamento e o ajuste fino de modelos por meio de grandes modelos permitem que as empresas tenham modelos personalizados para melhorar a precisão e a relevância da construção de agentes inteligentes; implantar agentes inteligentes, combinados com os sistemas de TI existentes da empresa para executar tarefas complexas, a conformidade de segurança garante que todos os aplicativos de modelos grandes cumpram os padrões de segurança e os requisitos legais e regulamentares. O mercado de aplicativos inteligentes fornece uma série de aplicativos de modelos grandes pré-construídos; que as empresas podem implantar diretamente ou fornecer plug-ins Acesso rápido ao sistema.
 
Digitalize o código QR para assistir à repetição do discurso "Inspirando o Futuro —— Yanxi Large Model Platform"⬇️
Estudantes do ensino médio criam sua própria linguagem de programação de código aberto como uma cerimônia de maioridade - comentários contundentes de internautas: Contando com a defesa, a Apple lançou o chip M4 RustDesk Os serviços domésticos foram suspensos devido a fraude desenfreada. No futuro, ele planeja produzir um jogo independente na plataforma Windows Taobao (taobao.com) Reiniciar o trabalho de otimização da versão web, destino dos programadores, Visual Studio Code 1.89 lança Java 17, a versão Java LTS mais comumente usada, Windows 10 tem um participação de mercado de 70%, o Windows 11 continua diminuindo Open Source Daily | Google apoia Hongmeng para assumir o controle do Rabbit R1 de código aberto; a ansiedade e as ambições da Microsoft encerraram a plataforma aberta;
{{o.nome}}
{{m.nome}}

Acho que você gosta

Origin my.oschina.net/u/4489239/blog/11105666
Recomendado
Clasificación