Na distante era pré-histórica, os nossos antepassados iniciaram um diálogo com a natureza através da agricultura de corte e queima, e também anunciaram o nascimento das ferramentas como uma importante pedra angular do progresso da civilização humana.
As ferramentas, esta existência aparentemente simples mas de longo alcance, estão intimamente ligadas ao destino da humanidade desde o seu nascimento. Desde as primeiras ferramentas de pedra e paus de madeira até às últimas ferramentas de bronze e ferro, e agora até aos actuais produtos de alta tecnologia, cada evolução das ferramentas marca um salto na produtividade humana e promove o progresso da civilização social. Não são apenas uma extensão das mãos humanas, mas também a cristalização da sabedoria e uma arma para conquistar a natureza e transformar o mundo.
Ferramentas de IA: uma ferramenta poderosa para o rápido desenvolvimento empresarial
Olhando para o momento presente, a IA tornou-se uma estrela brilhante no mundo da tecnologia, a Internet e outros campos têm-na abraçado. As aplicações baseadas em IA estão a surgir como cogumelos depois da chuva. tornando-se cada vez mais popular. Quanto mais "inteligente" você se torna!
No entanto, para muitas indústrias tradicionais, a integração da IA nos negócios diários não é fácil. O limiar técnico é elevado e a integração do cenário ainda precisa de ser profundamente explorada. Portanto, eles estão mais ansiosos para obter ferramentas de IA que sejam fáceis de usar, eficientes e práticas.
Chen Xiaojian, gerente geral do departamento de produtos da Amazon Cloud Technology na Grande China
"Os três principais recursos da Amazon Cloud Technology na construção de um banco de dados cobrem cenários importantes, desde o treinamento básico do modelo até a construção generativa de aplicativos de IA, o que pode ajudar as empresas a lidar facilmente com dados multimodais massivos e melhorar os recursos básicos do modelo. Atualmente, a Amazon Cloud Technology está desenvolvendo Ajudar empresas de todos os tamanhos, em vários setores, a construir uma base de dados forte, garantindo ao mesmo tempo a segurança dos negócios e dos dados dos usuários, atribuindo o valor único dos dados a modelos básicos e aplicações generativas de IA, acelerando o crescimento dos negócios empresariais." Falando sobre IA. Combinando Com aplicativos corporativos, Chen Xiaojian, gerente geral do Departamento de Produtos de Tecnologia de Nuvem da Amazon na Grande China, deu essa interpretação.
Obviamente, além da base de dados, as empresas também precisam escolher ferramentas de IA apropriadas com base em seus próprios cenários de aplicação, a fim de aproveitar o poder da IA para promover o desenvolvimento de negócios. A Perplexity é um exemplo de empresa que cria valor único ao combinar pesquisa tradicional, dados de clientes e capacidades de inferência e transformação de texto de grandes modelos de linguagem. A empresa está construindo o primeiro mecanismo de resposta conversacional do mundo. Desde seu lançamento em dezembro de 2022, seu site e aplicativos móveis conquistaram rapidamente a preferência dos usuários, atingindo 10 milhões de usuários ativos mensais, atraindo 53 milhões somente em novembro. Este rápido crescimento é incomparável aos métodos tradicionais de marketing.
Três maneiras de lidar com diferentes cenários de aplicação
Chen Xiaojian disse: Ao explorar como integrar os próprios dados de uma empresa em aplicativos generativos de IA, descobrimos três métodos: geração aumentada de recuperação (RAG), ajuste fino e pré-treinamento contínuo, que pode combinar dados com grandes modelos de linguagem. para melhorar os resultados do negócio.
Na IA generativa, os resultados de alta qualidade dependem frequentemente de uma grande quantidade de informações contextuais. As empresas podem combinar as suas próprias bases de conhecimento (tais como bases de dados ou outros documentos de conhecimento) com IA generativa para fornecer capacidades auxiliares para grandes modelos de linguagem através de pesquisa ascendente e outros métodos. Essa abordagem é relativamente simples e muitas empresas já a utilizam para criar aplicativos. Esta é a Geração Aumentada de Recuperação (RAG).
As técnicas de ajuste fino envolvem treinamento adicional do modelo usando dados associados a uma tarefa alvo específica, com o objetivo de melhorar o desempenho do modelo na tarefa específica. A dificuldade de ajuste fino está entre o pré-treinamento e o RAG (geração aumentada de recuperação). É adequado para uma variedade de cenários, como compreensão de caracteres, análise de conteúdo de entrada e controle de formato de saída.
O pré-treinamento contínuo tem um limite alto e requer uma grande quantidade de dados. As empresas precisam inserir continuamente dados gerados nos negócios diários em grandes modelos de treinamento para se adaptarem às mudanças nos negócios. Em vez de construir um ambiente de treinamento do zero, o pré-treinamento contínuo é baseado em um grande modelo existente.
O produto Amazon Bedrock da Amazon Cloud Technology implementou três recursos principais que muitos clientes estão usando para treinar grandes modelos personalizados em seus ambientes de negócios. Focar em modelos significa focar nos resultados de negócios, e uma base sólida de dados é a chave para o sucesso. Portanto, a Amazon Cloud Technology tem um ponto de vista importante: sem dados e sem modelos.
A pedra angular das aplicações de IA: armazenamento de dados
Na era da IA, percebe-se que as soluções de armazenamento não devem apenas transportar dados massivos, mas também fornecer desempenho suficiente e ter custos controláveis. Devido à popularidade dos modelos multimodais, os tipos de dados variam significativamente em escala e formato, o que exige que tenhamos fortes capacidades de armazenamento de dados.
Chen Xiaojian disse que o Amazon S3 é o primeiro serviço de armazenamento de dados em nuvem lançado pela Amazon Cloud Technology. Ele evoluiu para uma plataforma que atende totalmente aos requisitos de armazenamento de dados para ajuste fino ou pré-treinamento de modelos básicos. O Amazon S3 armazena mais de 200 trilhões de objetos e processa mais de 100 milhões de solicitações por segundo. Ele também fornece controle refinado, recursos de auditoria de conformidade e recursos de gerenciamento do ciclo de vida para garantir a segurança dos dados e o uso legal. O Amazon S3 também é a escolha ideal para a construção de data lakes. Existem mais de 200.000 aplicativos de data lake na Amazon Cloud Technology.
O Amazon S3 pode oferecer suporte à análise de dados em grande escala de maneira eficiente e econômica e é adequado para vários cenários de aplicativos, como inteligência artificial, aprendizado de máquina e computação de alto desempenho. Na era da IA generativa, há uma demanda crescente por armazenamento de dados e desempenho de processamento. Para atender a essa demanda, a Amazon Cloud Technology também lançou o Amazon S3 Express One Zone, um novo serviço que permite acesso rápido abaixo de 10 milissegundos. Muitos clientes já implementaram este serviço em conjunto com seus negócios.
Na era da IA, a arquitetura sem servidor ajuda as empresas a crescer rapidamente
Em ambientes modernos de processamento de dados, os bancos de dados relacionais são apenas uma opção para recursos de recuperação de vetores. Com a aplicação generalizada de funções de pesquisa, vários tipos de bancos de dados, como bancos de dados relacionais, de valores-chave, de gráficos e de documentos, estão desempenhando um papel importante em seus respectivos campos. No entanto, quando se trata de recuperação de vetores, a introdução específica de um banco de dados de vetores inteiramente novo pode acarretar custos de aprendizagem, o custo de configuração de novos recursos e a complexidade da migração de dados.
Nas observações atuais, muitos clientes preferem integrar capacidades de recuperação de vetores em seus bancos de dados existentes, em vez de introduzir sistemas de banco de dados inteiramente novos. A vantagem disto é que são evitados custos adicionais de aprendizagem, custos de migração e possíveis taxas de licenciamento. Ao mesmo tempo, o armazenamento e o gerenciamento centralizados de dados ajudam a reduzir o tempo de resposta e a melhorar o desempenho.
Especialmente na era da GenAI (inteligência artificial gerativa), o rápido lançamento e a captura de mercado tornaram-se os objetivos principais de muitas empresas. Portanto, torna-se particularmente importante fornecer capacidades de recuperação de vetores para vários bancos de dados. Isto não só atende às necessidades de desempenho dos clientes, mas também garante o gerenciamento unificado e a recuperação eficiente de dados.
Além disso, com a necessidade crescente de desenvolvimento e implantação rápidos, as soluções de arquitetura serverless (sem servidor) são favorecidas por sua flexibilidade e economia. Para empresas que não possuem pessoal dedicado para operação e manutenção ou trabalho de DBA, a solução Serverless não requer previsão de necessidades futuras de desempenho ou realização de operações tediosas de operação e manutenção. Durante os períodos de pico dos negócios, ele pode se expandir automaticamente para atender à demanda e, quando os negócios estão ociosos, os recursos podem ser reciclados automaticamente para economizar custos.
Portanto, para os clientes no estágio atual, fornecer recursos de recuperação de vetores e recursos sem servidor para vários bancos de dados é a chave para atender às suas necessidades de rápido desenvolvimento e implantação. Isto pode não só melhorar a eficiência do processamento de dados, mas também reduzir os custos e a complexidade de operação e manutenção, dando às empresas uma vantagem no mercado ferozmente competitivo.
Em termos de implementação de aplicativos de IA, o Amazon Music utiliza tecnologia avançada para analisar as características dos usuários e das músicas e converte essas informações em vetores para melhorar a precisão das recomendações musicais. Ao usar o Amazon OpenSearch, a Amazon Music transformou com sucesso 100 milhões de músicas em vetores e as indexou para fornecer serviços de recomendação de música em tempo real para usuários em todo o mundo.
Atualmente, o Amazon Music mantém 1,05 bilhão de vetores no Amazon OpenSearch e tem capacidade de lidar com até 7.100 consultas por segundo, apoiando efetivamente a operação de seu sistema de recomendação.
A construção de IA generativa não é fácil, assemelha-se mais a uma estrutura de volante e requer um ciclo positivo para promover o seu desenvolvimento. Para conseguir isso, as empresas precisam aproveitar vários serviços em nuvem para construir uma base sólida de dados. Desta forma, as empresas podem combinar dados massivos com modelos subjacentes de forma eficiente e segura para criar aplicações generativas de IA com valor único que atendam às necessidades dos clientes finais e gerem mais dados.
À medida que essas aplicações entram em uso, elas geram novos dados, o que, por sua vez, melhora ainda mais a precisão do modelo. Através de ajuste fino ou pré-treinamento contínuo, os modelos podem se tornar mais inteligentes e mais profissionais do setor, proporcionando assim aos usuários uma melhor experiência. Este ciclo contínuo de mecanismo de feedback positivo trará poder contínuo à empresa e promoverá o sucesso contínuo de seus negócios.
Um programador nascido na década de 1990 desenvolveu um software de portabilidade de vídeo e faturou mais de 7 milhões em menos de um ano. O final foi muito punitivo!
Alunos do ensino médio criam sua própria linguagem de programação de código aberto como uma cerimônia de maioridade - comentários contundentes de internautas: Contando com
RustDesk devido a fraude desenfreada, serviço doméstico
Taobao (taobao.com) suspendeu serviços domésticos e reiniciou o trabalho de otimização de versão web
Java 17 é a versão Java LTS mais comumente usada
no mercado do Windows 10 Atingindo 70%, o Windows 11 continua a diminuir
Open Source Daily | Google apoia Hongmeng para assumir o controle de telefones Android de código aberto apoiados pela ansiedade e ambição da Microsoft; Electric desliga a plataforma aberta
Apple lança chip M4
Google exclui kernel universal do Android (ACK) Suporte para arquitetura RISC-V
Yunfeng renunciou ao Alibaba e planeja produzir jogos independentes para plataformas Windows no futuro
{{o.nome}}
{{m.nome}}