Autor: Jiang Wei, Gong Yang, Zhou Tao, Wang Bin
Antecedentes do Desenvolvimento
Lingjian foi fundada em 2015 e está sediada em Xangai. Ela estabeleceu mais de 20 filiais em todo o país. Possui 100 direitos autorais de software, 91 marcas registradas e 35 patentes de invenção. e instituições de estética médica. Fornecem soluções integradas de operação e gerenciamento.
LeadHealth possui certificação dupla ISO / IEC27001 nacional e internacional, certificação de nível 3 do Ministério de Segurança Pública e certificação de seguro geral de nível 3 do Ministério da Indústria e Tecnologia da Informação. de aumentar receitas, evitar riscos, reduzir despesas e aumentar a eficiência do ciclo fechado de negócios saudáveis.
Lingjian inova o SaaS + e Dental Software fornece às instituições odontológicas gerenciamento de loja/rede única, registros médicos eletrônicos, gerenciamento de relacionamento com clientes, gerenciamento de compra, venda e estoque, marketing inteligente, análise de business intelligence de BI, integração de imagens e outros serviços de software SaaS cobrindo todo o processo de negócios de odontologia instituições; e Dental Dental Mall se conecta a mais de 1.000 marcas de consumíveis nacionais e estrangeiras bem conhecidas nas camadas superiores da cadeia industrial, seleciona cuidadosamente mais de 20.000 produtos de consumo e fornece serviços completos de compra de consumíveis para instituições odontológicas; baseado em "diagnóstico preciso, ortodontia precisa e monitoramento preciso". Concept é uma nova geração de provedor de serviços de soluções ortodônticas invisíveis. Ela lançou várias séries de produtos, como ortodontia para adultos Yuejian e ortodontia infantil Yueya.
Como instituição odontológica líder no setor, a LeadHealth sempre busca a excelência em tecnologia e serviços. Lingjian fornece algoritmos ortodônticos para clínicas odontológicas Durante as consultas diárias, os dentistas tiram fotos do estado dos dentes bucais dos consumidores. Por meio do algoritmo, eles podem dar sugestões de diagnóstico e tratamento correspondentes para melhorar a eficiência dos dentistas.
Recursos da plataforma e pontos problemáticos do negócio
O horário de funcionamento das clínicas odontológicas é relativamente fixo, geralmente das 8h30 às 18h. Nos feriados fica mais movimentado, e o tempo é estendido para um mês, e você pode ver altos e baixos óbvios.
No início, a Linkage Information comprou uma onda de máquinas GPU na nuvem para implantação de algoritmos e para fornecer serviços externos. No entanto, encontrou muitos problemas durante o uso, principalmente os seguintes:
- Baixa utilização de recursos e desperdício de custos: A máquina é mantida mensalmente e não há tráfego comercial fora do horário de trabalho. Considerando possíveis picos de negócios, várias máquinas GPU são retidas, portanto a taxa de utilização não é alta fora do horário de pico. períodos. A utilização global de recursos é mantida em torno de 5%.
- Resposta lenta dos negócios durante períodos de pico: Capacidade insuficiente de lidar com tráfego repentino que exceda o esperado levará a um aumento na carga de serviço e a um tempo de resposta de solicitação mais longo, o que afeta diretamente a experiência do usuário dos clientes finais. na fila por 10 minutos.
- Recursos insuficientes de monitoramento e solução de problemas: O algoritmo ortodôntico continua a iterar Durante o processo de implantação iterativo, as solicitações podem ocasionalmente congelar e erros de programa podem ocorrer. Muitas vezes, é necessário que o terminal use a loja para fornecer feedback, o que reduz a eficiência do algoritmo de otimização ativo.
Além disso, as ações frequentes de operação e manutenção e a construção contínua da plataforma também trazem muito trabalho diário aos alunos de operação e manutenção, além de aumentar os fatores de instabilidade do sistema. Além disso, a tecnologia GPU se desenvolveu rapidamente nos últimos anos, liderando o Jian. Os estudantes de tecnologia também precisam continuar a investir muita energia nesta área. Para os problemas acima, os estudantes da Lingjian Technology começaram a buscar soluções melhores e mais eficientes na nuvem.
solução
A equipe técnica da Leadtech tem procurado melhores soluções, na esperança de melhorar os custos, a experiência de serviço e a eficiência de operação e manutenção. Depois de comparar vários produtos em nuvem do Alibaba Cloud, eles finalmente se concentraram na computação funcional.
Alibaba Cloud Function Compute é um serviço de computação totalmente gerenciado e orientado a eventos. Através do Function Compute, os clientes não precisam gerenciar infraestrutura, como servidores, mas apenas escrever código e carregá-lo. Function Compute preparará recursos de computação, executará código de maneira flexível e confiável e fornecerá consulta de log, monitoramento de desempenho, alarme e outras funções.
Além de suportar o poder de computação tradicional da CPU, a Function Computing também oferece suporte ao poder de computação da GPU. Ele adota o conceito de computação sem servidor e fornece um recurso de computação da GPU alocado sob demanda para resolver efetivamente o baixo desempenho causado pelo uso original de longo prazo. Pontos problemáticos da GPU, como utilização de recursos, altos custos de uso e recursos de baixa elasticidade. Fornece aos clientes serviços de computação GPU mais convenientes e eficientes, transportando efetivamente cargas de trabalho aceleradas, como inferência de modelo de IA, treinamento de modelo de IA, produção acelerada de áudio e vídeo, aceleração de gráficos e imagens, etc.
O diagrama da arquitetura de recursos da GPU de computação de funções é o seguinte:
A GPU de computação funcional usa tecnologia de virtualização para obter forte isolamento de poder de computação, memória de vídeo e falhas, e é 100% compatível com aplicativos nativos. A Function Computing garante o fornecimento rápido de poder de computação por meio de um pool de recursos de dois níveis. A plataforma de pool de recursos GPU da Function Computing o mantém, e os clientes só precisam usá-lo de acordo com a quantidade e não precisam pagar por recursos ociosos.
O modelo de solicitação de recurso GPU de computação de função é o seguinte:
Depois que a função de GPU for implantada, os clientes poderão abrir a instância de GPU reservada configurando a política de escalonamento automático da instância de GPU reservada para fornecer os recursos de infraestrutura necessários para cenários de aplicativos de inferência em tempo real. A plataforma de computação funcional reservará o HPA da instância de GPU com base nos indicadores de escala configurados pelo cliente. As solicitações do cliente serão priorizadas e alocadas à instância de GPU reservada para serviços de inferência. A plataforma bloqueia completamente as inicializações a frio e o negócio se mantém baixo. -resposta de latência. Além disso, a plataforma integra sistemas observáveis, de registro, de monitoramento, de alarme e outros para simplificar a eficiência da solução de problemas e o trabalho diário de operação e manutenção.
Finalmente, após uma série de verificações pela equipe técnica da Leadgen, o diagrama final da arquitetura do Function Compute é o seguinte:
O diagrama de arquitetura é muito simples e o processo de negócios é o seguinte:
-
O cliente transforma o algoritmo ortodôntico em uma imagem padrão e a coloca no Alibaba Cloud Image Warehouse ACR;
-
Quando há uma solicitação de chamada ortodôntica no front-end e a instância precisa ser inicializada, o FC conclui a inicialização da instância puxando a imagem no ACR e nos recursos GPU subjacentes e conclui a implantação do aplicativo de algoritmo;
-
A solicitação de cálculo ortodôntico é enviada para a aplicação GPU recém-criada para cálculo e o resultado é retornado.
Resultados e Vantagens
Ao colocar a carga de computação da GPU no Function Compute, a equipe técnica da Leadgen resolveu com sucesso os problemas de uso encontrados anteriormente:
- Otimização de custos: o método de cobrança pré-pago do Function Compute realmente cobra com base no tempo real de processamento da solicitação, minimizando o custo de retenção de recursos. Em comparação com a retenção mensal anterior de recursos da GPU, o custo do Function Compute foi reduzido em cerca de 90%. , conseguindo um bom efeito de redução de custos.
- Experiência de negócios durante períodos de pico: por meio da extração antecipada de recursos durante períodos de pico de negócios e da elasticidade sob demanda de recursos repentinos, os recursos de back-end podem ser fornecidos em tempo hábil. Após a implantação da computação funcional, a loja não terá mais longas filas. , o que melhora muito a eficiência da loja.
- Operação e manutenção eficientes: Por meio do sistema integrado de monitoramento, registro e alarme do Function Compute, você pode prestar atenção à operação geral do negócio em tempo real. Ao configurar alarmes de monitoramento, quando ocorre uma anormalidade, você pode receber push de exceção. notificações o mais rápido possível e com a ajuda de um sistema de log completo e uma equipe técnica profissional em computação funcional localiza e resolve problemas do programa em tempo hábil.
Além disso, o uso da implantação da computação funcional dá a todo o sistema uma boa escalabilidade. Para o crescimento futuro dos negócios, não há necessidade de se preocupar com as principais questões de planejamento de recursos da GPU.
Resumo e perspectivas
Ao migrar aplicativos principais para a plataforma de computação funcional, a equipe técnica da Leadgene não apenas enfrentou com sucesso os desafios trazidos pelo crescimento dos negócios, mas também otimizou significativamente a estrutura de custos, ao mesmo tempo em que acelerou os processos de desenvolvimento e operação e manutenção, alcançando agilidade e eficiência sem precedentes.
Olhando para o futuro, a equipa técnica da Leadgen continuará a aprofundar a sua cooperação com a Function Compute. À medida que o território de negócios da empresa continua a se expandir, prevê-se que mais cenários de aplicação se beneficiarão da escalabilidade elástica, do baixo custo e da alta eficiência da computação funcional. A equipe técnica da Leadgen planeja dar prioridade ao uso da arquitetura de computação funcional ao implantar novos negócios, a fim de reduzir ainda mais o tempo de lançamento do produto no mercado, melhorar a experiência do usuário e continuar a reduzir os custos operacionais.
A Alibaba Cloud Function Computing também espera trabalhar com a LeadHealth para explorar soluções de serviços médicos mais eficientes e inteligentes para ajudar na transformação digital do setor médico e de saúde. Acredita-se que com a estreita cooperação entre as duas partes, a LeadHealth pode servir melhor os pacientes e médicos e promover a indústria a avançar numa direção mais inteligente e eficiente.
Clique aqui para experimentar o cálculo da função.
A equipe de IA da Microsoft na China fez as malas e foi para os Estados Unidos, envolvendo centenas de pessoas. Quanta receita um projeto de código aberto desconhecido pode trazer? A Huawei anunciou oficialmente que a posição da Universidade de Ciência e Tecnologia de Yu Chengdong foi ajustada. abriu oficialmente o acesso à rede externa Os fraudadores usaram o TeamViewer para transferir 3,98 milhões! O que os fornecedores de desktop remoto devem fazer? A primeira biblioteca de visualização front-end e fundador do conhecido projeto de código aberto ECharts do Baidu - um ex-funcionário de uma conhecida empresa de código aberto que "foi para o mar" deu a notícia: Depois de ser desafiado por seus subordinados, o técnico O líder ficou furioso e rude e demitiu a funcionária grávida. A OpenAI considerou permitir que a IA gerasse conteúdo pornográfico. A Microsoft relatou à The Rust Foundation doou 1 milhão de dólares americanos. ?