Ha llegado la era del iPhone con IA generativa

El equipo de la comunidad de código abierto de China realizó su primera transmisión en vivo, contando la historia detrás de la comunidad de código abierto de China en nombre de compartir".

Desde automóviles autónomos que circulan por las bulliciosas calles urbanas hasta sistemas domésticos inteligentes que hacen la vida de las personas más cómoda y cómoda, desde diagnósticos precisos y tratamientos personalizados en el campo médico hasta la automatización y la inteligencia en la producción industrial, las huellas de la IA se han extendido por todo el mundo en cada rincón; de la sociedad.

Si una aplicación no está integrada con IA, parece indicar que se ha quedado "obsoleta". Sin embargo, la combinación de IA y aplicaciones no se produce de la noche a la mañana y todavía existe un "umbral" alto.

Amazon Cloud Technology cree que "ningún modelo se puede aplicar a todos los escenarios comerciales" y los usuarios deben seleccionar y seleccionar según sus necesidades durante el uso. En base a esto, Amazon Bedrock ofrece una serie de modelos básicos líderes para que los clientes elijan.

Anthropic construye un modelo Claude 3 más inteligente

Anthropic es una empresa de investigación y seguridad de inteligencia artificial dedicada a construir sistemas de inteligencia artificial confiables, explicables y controlables. Anthropic lanzó recientemente una nueva generación de modelos de la serie Claude 3. Entre ellos, el Claude 3 Opus más inteligente superó al GPT-4 de OpenAI y al Gemini Ultra de Google en las pruebas comparativas y tiene un gran potencial de aplicación.

En el campo de la inteligencia artificial generativa, Anthropic está construyendo modelos a través de chips Amazon Trainium y Amazon Inferentia, y ha comenzado a brindar a los clientes globales de Amazon Cloud Technology acceso a largo plazo a sus futuros modelos base en Amazon Bedrock. Al mismo tiempo, a medida que Amazon complete su inversión de 4 mil millones de dólares en Anthropic, la cooperación entre las dos partes se profundizará aún más.

Chen Xiaojian, director general del departamento de productos de Amazon Cloud Technology en la Gran China

Recientemente, Amazon Cloud Technology celebró una reunión de comunicación de medios de IA generativa en Beijing, centrándose en la capacidad del modelo Amazon Bedrock + Anthropic Claude 3 para capacitar a las empresas para crear aplicaciones de IA generativa.

Actualmente, la serie Claude 3 cuenta con tres modelos, entre ellos el Claude 3 Haiku, con capacidad de respuesta instantánea; el Claude 3 Sonnet, un equilibrio ideal entre habilidad y velocidad y el Claude 3 Opus, el modelo más inteligente diseñado para manejar situaciones de alta complejidad; tareas . Los dos primeros modelos ya están disponibles oficialmente en Amazon Bedrock y Opus lo estará pronto. Los usuarios pueden elegir la combinación que mejor se adapte a sus escenarios de aplicación según sus necesidades comerciales.

“La popularidad mundial de Anthropic no se produjo de la noche a la mañana. Claude 3 superó todos los modelos existentes en evaluaciones estándar, como preguntas de matemáticas, ejercicios de programación y razonamiento científico. Los usuarios pueden utilizar respuestas impulsadas por IA para automatizar tareas y garantizar una alta precisión, como en la optimización de procedimientos experimentales. en campos específicos de la industria manufacturera, o auditar informes financieros basados en datos contextuales, etc. Al mismo tiempo, se puede ver en una comparación que los precios de Sonnet y Haiku son mucho más baratos que los modelos inteligentes equivalentes en la industria. Lo que atrae a los clientes es una de las razones importantes". Hablando de las capacidades de Claude 3, Chen Xiaojian, director general del Departamento de Productos de Amazon Cloud Technology en la Gran China, lo afirmó plenamente.

Se entiende que Claude 3 actualmente tiene capacidades multimodales. Puede recibir entradas basadas en imágenes, sus capacidades son aproximadamente las mismas que las de otros modelos de vanguardia y su latencia es menor que la de otros modelos multimodales.

Frente a aplicaciones complejas a nivel empresarial, Claude 3 ha recibido una capacitación específica. Es muy bueno para comprender imágenes, cuadros, gráficos, ilustraciones técnicas y reconocimiento óptico de caracteres (OCR), por lo que necesita procesar una gran cantidad de imágenes. gráficos, informes y otros activos visuales Excelente rendimiento en casos de uso empresarial. En términos de velocidad, según los resultados de la evaluación relevante, el modelo Claude 3 es equivalente al modelo líder en términos de capacidades de entrada de imágenes, y la velocidad de Claude 3 Haiku es mejor que la de todos los modelos líderes con capacidades equivalentes.

Claude 3: modelos grandes eficientes y rápidos

Entonces, ¿Claude 3 es realmente tan poderoso?

Con este fin, Amazon Cloud Technology también realizó una serie de pruebas de campo en el evento y respondió a través del desempeño real del modelo Claude3 en Amazon Bedrock.

La primera es una prueba llamada "Aguja en un pajar (NIAH)", que consiste en insertar una frase de "El problema de los tres cuerpos" en un texto completo de "La tierra errante" para ver si el modelo grande puede reconocerse en un tiempo corto. . Examina principalmente la capacidad de recuperación precisa de Claude 3 en un contexto ultralargo de nivel 200K.

Aunque este trabajo parece simple, para realizarlo realmente se necesitarán muchas funciones lógicas complejas. En un instante, salieron los resultados de la prueba y Claude 3 reconoció con éxito la frase insertada "¡No respondas, no respondas, no respondas!". Incluso puede identificar limitaciones de la prueba en sí, como descubrir que una determinada oración "objetivo" fue obviamente agregada artificialmente más tarde al texto original.

Posteriormente, Amazon Cloud Technology también demostró pruebas como imitar el estilo del novelista Gu Long, continuar escribiendo novelas y la generación, análisis y optimización de código Claude 3 tuvo un rendimiento significativamente mejor que modelos similares y su valor práctico es muy alto.

Con base en las capacidades anteriores, Claude 3 puede identificar con precisión productos de comercio electrónico a través de imágenes, capturar con precisión detalles del producto según la visualización del modelo del producto y generar descripciones de producto más precisas. Ha sido ampliamente utilizado en el negocio de comercio electrónico de Amazon.

Cree aplicaciones más potentes con Amazon Bedrock

Con el potente Claude 3, ¿cómo podemos utilizarlo cómodamente?

Para simplificar el tedioso trabajo, Amazon Cloud Technology proporciona la función de base de conocimientos Knowledge Bases en Amazon Bedrock, que se convertirá en una base de conocimientos específica de la empresa. Aunque los modelos grandes son poderosos, deben combinarse con el conocimiento empresarial interno para integrarse en el negocio. Knowledge Bases es una de esas herramientas, que brinda soporte integral de alojamiento, simplifica el proceso para que los usuarios combinen datos privados con modelos grandes y crea fácilmente bases de conocimiento internas. Con la base de conocimientos de Amazon Bedrock, la generación de recuperación aumentada (RAG) se logra combinando información contextual y brinda respuestas más precisas y personalizadas. Toda la información recuperada va acompañada de citas para garantizar la transparencia y reducir malentendidos.

Al igual que las personas utilizan la ejecución de varios pasos para dividir tareas complejas, la función de Agentes lanzada por Amazon Bedrock también es muy buena para manejar tareas complejas de varios pasos. Esta característica permite a los clientes utilizar lenguaje natural para realizar tareas comerciales de varios pasos. La función del agente utiliza las capacidades de razonamiento del modelo subyacente para descomponer el problema y resolver el problema del usuario paso a paso. El agente utilizará la función de razonamiento para descomponer este requisito y ejecutarlo paso a paso. Los agentes pueden acceder a los sistemas empresariales, procesos, bases de conocimiento y algunos componentes básicos de la organización, y luego formular pasos lógicos para resolver problemas, determinar a qué API llamar y cuándo llamarlas, y garantizar que las transacciones se completen en el orden correcto.

Al mismo tiempo, cuando los usuarios utilizan modelos grandes, también deben garantizar la seguridad de la aplicación. Con este fin, Amazon Cloud Technology propuso IA responsable y proporcionó la función Guardrails en Amazon Bedrock, que puede brindar protección para una variedad de modelos básicos. y se pueden agregar políticas de filtrado de contenido para proteger la información confidencial y la privacidad del usuario.

En términos de cumplimiento, Amazon Bedrock proporciona capacidades integrales de monitoreo y registro para respaldar las necesidades de gobernanza y auditoría.

"Recorrer los últimos tres kilómetros de IA generativa" es el resumen de Chen Xiaojian sobre cómo implementar aplicaciones de IA generativa. Dijo que Amazon Cloud Technology cuenta con recursos integrales de soporte técnico, incluidos arquitectos, expertos en productos, laboratorios de inteligencia artificial, laboratorios de datos, equipos de creación rápida de prototipos y equipos de servicios profesionales para ayudar a los usuarios a completar los desafíos finales de la ingeniería de inteligencia artificial generativa.

Ha llegado la era del iPhone con IA generativa

La IA generativa se está desarrollando rápidamente. ¿Cuál es el siguiente paso más crítico?

Chen Xiaojian dijo que frente a las necesidades cada vez más complejas de los usuarios, todavía tenemos mucho trabajo por completar, incluida la capa básica, el modelo y la integración con el negocio.

En un nivel fundamental, el status quo de los chips todavía enfrenta desafíos. A pesar del rápido avance tecnológico de los chips semiconductores, la rápida expansión del tamaño de los parámetros de los modelos ha superado con creces las capacidades de procesamiento de los chips existentes. Desde millones de parámetros hasta decenas o decenas de miles de millones de parámetros, la complejidad de los modelos está creciendo a un ritmo sin precedentes. Como proveedor de servicios básicos, Amazon Cloud Technology necesita explorar constantemente cómo hacer coincidir las capacidades del hardware subyacente con la complejidad del negocio y la complejidad de los modelos grandes para garantizar que el desarrollo del hardware pueda mantenerse al día con la expansión de la escala del software. El B200 lanzado por Nvidia está lejos de ser la cima del hardware y todavía queda mucho trabajo por hacer en el futuro.

A nivel de modelo, las capacidades demostradas por Claude 3 son realmente impresionantes. Sin embargo, se necesitará mucho esfuerzo para integrar verdaderamente esta capacidad con el negocio. Puede que los modelos actuales hayan alcanzado el nivel de los estudiantes de doctorado, pero aún queda un largo camino por recorrer antes de que se puedan lograr avances al nivel de profesores universitarios, académicos o incluso Einsteins. Por lo tanto, los proveedores de IA generativa, incluida Amazon Cloud Technology, deben seguir invirtiendo en investigación y desarrollo para mejorar las capacidades de sus modelos.

En cuanto a la integración empresarial de alto nivel, podemos ver intentos de combinar Amazon Q con BI, el servicio al cliente inteligente de Amazon Connect y otras soluciones. La integración de la IA generativa con diversas industrias y escenarios será un proyecto enorme. También es necesario pensar en cómo hacer que los modelos grandes sirvan mejor a todos los ámbitos de la vida, proporcionando capacidades de modelo más potentes, un uso más conveniente y menores costos.

Ha llegado la era del iPhone con IA generativa. La demostración de hoy nos dio una idea de las cosas asombrosas que la IA generativa puede lograr. Pero para hacer realidad esta gran visión, no sólo Amazon Cloud Technology necesita trabajar duro, sino que toda la industria debe hacer grandes esfuerzos. La IA generativa tiene el potencial de aportar un enorme valor a la sociedad humana, pero esto requiere que exploremos y practiquemos juntos.

Ha llegado la era del iPhone con IA generativa

Supongo que te gusta