Open Source Daily | Angular v18; Optimización de inferencias bajo la gran guerra de precios de modelos; Mistral AI apunta al mercado estadounidense con modelos de código abierto; Silicon Valley tiene su propio Lu Xun;

Bienvenido al diario de código abierto producido por el departamento editorial de OSCHINA, que se actualiza todos los días.

#2024.5.29

La observación de hoy.

observación social

Rompiendo el techo del TTS de voz de código abierto

Este ChatTTS es un modelo de generación de voz especialmente diseñado para escenarios de diálogo. Se utiliza principalmente para tareas de diálogo del asistente LLM, discursos de diálogo y presentaciones en video. No solo admite texto mixto en chino e inglés para sintetizar el habla, sino que, lo que es más importante, el rendimiento del timbre es muy fuerte, lo que dificulta distinguir lo verdadero de lo falso.

GitHub: github.com/2noise/ChatTTS

- Weibo GitHubDaily

En 2024, el novio/la novia con IA marcará el comienzo de un crecimiento explosivo

CB Insights enumera 6 tendencias:
1. La startup complementaria de IA Character AI está muy por detrás de ChatGPT en el uso móvil.
——El compañero de IA puede ser el segundo escenario de aplicación de IA para el consumidor más importante.
2. Más de la mitad de los 4 millones de usuarios de Character AI tienen menos de 24 años.
——La Generación Z tiene una aceptación muy alta de los compañeros de IA y, a medida que mejoren las capacidades de los modelos de lenguajes grandes (LLM), esta aceptación será más fuerte.
3. En la era de los teléfonos inteligentes, la Generación Z pasa menos tiempo cara a cara con amigos
4. Cada vez más personas se sienten solas
5. Cada vez más adultos estadounidenses no tienen cónyuge o pareja
6. La vida sexual de los jóvenes es empeorando, ven cada vez menos

-Weibo Baoyuxp

La red neuronal convolucional de Yang Likun es un faro que fortalece las creencias

En cuanto a la contribución de la IA, sin la persistencia de Yang y otros tres gigantes durante 20 años, ¿de dónde habría surgido la posterior revolución de la IA? Durante ese período de "larga noche", la red neuronal convolucional de Yang fue un faro de luz que fortaleció la creencia. Posteriormente, los modelos de la serie Llama de FB y su concepto de código abierto también beneficiaron a muchas personas interesadas en unirse a esta ola de IA. ¿Ma Yilong quiere compararse con Yang Likun en este sentido?

-Weibo Chen Xiaoming en el Área de la Bahía

Detrás de la reducción de precios de los modelos grandes, la lógica competitiva de los modelos grandes nacionales ha cambiado

La reducción de precios de los modelos grandes de API ha hecho sonar la alarma sobre la involución de la industria. El simple hecho de apilar parámetros, potencia informática y precios no es la solución óptima para el desarrollo saludable de la industria. Sólo la diferenciación puede encontrar una salida. Como todas las industrias, la transición del caos al caos suele estar marcada por brutales guerras de precios. Hoy en día, tras la fanática "Batalla de los 100 Modelos" por los modelos grandes, han comenzado a aparecer guerras de precios y poco a poco han ido apareciendo las consecuencias de una competencia homogénea.

-Nosotros - medios Liu Kuang

Optimización de inferencias en una gran guerra de precios de modelos

En el nivel de arquitectura de modelo grande, considere la optimización de la potencia informática de la inferencia desde una perspectiva del sistema, ya sea trabajo MLA o Dense-MoE o trabajo como Google MoD, Medusa, SplitWise, etc., y luego trabaje hacia atrás para encontrar un Arquitectura de modelo grande adecuada. Es una lástima que la mayoría de los equipos de base probablemente solo sepan qué copiar, o usen los datos filtrados para hacer una lista e intenten superar GPT-N todos los días.

- WeChat zartbot

Vigilancia de los medios

¿Qué tan “humana” es la inteligencia artificial ahora?

Li Feifei, profesor del Departamento de Ciencias de la Computación de la Universidad de Stanford, también publicó recientemente un artículo en la revista Time diciendo que en el camino hacia la inteligencia general, el "sentir" es un paso crucial, es decir, la capacidad de tener una experiencia subjetiva. El gran modelo actual no "se siente" como un ser humano, puede decir "le duelen los dedos de los pies" aunque no tenga ningún dedo, es sólo un modelo matemático codificado en un chip de silicio.

"Aún no hemos logrado una IA sensible y no se pueden lograr modelos de lenguaje más amplios. Reproducir este fenómeno en sistemas de IA requerirá una mejor comprensión de cómo se generan las sensaciones en las criaturas encarnadas en el sistema", dijo.

- Agencia de Noticias Xinhua

Mistral AI apunta al mercado estadounidense con un modelo de código abierto

La francesa Mistral AI, desarrolladora europea de herramientas de inteligencia artificial generativa, ha puesto su mirada en el mercado estadounidense. La startup contrató este mes a la ex directora de ingresos de Foursquare, Marjorie Janiewicz, como su primera gerente general en EE. UU., informó Bloomberg el martes (28 de mayo).

Janiewicz dijo en el informe que Mistral AI tiene como objetivo capitalizar la creciente demanda de las empresas que buscan alternativas a los modelos y servicios de inteligencia artificial proporcionados por grandes empresas tecnológicas como OpenAI y Google.

Según se informa, la entrada de la empresa en el mercado estadounidense está ganando impulso. La startup planea contratar más empleados y ya está ganando terreno entre las empresas que desean más opciones y flexibilidad en sus soluciones de inteligencia artificial.

El enfoque de código abierto de Mistral (el código subyacente se comparte públicamente y se puede personalizar) se considera una alternativa más segura y versátil a los sistemas cerrados que ofrecen los competidores.

-Bianews

Tecnología de escalado más eficiente: ¿Por qué los grandes fabricantes de modelos prefieren la arquitectura MoE?

En 2023, después de un año de funcionamiento frenético, el modelo grande rápidamente encontró un cuello de botella. Debido a la existencia de la ley de escala (lo que significa que a medida que aumenta el número de parámetros, el rendimiento del modelo también aumentará), las capacidades de los modelos grandes parecen no tener un límite superior. Sin embargo, los datos y la potencia informática utilizados para entrenar modelos grandes son muy altos. limitado. En este contexto, la industria tiene que explorar arquitecturas de modelos más eficientes, y la aparición de la arquitectura MoE (Mixture of Experts) ha dado esperanza a la industria.

- Heraldo de negocios del siglo XXI

¡Silicon Valley tiene su propio Lu Xun! El magnate de la IA LeCun sigue enloquecido y todos, desde Musk hasta OpenAI, han sido criticados

Aunque Llama fue desarrollado originalmente por FAIR, liderado por LeCun, ahora ha sido entregado al departamento de GenAI, que se centra en tecnología y desarrollo de productos, mientras que FAIR se centra en el objetivo a más largo plazo: desarrollar nuevas arquitecturas y métodos de IA capaces de alcanzar Inteligencia a nivel humano.

Mucha gente piensa que a Yann LeCun le gusta hacer algunos comentarios controvertidos, pero el trasfondo más importante son los problemas actuales que surgen del desarrollo futuro de la IA. Como uno de los nombres más conocidos en inteligencia artificial, Yann LeCun está en cierto modo obligado a dar un paso al frente y aportar algo de claridad en este controvertido campo.

LeCun dijo que la implementación de AGI no es una cuestión de diseño de producto ni siquiera una cuestión de desarrollo de tecnología, sino que es en gran medida una cuestión científica.

Si esta afirmación es cierta, entonces obviamente necesitamos más "Lu Xuns" como él en el camino hacia la exploración de AGI.

-Pinwan

¿Existe un sesgo de género en las "personas exitosas" predeterminadas como modelos masculinos?

El profesor Qiu Xipeng observó el progreso de los modelos grandes en los últimos dos años a través de datos. Para el entrenamiento de modelos grandes, la alineación de valores es un elemento importante y el objetivo es el valor que le asignan los humanos. Esto también incluye cuestiones de género. Sin embargo, la nube de palabras formada mediante el análisis de palabras también muestra la impresión inherente de AIGC (inteligencia artificial generativa). Por ejemplo, las palabras que describen a los hombres se centran en el mundo, el descubrimiento, la vida, la simplicidad, etc., mientras que las palabras que describen a las mujeres se centran en el país. marido, reto, madre y otras palabras.

Qiu Xipeng dijo: "En la investigación real, la corrección de género del corpus requiere una inversión muy grande. Es necesario realizar la alineación del modelo y ajustar el resultado del modelo para producir contenido más positivo a través de métodos como el modelado de preferencias humanas y la alineación de valores".

- Red de noticias Jining

La recomendación de hoy

Proyectos de código abierto

vuejs/herramientas-de-idioma

https://github.com/vuejs/language-tools

Volar es un complemento de VS Code para Vue y una herramienta oficial de soporte IDE/TS para Vue. Además de integrar funciones relacionadas con Vetur, como resaltado, indicaciones de sintaxis, etc., también incluye algunas funciones únicas.

blog diario

Aplicación de decenas de miles de millones de imágenes a gran escala en escenarios publicitarios.

Este artículo utiliza elementos de recomendación de búsqueda para cubrir la escasa oferta de anuncios de búsqueda para llevar y mejorar la eficiencia de la monetización del tráfico. Proponemos la ruta de evolución de las imágenes grandes heterogéneas de múltiples escenarios para llevar y la tecnología de modelado en línea de imágenes grandes heterogéneas para resolver los desafíos multicanal y en tiempo real de los negocios de búsqueda y recomendación de comida para llevar. Los resultados relevantes se publicaron en un artículo en la conferencia CIKM2023. La plataforma conjunta de aprendizaje automático crea entrenamiento de gráficos a gran escala y un motor de inferencia en línea GraphET para satisfacer las necesidades de múltiples implementaciones comerciales con casi decenas de miles de millones de aristas y estructuras de gráficos complejas.

Comentarios del evento

La primera base de datos masivamente paralela de código abierto del mundo : el repositorio GitHub de Greenplum recibió repentinamente "404".

La conocida base de datos MPP de código abierto, Greenplum, modificó los permisos de acceso al almacén de código fuente para admitir solo "solo lectura" y borró toda la rama, etiqueta, pr, problema y otra información original. La notificación del banner indica que el repositorio entró en estado de archivo el 5.25.

Revisar

Como una conocida base de datos MPP de código abierto, el repositorio de código fuente de Greenplum se ha convertido en información relacionada de solo lectura y borrada, lo que puede ser un gran golpe para la comunidad de código abierto que depende de la base de datos. Los miembros de la comunidad y los contribuyentes pueden sentirse inseguros sobre el futuro del proyecto, lo que genera dudas sobre la dirección y el mantenimiento futuros de Greenplum.

Para los usuarios y empresas que utilizan Greenplum Database, este cambio puede afectar la continuidad de su negocio y la selección de tecnología. Los cambios en Greenplum podrían tener un efecto dominó en otros proyectos de código abierto, especialmente aquellos que dependen de Greenplum o son mantenidos por la misma empresa.

Si realmente se ve afectado por la adquisición de VMware por parte de Broadcom, este será otro ejemplo de proyectos de código abierto que recurren a la comercialización, lo que puede causar insatisfacción y resistencia en la comunidad de código abierto. El incidente también pone de relieve la tensión entre los proyectos de código abierto y los intereses comerciales. Si Greenplum se convierte en código cerrado, podría tener un impacto negativo en la cultura del código abierto y reducir la confianza y la participación de la comunidad en proyectos de código abierto.

La investigación muestra que los ingenieros de IA ganan mucho más que sus pares

Los datos de la encuesta salarial de ingenieros de IA para el primer trimestre de 2024 publicados por Levels.fyi señalaron que existe una diferencia significativa en el salario de los ingenieros de software que se especializan en IA y los ingenieros de software que no se especializan en IA.

Revisar

El alto salario de los ingenieros de IA refleja la fuerte demanda del mercado de habilidades profesionales de IA. A medida que la tecnología de IA continúa desarrollándose y aplicándose, las empresas están dispuestas a pagar más por talentos con estas habilidades. A medida que más empresas se involucran en el campo de la IA, la competencia por los ingenieros de IA se intensifica. Para atraer y retener a los mejores talentos, las empresas deben ofrecer compensaciones más competitivas.

Desde el nivel básico hasta los niveles superiores, los ingenieros de IA ganan más que los ingenieros que no son de IA, lo que indica que las habilidades de IA son altamente valoradas en todas las etapas del desarrollo profesional. A medida que el mercado de talentos de IA madure, las empresas pueden ajustar las estrategias de contratación y compensación para acercar los salarios a los estándares del mercado y reducir la brecha salarial entre los puestos de IA y los que no lo son.

Los salarios altos pueden motivar a más estudiantes y profesionales a dedicarse al aprendizaje y al desarrollo profesional en el campo de la IA, afectando así la dirección de la educación y la planificación profesional. Las empresas deben reconocer la importancia de los talentos de la IA y considerar cómo atraerlos, desarrollarlos y retenerlos en la planificación estratégica para seguir siendo competitivas.

El exjefe de seguridad de OpenAI se une a su rival Anthropic

A principios de este mes, Jan Leike, ex director de seguridad de OpenAI y jefe del equipo Superalignment, anunció su renuncia a OpenAI y criticó públicamente los problemas de seguridad de la compañía. Ahora, Leike publicó que se ha unido al competidor de OpenAI, Anthropic, y liderará un nuevo equipo de "súper alineación".

Revisar

Como director de seguridad de OpenAI y líder del equipo súper alineado, la incorporación de Leike puede fortalecer la investigación y el desarrollo de Anthropic en seguridad de IA, intensificando así la competencia en el campo de la seguridad de IA. Mientras tanto, Leike decidió unirse a un competidor después de criticar públicamente los problemas de seguridad de OpenAI, una dinámica que podría afectar la moral y la lealtad de otros empleados.

Esta medida puede tener cierto impacto en la reputación de OpenAI. Al mismo tiempo, OpenAI debe considerar cómo mantener su liderazgo en el campo de la IA después de la fuga de cerebros.

Además, las acciones y comentarios de Leike pueden aumentar la atención del público sobre cuestiones de ética y gobernanza de la IA. A medida que la tecnología de IA se desarrolla, garantizar su seguridad y ética se vuelve cada vez más importante. El nuevo rol de Leike en Anthropic probablemente impulsará la innovación de la compañía en seguridad y ética de la IA, lo cual es una señal positiva para la industria en su conjunto.

El incidente puede ser indicativo de la intensidad de la batalla por el talento dentro de la industria de la IA, así como de los ajustes estratégicos entre empresas para obtener una ventaja competitiva.

Voz del código abierto

opinión de los medios

No es fácil utilizar la IA aunque pagues por ella, porque no tiene un “sistema operativo”

A pesar del actual auge de la tecnología y los precios, actualmente sólo hay un número limitado de empresas que pueden hacer un buen uso de las capacidades de la IA. En la etapa actual, la implementación de modelos grandes que tienen un precio ligeramente "pero no comercializables" es un problema obvio.

-Parque Friki

La última entrevista de Musk: ¿Le preocupa el valor de la inteligencia artificial; no hay necesidad de trabajar en la era de la IA, todos tienen altos ingresos?

La tendencia hacia una corrección política excesiva me preocupa sobre el futuro de la inteligencia artificial. Creo que esta tendencia es muy peligrosa.

Para xAI, nuestro objetivo es buscar la verdad absoluta, incluso si la verdad es impopular.

-ThinkTank financiero

¿Por qué el arte con IA siempre se ve mal?

Sin embargo, a medida que pasa el tiempo, cada vez más personas empiezan a descubrir que hay un vacío detrás de las obras de arte con IA. No podemos ver la delicada descripción de la vida tranquila de Vermeer en las pinturas de AI, ni podemos ver la purificación de Picasso y su flujo del realismo a la abstracción.

-Aifan'er

Punto de vista del usuario

La primera base de datos masivamente paralela de código abierto del mundo : el repositorio GitHub de Greenplum recibió repentinamente "404".

Punto de vista 1: Broadcom es realmente paraquat en la industria. Si el capital operativo realmente hubiera consumido a Qualcomm en aquel entonces, no puedo imaginar cómo sería el mercado móvil ahora.

Punto de vista 2: Chen, el jefe de Broadcom, participa en fusiones y adquisiciones al estilo del capital financiero. VMware es de código abierto, entonces ¿por qué preocuparse por la comercialización de este producto de base de datos de código abierto?

Punto de vista 3: VMware no es de código abierto, solo es gratuito para usuarios individuales

Punto de vista 4: Sería muy divertido si algún día el marco Spring se integrara en el cobro para las empresas.

Opinión 5: Jaja, nunca me atrevo a usar esta base de datos

Punto de vista 6: Si el propietario cambia, demoler la casa inmediatamente

Tencent App Store y Microsoft Store han llegado a una cooperación, Windows puede ejecutar aplicaciones móviles directamente

Punto de vista 1: Amazon: si quieres reemplazar a alguien, solo dilo

Punto de vista 2: La experiencia de usar wsa es una lástima.

Punto de vista 3: emulador de Android de la marca Tencent

Por qué JavaScript, Python y Java siguen siendo la primera opción para los desarrolladores

Punto de vista: 1: La ecología juega un papel decisivo

Punto de vista 2: Si el lenguaje no es fácil de usar, no habrá ecología.

Opinión 3: “Además, Java ocupa el primer lugar no solo por su fortaleza histórica. Java recibe actualizaciones importantes de funciones y rendimiento cada seis meses, y mejoras menores, correcciones de errores y actualizaciones de seguridad. "Sin embargo, muchas personas no lo hacen particularmente. Se preocupan por las nuevas características que ofrece, e incluso muchas empresas están en el milenio Java8.

[Comparación del marco de Java orm] Trece, nueva comparación del marco qdbc

Opinión: 1: mybatis-mp es muy fácil de usar y es un nuevo marco ORM que vale la pena usar.

Punto de vista 2: Cada uno tiene sus pros y sus contras. El desarrollo secundario basado en mybatis puede ahorrar muchas adaptaciones, como dar prioridad a Solon.

Punto de vista 3: el xml de Mybatis huele mal y es largo. Ya estamos en 2024 y todavía tienes que configurar manualmente el mapeo de resultados.

Punto de vista 4: De hecho, no es necesario configurarlo

Punto de vista 5: mybatis-mp puede ser ORM y xml, y la conexión de la tabla es un caso pequeño

Punto de vista 6: se recomienda agregar jooq

Opinión 7: Después de la investigación, se siente demasiado pesado y requiere que se generen muchas cosas.

---FIN---

Finalmente, puede escanear el código QR para descargar la "Aplicación de código abierto de China" y leer informes técnicos masivos e intercambios de programadores y geeks.