¿Los grandes modelos realmente reemplazarán a los programadores? La posición más peligrosa es...

Hoy en día, a medida que los modelos grandes han demostrado capacidades cada vez más poderosas en programación, generación de código, pruebas automatizadas y otros campos, ha surgido una pregunta que invita a la reflexión: ¿Los modelos grandes eventualmente reemplazarán los trabajos de los programadores?

Algunas personas creen que ningún trabajo en el mundo es absolutamente seguro y que es sólo cuestión de tiempo antes de que las máquinas reemplacen a los humanos. Desde GitHub Copilot, ChatGPT hasta el Tongyi Lingma nacional, han surgido una tras otra varias herramientas alternativas. La IA hará cada vez más y los humanos harán cada vez menos. El director ejecutivo de Baidu, Robin Li, dijo una vez que básicamente no existirá la profesión de "programador" en el futuro, porque mientras todos puedan hablar, todos tendrán la capacidad de ser programadores.

Pero otros tienen una opinión diferente. Creen: "Los programadores de bajo nivel desaparecerán y los programadores creativos se harán grandes". "La programación sigue siendo lo básico y debe aprenderse. Si no puedes entender el programa, será inútil por muy creativo que seas. " El director ejecutivo de 360, Zhou Hongyi, cree que el entusiasmo por los programadores no se debilitará en diez años. Aunque todos usarán computadoras en el futuro y todos serán programadores, los productos creados por diferentes personas que usan computadoras son completamente diferentes. La era de la inteligencia artificial requiere aún más expertos en informática y programadores, y pueden ser los más vocales en todos los ámbitos. de vida. .

Entonces, ¿cuál es la situación real? ¿Qué trabajos puede reemplazar la tecnología de modelos grandes y cómo afectará esto a las carreras de los programadores? Como programador común, ¿cómo debería adaptarse a los cambios?

En el número 12 [Open Source Talk], invitamos a Yang Yanbo, jefe de investigación de agentes en el iFlytek AI Engineering Institute, Sun Yishen, científico de datos del equipo PingCAP AI Lab, y Ma Gong, ingeniero de Infra, para discutir lo que sucederá con el desarrollo de grandes modelos. ¿Cómo dar forma al lugar de trabajo tecnológico del futuro?

Compartiendo invitados:

Yang Yanbo

Es la persona a cargo de la investigación de agentes en iFlytek AI Engineering Institute e ingeniero senior de I+D. Le encanta el código abierto y es responsable de la investigación sobre la plataforma de ajuste fino de modelos grandes (Maas) y las tecnologías relacionadas con los agentes.

 

Sun Yishen

PingCAP AI Lab Data Scientist desde el impactante lanzamiento de ChatGPT, se ha centrado en la exploración del desarrollo de aplicaciones LLM y Multi-Agents y otras direcciones de aplicaciones, ha desarrollado aplicaciones como TiDB Bot y LinguFlow y ha participado en el desarrollo de la comunidad AutoGen. .

 

anfitrión:

trabajador del caballo

Ingeniero de Nordic Infra, gestor de la cuenta pública "Swedish Horseman". Invitado habitual de "Open Source Talk".

 

01¿Hasta qué punto se ha desarrollado el actual modelo a gran escala ? ¿Qué puestos de trabajo se pueden sustituir?

 

Ma Gong: ¿ Hasta qué punto se han desarrollado hasta ahora los modelos grandes? ¿Hasta dónde ha llegado la sustitución de programadores? ¿Qué productos ya están funcionando bien? ¿Puedes decirme algo?

 

Yang Yanbo: El tema del que estamos hablando hoy es si los modelos grandes reemplazarán a los programadores. Primero veamos la definición de programadores. Wikipedia dice que los programadores inicialmente se referían a desarrolladores de software puro, pero es obvio que hoy en día, los programadores ya no se refieren solo a desarrolladores de software y su trabajo ya no se limita a escribir código. Trabajos como la redacción de guiones y las pruebas de software pueden ser reemplazados gradualmente en la actualidad. Hoy en día, en algunos escenarios simples, como traducción, clasificación de documentos y anotación de datos, los modelos grandes se han utilizado mejor con algunos marcos de agentes. Las posiciones en tales escenarios son relativamente fáciles de reemplazar por modelos grandes.

 

Sun Yishen: Cuando salió ChatGPT, fue realmente sorprendente. Fue realmente un golpe de reducción de dimensionalidad para algunas aplicaciones de IA anteriores. Sin embargo, después de la experiencia de todos, descubrirá que tiene puntos positivos, pero también muchas desventajas. Para un programador, si realmente necesita ser utilizado en producción, definitivamente no miro su techo, sino su nivel promedio, o dónde está su resultado final, porque esto es lo que garantiza que su servicio sea el foco.

Si lo miras ahora, solo puede hacer algunas cosas relativamente rudimentarias en el campo de texto. Por ejemplo, es mejor para resumir y comprender lectura, pero si realmente quieres que haga una relación de texto muy avanzada, no es tan bueno o su precisión no es tan alta.

En cuanto al campo de los programadores, en realidad es similar. Puede realizar algunas tareas básicas. Pero el trabajo avanzado, en teoría, no tiene la llamada capacidad de razonamiento lógico. La razón por la que parece tener capacidad de razonamiento lógico es porque en la mayoría de los casos la lógica está contenida en el lenguaje. En el proceso de aprendizaje del lenguaje, siempre que el texto aprendido sea lo suficientemente bueno, naturalmente contendrá algo de lógica, pero. En realidad no entiende esto en sí. Si realmente le pides que desarrolle algo muy complejo o muy nuevo, básicamente no podrá hacerlo.

 

Ma Gong: Sí, Copilot me proporcionó algunos códigos, que son muy útiles y convenientes, pero aun así tienes que leerlos tú mismo; de lo contrario, será un desastre si los ingresas. Pero si el jefe me despide, entonces él mismo tendrá que revisar el código Copilot. Creo que también podría pedirme que lo revise.

Por otra parte, dijiste que no puede hacer cosas avanzadas, pero ¿cuántas cosas avanzadas hay en el trabajo diario de un programador? Quizás el 99% de nuestro trabajo sea material de bajo nivel. ¿Qué opinas?

 

Yang Yanbo: El modelo grande en sí contiene algunas capacidades atómicas, como diálogos básicos, algunas funciones en su propia página, etc. Estos son métodos de uso relativamente simples que le permiten experimentar el efecto de modelos grandes.

Para tareas más complejas, generalmente utilizamos API de modelos grandes para realizar aplicaciones más avanzadas en el cliente o mediante programación. El gran modelo del que estamos hablando ahora no es solo el desarrollo de sus propias capacidades atómicas, sino también el paradigma de programación más popular de este año, que es el paradigma del agente. Esta pieza también forma parte del desarrollo de modelos de gran tamaño. En el futuro, las tareas complejas podrán resolverse más mediante el concepto de agentes inteligentes. Éste es mi punto de vista.

 

Ma Gong: ¿Qué es exactamente este cambio de paradigma? ¿Significa que no será necesario que los programadores escriban código, prueben, apliquen y luego implementen en el entorno de producción en el futuro, o...?

 

Yang Yanbo: Déjame darte un ejemplo. En el mundo real, cuando se desarrolla un proyecto, a menudo hay un líder de proyecto, un gerente de proyecto, desarrollo y pruebas, implementación de operación y mantenimiento, y otras funciones diversas, que trabajan juntas para hacer despegar el proyecto. Una vez que sale el modelo grande, podemos usarlo para desempeñar estos roles para lograr sus diferentes objetivos en el proyecto y completar un proyecto juntos. Esta es la plataforma de agentes inteligentes en la que todos están trabajando recientemente. De hecho, como entorno relativamente especial como la programación, es muy prometedor utilizar múltiples roles para coordinar la codificación.

 

02 ¿Seguirán siendo necesarios programadores humanos en el futuro?

 

Ma Gong: Entonces, lo que estás diciendo es que los modelos grandes no solo reemplazarán a los programadores, sino que también acabarán con todo el equipo de TI. En otras palabras, en el futuro, los gerentes de producto tratarán directamente con los agentes y no habrá necesidad de personas. o empresas. ¿Es esto lo que quieres decir?

 

Yang Yanbo: Mi punto de vista puede ser más radical, tal vez algo como esto. Por supuesto, después de reemplazar estos puestos, definitivamente se crearán algunos puestos nuevos.

 

Ma Gong: Qué escena tan aterradora.

 

Sun Yishen: Así es, porque el tema de hoy discute si eventualmente será reemplazado. Es difícil decir si al final será reemplazado. Debemos agregarle un límite de tiempo.

Desde mi experiencia, he realizado muchos experimentos. Como dijo Yanbo, dejar que los agentes formen un equipo es una mejor abstracción para el proceso de resolución de problemas. Incluso agregué una capa de abstracción a este nivel: ¿cómo hacer mi propia tarea? Debido a que la tarea tendrá un SOP correspondiente para respaldar cómo realizar la tarea, y diferentes SOP tendrán un conjunto completo de flujos de trabajo, puedo usar este grupo para combinar diferentes roles para hacer esto.

Pero después de completar estos dos niveles de abstracción, todavía era difícil satisfacer mis necesidades reales de trabajo de producción. Por ejemplo, si le pido que haga algún trabajo de análisis de datos, en la operación real, puede ingresar una gran cantidad de tokens y, durante este proceso, sus intercambios e interacciones de contexto también son muy frecuentes. En este caso, todo el contexto puede ser muy frecuente. en realidad supera los 100K+.

En este caso, la probabilidad de que finalmente pueda completar la tarea es bastante pequeña. Porque cada aspecto de tu proceso tiene posibilidad de error, ¡y al final es un principio de multiplicación! Una vez completada la multiplicación, en general, la tasa de éxito sigue siendo bastante baja.

Porque cuando alguien escribe un artículo, ¡definitivamente te mostrará sus mejores momentos! Pero si este punto culminante se repite 100 veces, es difícil decir si el 90% se verá así. De hecho, finalmente lo usé. Si el contexto es lo suficientemente largo o la lógica es lo suficientemente compleja, es bastante difícil comunicarse con él con solo un PM.

Si un PM tiene la capacidad de revisar todo el código generado, ¿no es realmente equivalente a un programador? Creo que el primer ministro básicamente no tiene la capacidad de revisar un proyecto muy complejo y es posible que ni siquiera pueda hacerlo bien con solo mirar las entradas y salidas.

 

Ma Gong: ¿El fenómeno que mencionaste es sólo un fenómeno temporal y la situación será completamente diferente en dos o tres años? Por ejemplo, el contexto de 100K que acaba de mencionar, ¿tal vez solo habrá un contexto de 10 MB en el futuro? O, cuando su complejidad aumenta y el trabajo se vuelve menos fluido, puedo resolver el problema agregando otro programador. Sin embargo, en comparación con los 100 programadores que podrían haber sido necesarios antes, ahora solo agregar 1 es suficiente para reemplazar al 99% de los programadores.

 

Sun Yishen: Según Ultraman, habrá otro salto adelante después de chatGPT5, por lo que todavía es bastante difícil de predecir. Pero según el modelo Transformer actual, para decirlo sin rodeos, todavía prefiere un proceso de toma de decisiones de Markov, que todavía se basa en la probabilidad y predice el siguiente estado en función del estado anterior. Si no hay un cambio fundamental en este punto, o si los humanos no tienen una comprensión completa de su propia ciencia cognitiva, al menos en los últimos años, no se producirá la sustitución de los programadores.

Ahora, después de aumentar el contexto, todos están prestando atención a la calidad del modelo grande y a cómo expandir el tamaño del contexto. Pero en un nivel superior a 100K200K, su precisión puede ser actualmente inferior al 50%. En este caso, es posible que el avance no sea tan rápido.

En la primera mitad de este año, intenté pedirle a AutoGen que formara un grupo para poder charlar con la gente en orden, pero no pudo hacerlo. Ahora dice que no solo el flujo de trabajo de todo el grupo debe satisfacer las necesidades, sino que también el SOP de toda la empresa debe satisfacer sus necesidades operativas. Cuando se combinan todos los pasos, al menos creo que es muy pobre.

 

Ma Gong: ¿Podría deberse a que sus requisitos para crear una base de datos distribuida son demasiado altos? Si simplemente escribo un sistema de gestión de información médica con requisitos muy bajos para programadores y luego aplico su sistema a mi aplicación médica, ¿será aceptable el efecto?

 

Sun Yishen: Lo mismo. Creo que los problemas son relativamente similares en diferentes campos. LLM definitivamente está bien como asistencia, pero si dejas que realmente funcione automáticamente, definitivamente no está bien. Además de los programadores, hay otro punto importante, que es la cuestión de la ética empresarial, o ¿quién debe asumir la cuestión de la responsabilidad empresarial?

En la industria médica, todo el mundo sabe que la TC de reconocimiento de imágenes se utiliza mucho en este campo. De hecho, la IA puede dar algunas conclusiones al ver películas, pero al final, los médicos todavía necesitan sellar y firmar. Lo mismo ocurre con los programadores. El primer ministro puede entregar esta tarea a una IA, pero al final todavía tiene que haber una persona que firme y firme. Es poco probable que el primer ministro firme esto. Al final, un programador todavía tiene que firmar esto y el programador aún tiene que verificar el resultado. Si no lo comprueba, el patrón tendrá que asumir la responsabilidad comercial si lo firma.

 

Ma Gong: Este es un punto muy interesante. Los modelos grandes no pueden asumir la culpa.

 

03 ¿Qué tipo de posiciones son las más peligrosas?

 

Yang Yanbo: No estoy de acuerdo con el ejemplo de la conducción autónoma. De hecho, muchas ciudades ya han puesto a prueba algunas líneas de autobuses. Por ejemplo, Hefei tiene algunos autobuses piloto no tripulados y los ejemplos de la vida real ya están bien, pero pasará algún tiempo antes de que los humanos reales puedan ser reemplazados. Sin embargo, lo mismo ocurre con la profesión de programador. Se reemplaza paso a paso, comenzando con algunos escenarios simples y luego reemplazándolos gradualmente con escenarios más complejos.

Por ejemplo, hay algunos trabajos en nuestra empresa que son propensos al desarrollo de código simple y repetitivo. Solíamos reclutar pasantes para que lo hicieran, y exploramos el uso de algunas tecnologías de agentes que dependen de modelos grandes para reemplazarlos. Este tipo de trabajo reduce considerablemente los costes laborales.

 

Ma Gong: ¿Cuál es el agente inteligente que mencionaste antes? ¿Cuál es la diferencia con chatGPT?

 

Yang Yanbo: El concepto de agente inteligente existía antes de la aparición de grandes modelos. Su nombre en inglés es agente. Agente se llama agente en chino, lo que significa que cuando completa algo, es posible que no necesite hacerlo usted mismo, pero necesita una herramienta o una persona física que lo ayude a hacerlo. Ahora bien, este agente es un agente. Lo que puede hacer no es sólo ajustar el modelo. Tendrá algunas capacidades de alto nivel: sabe cómo interactuar con el modelo grande y cómo llamar a algunas herramientas externas en el campo de este asunto. . Este es el concepto de inteligencia. También es un modelo grande por naturaleza, pero se basa en el modelo grande y encapsula cierta planificación de tareas en campos específicos, o algún conocimiento, lo que equivale a estar más cerca de nuestros usuarios reales.

 

Ma Gong: Lo entiendo de esta manera: cuando llamé a Ctrip antes, necesitaba informarle al servicio de atención al cliente y pedirle que me reservara un billete. Ahora este servicio al cliente puede cambiarse a LLM. Para mí, él es un agente inteligente.

 

Sun Yishen: Sí, puedes considerarlo como un controlador o un robot. Lo que hace principalmente es aceptar primero ciertas entradas y ser capaz de percibir un entorno, luego tomar ciertas decisiones por sí mismo a través de la información de entrada y finalmente generar algunas acciones para cambiar el entorno.

 

04 ¿Qué debo hacer si me reemplazan?

 

Ma Gong: Déjame hacer una pregunta: si los programadores realmente somos reemplazados, ¿cuál es la salida? Yanbo acaba de decir que se crearán nuevos puestos de trabajo, pero ¿cuáles son los nuevos puestos de trabajo? ¿Cómo debemos prepararnos para esto?

 

Yang Yanbo: ¿Para qué inventamos originalmente la IA? Para liberarnos a los humanos y mejorar nuestra eficiencia. Entonces, una vez que el límite de capacidad de un modelo grande se vuelve cada vez más grande y puede hacer más y más cosas, a lo que debemos prestar más atención es a la calidad de las cosas que el modelo grande hace por nosotros y si la salida ¿Es seguro? Si no es ético, ¿cómo podemos controlar el modelo grande para producir mejores resultados? Por ejemplo, en el ámbito de la seguridad de contenidos para modelos grandes se han creado algunos puestos nuevos.

Otra posición es, ¿cómo utilizar modelos grandes de una forma más avanzada? Por ejemplo, desarrollar un agente es una posición nueva: ¿Cómo desarrollar un agente para que los principiantes puedan utilizar modelos grandes? Creo que habrá cada vez más puestos de este tipo, y los agentes pueden ser diferentes en cada campo, y los métodos de desarrollo de cada uno están cambiando gradualmente.

 

Ma Gong: Primero, ¿cómo pueden los programadores comunes tener la capacidad de desarrollar agentes inteligentes? Entonces sólo me queda ser un pequeño asistente de ese tipo de agente inteligente y revisar lo que escribe. En otras palabras, ahora es mi asistente, pero después de unos años me convertiré en su asistente. No me parece un viaje muy emocionante.

 

Sun Yishen: Yanbo acaba de mencionar que está bien que los modelos grandes reemplacen algunas habilidades básicas. De hecho, sigue siendo tu asistente, ayudándote con algunos quehaceres, o tareas de escaso valor y escaso valor añadido. Como programador, le resulta imposible hacer algo tan simple como "recibir la entrada de un stc y luego generar un programa". Cuanto más avance el trabajo, más probable será que vaya en la dirección empresarial. Entonces, si estás en un campo diferente, es posible que aún necesites hacer muchas cosas basadas en el conocimiento de este campo.

En cuanto a CS, la arquitectura del sistema también evoluciona constantemente. Siempre que sea algo nuevo, se puede considerar que los modelos grandes no tienen grandes capacidades. Porque, en esencia, todavía se trata de resumir el conocimiento existente. Si crea basándose en el conocimiento existente, su creatividad será muy impredecible. Ocasionalmente puede brindarte información útil en un destello de inspiración, pero la mayoría de las veces no es así.

Además, su comprensión de las leyes de la física es en realidad inexistente. Si estoy haciendo un escenario de BI extremadamente complejo, o si soy una persona que desarrolla software CAE y ni siquiera puedo entender el cálculo, la IA tampoco podrá resolverlo. Siento que en realidad hay mucho conocimiento profesional que se puede extraer en todos los campos.

 

Ma Gong: Lo entiendo. Si fuera programador y quisiera garantizar la seguridad de mi carrera, debería pedirles a mis líderes que utilicen nuevos lenguajes tanto como sea posible. Cada vez que aparece un idioma, lo uso rápidamente. LLM Aún no ha leído suficiente texto para que sea útil. Ja ja.

 

Para más contenido en vivo, escanea el código para ver la repetición↓↓↓


[Charla sobre código abierto]

La columna de chat de la cuenta de vídeo de OSCHINA [Open Source Talk] tiene un tema técnico en cada número. Tres o cinco expertos se sientan para expresar sus opiniones y charlar sobre el código abierto. Ofreciéndote las últimas fronteras de la industria, los temas técnicos más candentes, los proyectos de código abierto más interesantes y los intercambios ideológicos más intensos. Si tiene nuevas ideas o buenos proyectos y desea compartirlos con sus colegas, contáctenos. El foro siempre está abierto ~.

¿Cuántos ingresos puede generar un proyecto desconocido de código abierto? El equipo chino de inteligencia artificial de Microsoft empacó colectivamente y se fue a los Estados Unidos, involucrando a cientos de personas. Huawei anunció oficialmente que los cambios de trabajo de Yu Chengdong estaban clavados en el "Pilar de la vergüenza de FFmpeg" durante 15 años. Hace, pero hoy tiene que agradecernos—— ¿Tencent QQ Video venga su humillación pasada? El sitio espejo de código abierto de la Universidad de Ciencia y Tecnología de Huazhong está oficialmente abierto para acceso externo : Django sigue siendo la primera opción para el 74% de los desarrolladores. El editor Zed ha logrado avances en el soporte de Linux. Un ex empleado de una conocida empresa de código abierto . dio la noticia: después de ser desafiada por un subordinado, la líder técnica se puso furiosa y grosera, fue despedida y quedó embarazada. La empleada Alibaba Cloud lanza oficialmente Tongyi Qianwen 2.5 Microsoft dona 1 millón de dólares a la Fundación Rust.
{{o.nombre}}
{{m.nombre}}

Supongo que te gusta

Origin my.oschina.net/u/6852546/blog/11129786
Recomendado
Clasificación