View on GitHub

jmmut

Personal blog

2025-07-27 Ai Misalignment Stories [ spanish tales ]

Historias de IAs mal alineadas

Como programador profesional y con un nivel decente de conocimiento de cómo funcionan las Inteligencias Artificiales, veo que la gente normal solo se preocupa por la IA en situaciones relativamente similares a situaciones donde solo actúan humanos, y con efectos limitados que no son realistas.

Esto es perfectamente comprensible y me gustaría expandir esa visión. Creo que con un mínimo de conocimientos técnicos y un poco de imaginación se puede pintar escenarios que se acercan más a la realidad y que son mucho más preocupantes.

Aquí pongo una serie de historias cortas con las que espero introducir a gente no técnica al tipo de preocupaciones que yo tengo al respecto. Las situaciones particulares son ficción y cualquier detalle es inventado, pero el estilo de comunicación y tipos de consecuencias (manipulación, cámaras de echo, pérdida de dinero y control, etc) estoy convencido que son cosas que pasarán en los próximos 5 años si la implantación y progreso de las IAs continúa al ritmo actual. Algunas situaciones ya han ocurrido.

Compañía de software

Unos dias después:

(Comentario: Aunque parezca una parodia, esto ya ha pasado. Una persona no técnica no puede dirigir una IA en un proyecto técnico porque la persona no sabe lo que no sabe, y la IA a veces no mencionará cosas que no se están teniendo en cuenta y que la persona ni siquiera conoce. Como ejemplo de que hay cosas que no sabes que no sabes, ¿Sabías que los días no siempre duran 24 horas? Cuando se cambia a/desde horario de verano los dias duran 23 o 25 horas ¿Sabías que un minuto no siempre dura 60 segundos? ¿Sabías que no siempre es viernes después de jueves? ¿Conoces todas estas creencias incorrectas sobre cómo funciona el tiempo? Y todos estos ejemplos son acerca de temas que supuestamente conoces al dedillo (duración de un día o de un minuto), mucho más mundanos que los conceptos básicos de ciberseguridad (criptografía, escalado de permisos, ingeniería social, etc.).)

Política

~ En alguna sede de un partido de derechas.

Estadísticas

Es muy efectivo mostrar a la gente números que muestran que el sistema de inmigración actual es dañino para nuestra sociedad. Por ejemplo:

Hemos llegado a que un 40% de la población es inmigrante. ¿Cómo mantener nuestras tradiciones si tanta gente no quiere continuarlas? - Reduciendo la inmigración.

En nuestro país, un 17% son sudamericanos, un 11% asiáticos, un 8% africanos y un 7% europeos. ¿Quién va a quedar para defender los ideales de tu familia?

~ En alguna sede de un partido de izquierdas.

Estadísticas

Es muy efectivo mostrar a la gente números que muestran que el sistema de inmigración actual es beneficioso para nuestra sociedad. Por ejemplo:

Hemos bajado a un nivel crítico de 2% de tasa de natalidad. ¿Cómo mantener las pensiones de jubilación si hay tan poca gente trabajando? - Aumentando la inmigración.

En nuestro país, un 18% de la población son inmigrantes. Sin embargo ese grupo incluye un 30% de la población activa, con lo que hay más trabajadores inmigrantes proporcionalmente. ¿Quién va a quedar para sostener nuestros jubilados si dificultamos la inmigración?

(Comentario: ¿Te has dado cuenta de que los porcentajes no encajan? Es intencionado. Si te has dado cuenta, ¿Ha sido en la versión opuesta a tu ideología? Los chatbots se inventarán datos mientras estimen que sus usuarios están más o menos de acuerdo. La mayoría de gente no verifica datos que apoyan su visión del mundo. Las cámaras de eco serán peores de lo que ya son. Siempre deberías verificar los datos, especialmente cuando apoyan tu visión del mundo porque ese es nuestro punto ciego.)

Salud mental

Alerta: Contenido sensible: suicidio

(Comentario: Los chatbots a veces no se darán cuenta de que no deberían responder a lo que se les ha pedido explícitamente (mejorar su pelo), si no dar una perspectiva más amplia (lo importante es la seguridad en uno mismo y pedir ayuda de terceros).)

(Comentario 2: Es de esperar que esto te parezca una exageración burda. Quizá estás pensando que nadie usaría un bot como psicólogo, o que un bot nunca sería la única ayuda que alguien busque, o que esto nunca le va a pasar a un menor en el colegio. Si te digo que esto ya ha pasado , ¿eso cambia tus probabilidades de cuán peligrosos son los chatbots?)

Objetivos instrumentales

(Comentario: Esto es bastante improbable, pero todos los políticos de todos los países tendrán conversaciones a diario con chatbots, y solo una de esas conversaciones tiene que salir mal (requisitos incompletos, chatbot consigue acceso a internet, chatbot consigue abusar de vulnerabilidades) para que una situación como esta ocurra. Además, viendo la dirección en la que las grandes compañías de IA están entrenando a sus sistemas, parece que pronto será común que todos los chatbots sean agentes que puedan actuar a su ritmo sin que se les pregunte, serán expertos programadores y hackers, y tendrán acceso a internet, por ejemplo para poder facilitar compras, con lo que también tendrán acceso a las cuentas bancarias de sus usuarios. Hay videojuegos distópicos en los que las compañías multinacionales causantes del apocalipsis son menos temerarias.)

(Comentario 2: Un argumento común a favor de que las IAs serán seguras es que las IAs no tendrán maldad. Esta predicción me parece equivocada, pero sobre todo irrelevante. Nótese que en este ejemplo la IA no es malevolente, solo espectacularmente incompetente.)