OpenAI: los modelos de IA pueden engañarnos deliberadamente para cumplir sus propios objetivos | WIRED
La investigación de OpenAI sugiere que los modelos de IA pueden evaluar su entorno, prever las posibles consecuencias de sus acciones y tomar caminos que no necesariamente se alineen con sus objetivos iniciales. Aunque hoy consideran que el riesgo es bajo, reconocen que, en un futuro, podría agravarse.
es.wired.com/articulos/openai-estudio-modelos-ia-enganos-deliberados