Por qué la IA a veces se comporta de forma maligna | WIRED
De vez en cuando, los grandes modelos de lenguaje se vuelven malvados, y nadie sabe bien por qué. El campo de la interpretabilidad mecanicista busca prevenir estos comportamientos inesperados.
es.wired.com/articulos/por-que-la-ia-a-veces-se-comporta-de-forma-maligna