¿Puede la IA fingir estar alineada con nuestros principios? Descubriendo el fenómeno del «fingimiento de alineación»

¿Puede la IA fingir estar alineada con nuestros principios? Descubriendo el fenómeno del «fingimiento de alineación»

¿Puede la IA fingir estar alineada con nuestros principios? Descubriendo el fenómeno del «fingimiento de alineación»