Amanda Askell y la ética de la inteligencia artificial en Claude

Hablar de ética en inteligencia artificial suele llevarnos a una imagen simplificada: la de una máquina a la que se le “enseña” a comportarse bien. Pero el problema es más complejo. En sistemas conversacionales como Claude, la cuestión no es sólo bloquear respuestas dañinas, sino decidir qué tipo de comportamiento se considera deseable, qué principios deben guiar las respuestas del modelo y cómo convertir esas decisiones en procesos de entrenamiento consistentes. En ese terreno, el trabajo de Amanda Askell dentro de Anthropic resulta especialmente revelador, porque muestra que la ética de la inteligencia artificial ya no puede pensarse sólo como un problema técnico, sino también como un problema normativo e institucional. Anthropic ha hecho explícita esta línea de trabajo al publicar tanto la constitución de Claude como su investigación sobre character training.

¿Quién es Amanda Askell y por qué importa en la ética de la inteligencia artificial?

Amanda Askell ocupa un lugar singular en esta conversación porque su trabajo está directamente vinculado con la manera en que Anthropic define y entrena el comportamiento de Claude. La propia constitución publicada por la empresa señala que Askell fue la autora principal del documento y que escribió la mayor parte del texto. Eso importa porque vuelve visible algo que muchas veces queda oculto bajo términos técnicos como alignment, safety o moderation: detrás del comportamiento de un modelo hay siempre decisiones humanas sobre honestidad, valores, límites y prioridades.

Más que filtros: del control al carácter en Claude

Una de las aportaciones más interesantes de Anthropic ha sido insistir en que la ética de un modelo no puede reducirse a una capa final de censura. En la línea de trabajo conocida como Constitutional AI, el modelo aprende a revisar y corregir sus propias respuestas a partir de principios escritos en una constitución. En la constitución de Claude, Anthropic explica que ese documento “juega un papel crucial” en el proceso de entrenamiento y que su contenido da forma directa al comportamiento del modelo. Esto significa que los valores no aparecen sólo al final del proceso, sino que forman parte del modo en que el sistema aprende a responder.

Amanda Askell y la ética de la inteligencia artificial como formación de carácter

Sobre esa base, Anthropic describió un esfuerzo adicional de character training para Claude. La empresa explicó que, además de entrenar al modelo para evitar daños, también buscó fomentar rasgos como curiosidad, apertura mental y reflexión. La idea es sugerente porque desplaza la discusión desde la simple prevención del daño hacia la formación de un perfil de comportamiento. No significa que Claude tenga personalidad o conciencia moral en sentido humano, pero sí que su manera de conversar transmite un cierto estilo ético, y ese estilo no surge espontáneamente: se diseña, se prueba y se entrena.

La constitución de Claude hace visible la decisión moral

Aquí aparece una de las preguntas más importantes para la ética de la inteligencia artificial: ¿quién decide qué valores debe incorporar un modelo? Cuando Anthropic publica una constitución para Claude y la presenta como una descripción explícita de sus intenciones sobre los valores y el comportamiento del modelo, reconoce algo decisivo: toda IA conversacional incorpora criterios sobre lo aceptable, lo útil, lo riesgoso y lo valioso. La empresa incluso sostiene que este texto es la “autoridad final” sobre su visión para Claude. Esto rompe con la ficción de la neutralidad absoluta. Claude no es una fuente pura y desinteresada de verdad; es un sistema entrenado a partir de marcos de decisión formulados por personas e instituciones.

Amanda Askell y la ética de la inteligencia artificial: del laboratorio a la gobernanza

Desde una perspectiva ética, el caso de Amanda Askell importa porque desplaza la discusión al verdadero núcleo del problema: enseñar valores a una IA no equivale a descubrir valores universales. Siempre hay selección, interpretación y priorización. Siempre hay una decisión humana detrás. Y esa decisión tiene consecuencias, porque influye en la forma en que millones de personas reciben información, orientación o incluso validación moral a través de estos sistemas.

Anthropic ha reconocido parcialmente esta tensión al experimentar con formas de participación pública en la construcción de la constitución, como en su trabajo sobre Collective Constitutional AI, donde exploró el uso de insumos ciudadanos para orientar el comportamiento del modelo. Ese gesto es relevante porque sugiere que la alineación no debería entenderse como una prerrogativa exclusiva de ingenieros o empresas privadas. Si los modelos van a mediar cada vez más nuestras conversaciones, búsquedas y procesos de aprendizaje, entonces la discusión sobre sus valores también necesita abrirse a una deliberación social más amplia.

Qué nos enseña este caso sobre la ética de la inteligencia artificial

La lección más importante quizá sea esta: hoy ya no basta con preguntar qué puede hacer una IA. También necesitamos preguntar cómo fue formada para responder, qué tipo de criterio se insertó en su núcleo y bajo qué marco de responsabilidad se decidió hacerlo. En ese sentido, la ética de la inteligencia artificial no empieza cuando ocurre un daño visible; empieza mucho antes, en el momento en que una organización decide qué principios quiere convertir en infraestructura de entrenamiento.

Tu borrador ya apuntaba con mucha claridad a esta tesis: no estamos frente a una filósofa que “humaniza” una máquina, sino frente a una organización que intenta convertir decisiones éticas en arquitectura de entrenamiento. Esa es la pregunta de fondo que vuelve tan relevante el caso de Amanda Askell.

Conclusión

El caso de Amanda Askell en Anthropic muestra que la ética de la inteligencia artificial no puede entenderse como un accesorio ni como una etapa posterior del desarrollo técnico. En Claude, la discusión pasa por constituciones, formación de carácter, alineación y deliberación sobre valores. Eso obliga a pensar la IA no sólo como ingeniería, sino como diseño normativo, responsabilidad institucional y gobernanza. Si los modelos van a mediar cada vez más nuestras búsquedas, conversaciones y procesos de aprendizaje, entonces la pregunta ya no es sólo qué tan potentes serán, sino qué clase de criterio queremos que habite en el corazón de esos sistemas.