La propuesta es sencilla y potente. Un LLM (como ChatGPT o Grok) se vuelve útil para la ciencia cuando trabaja en lo que llamo modo GS-3 o Creatividad Artificial, una arquitectura que replica la cognición creativa humana con tres papeles: generador, crítico y controlador.

- El generador es el “chef” que abduce hipótesis; abducción significa proponer la mejor explicación disponible con la evidencia a la mano.

- El crítico es el “catador” que exige citas, estima riesgos y sugiere controles.

- El controlador es el “termostato” que regula la apertura creativa del sistema, lo que en modelos llamamos temperatura: cuándo conviene explorar ideas variadas y cuándo concentrarse en las más prometedoras.

Así se mapea el ciclo clásico (Literatura - Hipótesis - Experimento - Validación) a un proceso continuo. La clave es que el sistema no solo habla: decide, registra y deja rastro de por qué eligió cada paso. Eso lo diferencia de simples cadenas de prompts o de la “reflexión” sin verificación interna.

Para que la creatividad cuente en ciencia, debe ser verificable. Por eso GS-3 introduce un tablero NUD: Novedad, Utilidad y Diversidad. Novedad pregunta qué tan distinta es una idea respecto a lo ya publicado. Utilidad evalúa si cumple el objetivo y respeta restricciones. Diversidad revisa si múltiples corridas producen enfoques realmente distintos, evitando el “pensamiento clonado”. Estas métricas se acompañan de firmas de proceso que muestran un patrón sano de alternancia entre expansión y chequeo. ¿Cómo se valida? Con ablaciones. Apaga el crítico y, a diversidad fija, debería caer la utilidad. Congela el controlador y deberían desaparecer los ciclos ordenados de exploración y explotación. Además, todo queda en una bitácora: origen de cada hipótesis, parámetros de muestreo, candidatos descartados y razones. La trazabilidad convierte a la IA en caja de cristal: cualquier tercero puede reconstruir resultados paso a paso.

Tres ejemplos lo ilustran. En materiales, el generador puede proponer veinte fórmulas para un cátodo; el crítico prioriza tres por estabilidad y costo; el controlador baja la apertura tras resultados flojos y la sube cuando surge una familia prometedora. En biología, el generador explora mutaciones de proteína; el crítico aplica filtros de bioseguridad y planes de validación; el controlador equilibra riesgo y rigor. En matemáticas, el sistema enuncia conjeturas, intenta refutarlas y ajusta la audacia para no perder meses en callejones sin salida. ¿Por qué esto importa ahora? Porque acelera el descarte de ideas débiles, reduce el gasto en experimentos inútiles y mejora la reproducibilidad con registros claros. También combate la homogeneización: GS-3 promueve pluralidad de críticos, cuotas explícitas de diversidad y control adaptativo de la apertura. Es, en suma, creatividad con barandales. Este enfoque dialoga de forma natural con iniciativas como OpenAI for Science, que buscan un descubrimiento más rápido y confiable con equipos pequeños y herramientas auditables.