Tecnología

La inferencia toma el control: será hasta 40% de la demanda en centros de datos

Tras el boom del entrenamiento, la IA entra en su fase de monetización, donde la inferencia impulsa el uso en tiempo real y redefine la rentabilidad del negocio.

mar 31 marzo 2026 05:55 AM

Qué es la inferencia en la IA y por qué es la nueva gallina de los huevos de oro — La inferencia consiste en la capacidad de la IA de razonar y sacar conclusiones de datos nunca antes vistos, es decir, luego del entrenamiento, la herramienta puede detectar patrones y hacer razonamientos similares a las que hace un humano. (Foto: iStock)

Fernando Guarneros Olmos

@Guarolf_

La inferencia es el próximo nivel en la evolución de la Inteligencia Artificial. Se trata de la transición de una era dominada por el entrenamiento de modelos masivos a una etapa donde el impacto llega a todo el mundo y es por ello que el propio Jensen Huang la considera la responsable de generar el próximo billón de dólares en la industria de la IA.

Hace unas semanas, durante la conferencia anual de Nvidia, el CEO, Jensen Huang, señaló que el primer billón de dólares de la era de la IA se gastó en entrenar, mientras que el próximo billón se gastará en aplicar ese conocimiento en tiempo real, refiriéndose a la inferencia.

¿Qué es inferencia en el contexto de la IA?

La inferencia es el proceso de utilizar un modelo de aprendizaje automático entrenado para realizar predicciones o tomar decisiones basadas en datos nuevos y desconocidos. A diferencia del entrenamiento, esta etapa no implica actualizar los parámetros del modelo. En cambio, aplica el conocimiento adquirido durante el entrenamiento para generar resultados.

Su impacto no se muestra solo en chatbots, pues también permite una toma de decisiones rápida, lo que la hace ideal para aplicaciones como vehículos autónomos, además de los asistentes virtuales, y, en comparación con el entrenamiento, generalmente requiere menos potencia computacional y puede ejecutarse en dispositivos periféricos.

Es decir, a nivel financiero, se puede implementar en múltiples dispositivos o servidores para gestionar aplicaciones a gran escala, y si bien se basa en el modelo entrenado y no puede adaptarse a nuevos datos o escenarios sin un nuevo entrenamiento, se trata de una de las etapas de mayor potencial económico.

Para 2030, según cifras de McKinsey , la inferencia superará al entrenamiento y se convertirá en la carga de trabajo dominante en los centros de datos de IA, representando más de la mitad de la computación total de IA y aproximadamente entre el 30 y el 40% de la demanda total de centros de datos.

De acuerdo con datos de Grand View Research, se prevé que esta industria llegue a los 253,750 millones de dólares en 2030, con una tasa de crecimiento anual compuesta (CAGR) del 17.5% entre 2025 y 2030.

¿Por qué la inferencia es tan atractiva en la actualidad?

David Feng, vicepresidente del segmento de cómputo para clientes en Intel, explica que existen diferentes razones por las cuales la inferencia es el motor principal en la evolución de la IA, entre las que destacan: la diversificación de cargas de trabajo, es decir, los modelos ahora son de diferentes tamaños y tipo, lo que exige emparejar cada carga de trabajo con el hardware más eficiente (ya sea CPU, GPU o aceleradores específicos) para entregar resultados de manera económica.

En este sentido es importante detallar que la inferencia no requiere las miles de GPUs de alto rendimiento, que sí son necesarias para entrenar un modelo, pues puede ejecutarse en hardware más pequeño o en dispositivos edge, como computadoras locales o incluso teléfonos.

Asimismo, a diferencia del alto costo inicial del entrenamiento, la inferencia se factura generalmente bajo demanda por token de entrada/salida, lo que permite a empresas pequeñas y desarrolladores pagar solo por la capacidad que utilizan, mientras que a nivel de centros de datos, detalla Feng, el foco ha pasado de tener potencia a buscar la plataforma más eficiente para reducir costos operativos y de energía.

Una IA más accesible de la mano de la inferencia

Según un informe de Grand View Research , el mercado de la inferencia está experimentando un rápido crecimiento impulsado por la gran necesidad de procesamiento de IA en tiempo real en numerosos sectores. “Las empresas confían cada vez más en la IA para analizar datos rápidamente y tomar decisiones instantáneas, lo que mejora la eficiencia operativa y la experiencia del cliente”, se lee en el reporte.

Para los negocios y la economía, apunta Feng, esta era de la inferencia representa cambios profundos, pues bajará el costo de la IA. Por ejemplo, una sola persona ahora puede desarrollar un sitio web empresarial completo utilizando agentes de bajo costo mensual.

“A diferencia del entrenamiento, que estaba limitado a las grandes tecnológicas, la inferencia impactará a todos los niveles, permitiendo que incluso pequeños negocios y particulares tengan sus propios agentes ejecutándose localmente”, comenta.

La capacidad de realizar inferencia de forma local (en dispositivos como estaciones de trabajo o PCs), agrega, también permitirá que las empresas mantengan su privacidad y datos locales seguros, evitando pagar por cada interacción (token) en la nube. Además, agrega que en un futuro la IA híbrida, donde el cómputo se distribuye entre dispositivos locales y la nube, facilitará que este proceso ocurra de manera fluida donde sea más conveniente en términos de rendimiento y privacidad.