Esta sería la primera fase de un plan más ambicioso de OpenAI, el cual consiste en que después del chip inicial, los ingenieros de la empresa comiencen a desarrollar procesadores cada vez más avanzados con capacidades más amplias en cada nueva iteración.
Una muestra de que podría ser posible este cronograma de trabajo es el plan de OpenAI de enviar su diseño a TSMC, el cual ya se cumplió este año y demuestra que la startup ha avanzado rápidamente en su primer diseño, un proceso que a otras compañías de chips les puede llevar años.
El chip está siendo diseñado por el equipo interno de OpenAI dirigido por Richard Ho, que se ha duplicado en los últimos meses a 40 personas, en colaboración con Broadcom. Ho se unió a OpenAI hace más de un año procedente de Google, donde ayudó a dirigir el programa de chips de inteligencia artificial personalizados del gigante de las búsquedas.
Meta también le entra a la fabricación de chips
La empresa de Mark Zuckerberg también está mirando este negocio y por ello tiene la intención de adquirir FuriosaAI, una empresa surcoreana que diseña chips para centros de datos y la cual fue fundada por June Paik, exingeniero de hardware que trabajó en Samsung y AMD.
Esta compañía ya tiene relevancia en el panorama de los chips, pues ha trabajado con TSMC en la producción de sus semiconductores RNGD, los cuales se produjeron el año pasado, han ejecutado modelos Llama de Meta y tiene previsto iniciar la producción masiva a mediados de este año.
La razón por la cual esta empresa no ha tenido demasiado revuelo en el panorama tecnológico es la falta de atención en comunicar sus logros, ya que el equipo está formado en un 95% por ingenieros, “por lo que el marketing no ha sido exactamente una prioridad”, detalló Paik en su blog .
Sin embargo, la firma ha conseguido alrededor de 115 millones de dólares a través de diversos inversores surcoreanos, como Naver o DSC Investment, así como otros provenientes de Estados Unidos, India y Japón.
La misión de reducir la dependencia a Nvidia
Los chips de Nvidia son los más socorridos en la industria y tienen una participación de mercado de aproximadamente el 80%. Pero el aumento de los costos y la dependencia de un único proveedor han llevado a clientes importantes como Meta y OpenAI a explorar alternativas internas o externas a los chips de Nvidia.
Para entrenar y ejecutar los grandes modelos de lenguaje se necesita de una gran potencia de cómputo, algo en lo que Nvidia supo desarrollar durante los últimos años a partir de su conocimiento de la industria de las Unidades de Procesamiento Gráfico (GPU).
OpenAI, por ejemplo, ha buscado la forma de generar sus propios chips y así reducir los gastos de entrenamiento. En un momento, la empresa consideró realizar todo el proceso, desde el diseño hasta la fabricación de los procesadores, pero abandonó el barco, debido a las altas cantidades de dinero y tiempo que necesita para alcanzar tal objetivo.
Una producción típica cuesta decenas de millones de dólares y se necesitarán aproximadamente seis meses para producir un chip terminado, a menos que OpenAI pague sustancialmente más por una fabricación acelerada. No hay garantía de que el silicio funcione en la primera producción y, en caso de falla, la empresa tendría que diagnosticar el problema y repetir el paso de producción.
Entre las compañías que representan una competencia para Nvidia se encuentran AMD y más atrás Intel. Sin embargo, están surgiendo startups, como las californianas Groq y MatX, la israelí Hailo, la canadiense Taalas o la británica Graphcore, las cuales se especializan en producir chips pensados exclusivamente para grandes modelos de lenguaje y están llamando la atención de las grandes tecnológicas.
Chips cuánticos, una nueva frontera para las Big Tech
El salto cuántico es el siguiente paso que quieren dar las empresas y algunas como Microsoft y Google ya están marcando el ritmo con sus innovaciones. Microsoft dio a conocer esta semana a Majorana 1, la primera unidad de procesamiento cuántico del mundo, capaz de escalar un millón de qubits en un solo chip.
En diciembre, Google también reveló su chip Willow, capaz de realizar un desafío computacional en menos de cinco minutos, un proceso que supera el de las supercomputadoras más rápidas del mundo.
De acuerdo con el director de Google Quantum AI, Hartmut Neven, este nuevo chip es importante porque permite reducir los errores cuánticos que los investigadores del campo han buscado acelerar durante casi 30 años.
Según las pruebas que realizó Google, Willow realizó un cálculo en menos de cinco minutos, mientras que a una de las supercomputadoras más rápidas del mundo le tomaría 10 septillones de años, un número superior a la edad del universo.