Tecnología

Amazon Nova: una serie de IAs que entienden hasta el sarcasmo

Esta familia de modelos es capaz de procesar texto, imágenes y video con emociones humanas complejas incluso para los humanos, como el sarcasmo.

mié 04 diciembre 2024 11:00 AM

Añadir Expansión en Google

La IA Amazon Nova ya entiende el sarcasmo, un lenguaje que a los humanos nos es difícil — La IA empieza a ser capaz de detectar lenguajes que incluso a los humanos les cuesta trabajo entender. (**Cortesía: AWS // Noah Berger/Noah Berger**)

RE l

@eresinaeresina

Las Vegas, Nevada. El sarcasmo es una forma de expresión que utiliza el contraste entre lo que se dice y lo que realmente se quiere comunicar, generalmente con la intención de criticar, ridiculizar o con un tinte de humor. Por lo general, se basa en el uso de palabras o frases que aparentemente elogian o apoyan algo, pero cuyo verdadero significado, entendido por el contexto o el tono, es opuesto.

Por ejemplo: si alguien llega tarde y se le dice “¡Qué puntualidad ejemplar!”, el sarcasmo reside en que lo que realmente se señala es la impuntualidad. Y es uno de los mayores retos que tienen los modelos de lenguaje avanzado y por ende el entrenamiento de Inteligencia Artificial.

Amazon Nova es una familia de modelos de IA generativa diseñados para ser multimodales, es decir, capaces de procesar texto, imágenes, y video. Estos modelos incluyen versiones específicas como Micro, Lite, Pro y Premier, optimizadas para distintas necesidades y con enfoque en la accesibilidad y eficiencia en costos. Además, Nova integra herramientas avanzadas como Canvas para la creación de imágenes mediante texto y Reel, que facilita la producción de videos de calidad cinematográfica.

Uno de los aspectos destacados de Nova es su proceso de "destilación", que permite ajustar modelos grandes a casos específicos, reduciendo costos sin sacrificar el rendimiento. Matt Garman, CEO de AWS, enfatizó en el evento Re:Invent la capacidad para aplicaciones como traducción de idiomas y detección de emociones o sarcasmo, lo que representa un avance significativo en el entendimiento contextual.

La iniciativa forma parte del esfuerzo de Amazon por democratizar la inteligencia artificial a través de AWS y Bedrock, su sistema de IA, ofreciendo herramientas accesibles incluso para pequeñas empresas, mientras impulsa una adopción más amplia de estas tecnologías

Vishal Sharma, vicepresidente de Inteligencia Artificial Generativa, señaló que los modelos de aprendizaje y discurso, hay elementos no verbales como risas, pausas o titubeos, que el modelo debe interpretar para expresar naturalidad.

“En cuanto al texto, la capacidad de los modelos para entender sarcasmo depende del preentrenamiento y los datos utilizados. Aunque aún no es perfecto, mejora constantemente. Además, nuestros modelos actuales pueden analizar imágenes, videos o textos y responder preguntas como "¿Qué significa esto?" o "¿Cuál es el estado de ánimo?". Nuestra meta a corto plazo es desarrollar modelos "cualquier a cualquier", que combinen texto, video, audio y otros formatos, reflejando la multimodalidad humana” precisó Sharma.

En comunicación, el sarcasmo suele depender del tono de voz, el lenguaje corporal o el contexto para que el receptor entienda la intención. En textos escritos, el sarcasmo puede ser más difícil de detectar, aunque a menudo se acompaña de signos como la exageración, las ironías obvias o, más recientemente, el uso de comillas o emojis. Sin embargo, interpretarlo es difícil incluso para los seres humanos.

Más cerca de clientes

Dentro de los mensajes que destacó Garman en su keynote está la democratización del uso de este tipo de tecnologías para cualquier tamaño de empresa, pues AWS también anunció nuevas herramientas para organizar y coordinar grupos de agentes de IA para que puedan llevar a cabo funciones más complejas.

Muchas de las tareas que las empresas quieren automatizar implican varios pasos, lo que significa que requieren una serie de agentes especializados para completarlas, por ello la llegada de este proceso de ‘destilación’.

“Como mencionó Matt, usamos un proceso llamado destilación. Esto permite tomar un modelo grande, ajustarlo a un caso específico y reducirlo a un modelo más pequeño y económico sin perder eficacia. Por ejemplo, puedes obtener resultados 70% más eficientes y significativamente más económicos”, precisó Sharma.

Los productos y servicios generaron 53,000 millones de dólares del producto interno bruto (PIB) en América Latina, según un estudio publicado recientemente por AWS y Telecom Advisory Services.

“Mirando el potencial y las oportunidades de innovación que tenemos, esta cifra podría superar los 700,000 millones de dólares en los próximos cinco años”, comentó Paula Bellizia, vicepresidenta para América Latina de AWS, en su primera participación en AWS re:Invent 2024.

Para estar más cerca con clientes, la empresa resaltó que en la región tendrá dos inversiones, los anunciados 5,000 millones de dólares en la creación de una nueva región AWS en México. Y 1,800 millones de dólares más en la ampliación y modernización de infraestructura en Brasil.