Amazon Nova es una familia de modelos de IA generativa diseñados para ser multimodales, es decir, capaces de procesar texto, imágenes, y video. Estos modelos incluyen versiones específicas como Micro, Lite, Pro y Premier, optimizadas para distintas necesidades y con enfoque en la accesibilidad y eficiencia en costos. Además, Nova integra herramientas avanzadas como Canvas para la creación de imágenes mediante texto y Reel, que facilita la producción de videos de calidad cinematográfica.
Uno de los aspectos destacados de Nova es su proceso de "destilación", que permite ajustar modelos grandes a casos específicos, reduciendo costos sin sacrificar el rendimiento. Matt Garman, CEO de AWS, enfatizó en el evento Re:Invent la capacidad para aplicaciones como traducción de idiomas y detección de emociones o sarcasmo, lo que representa un avance significativo en el entendimiento contextual.
La iniciativa forma parte del esfuerzo de Amazon por democratizar la inteligencia artificial a través de AWS y Bedrock, su sistema de IA, ofreciendo herramientas accesibles incluso para pequeñas empresas, mientras impulsa una adopción más amplia de estas tecnologías
Vishal Sharma, vicepresidente de Inteligencia Artificial Generativa, señaló que los modelos de aprendizaje y discurso, hay elementos no verbales como risas, pausas o titubeos, que el modelo debe interpretar para expresar naturalidad.
“En cuanto al texto, la capacidad de los modelos para entender sarcasmo depende del preentrenamiento y los datos utilizados. Aunque aún no es perfecto, mejora constantemente. Además, nuestros modelos actuales pueden analizar imágenes, videos o textos y responder preguntas como "¿Qué significa esto?" o "¿Cuál es el estado de ánimo?". Nuestra meta a corto plazo es desarrollar modelos "cualquier a cualquier", que combinen texto, video, audio y otros formatos, reflejando la multimodalidad humana” precisó Sharma.
En comunicación, el sarcasmo suele depender del tono de voz, el lenguaje corporal o el contexto para que el receptor entienda la intención. En textos escritos, el sarcasmo puede ser más difícil de detectar, aunque a menudo se acompaña de signos como la exageración, las ironías obvias o, más recientemente, el uso de comillas o emojis. Sin embargo, interpretarlo es difícil incluso para los seres humanos.