Google DeepMind presentó Gemini Robotics: ¿cómo funcionan estos robots humanoides?

Google DeepMind presentó el 12 de marzo dos nuevos modelos de inteligencia artificial (IA) que, de acuerdo con la compañía, sientan las bases de una nueva generación de robots útiles: Gemini Robotics y Gemini Robotics-ER.

Ambos modelos, basados en su IA Gemini 2.0, permiten a diversos robots realizar, en el mundo real, una gama de tareas más amplia.

El primero es un modelo avanzado de visión-lenguaje-acción (VLA) que incorpora acciones físicas como una nueva modalidad para controlar directamente a los robots.

Así, Gemini Robotics puede abordar tareas extremadamente complejas y de varios pasos que requieren una manipulación precisa, como plegar un origami o meter un bocadillo en una bolsa con cierre de zip, explica Google en su blog.

Desarrollaron una piel artificial capaz de detectar estímulos sensoriales — iStock

Las necesidades de la IA para robótica

Para ser útiles para las personas, los modelos de IA para robótica necesitan tres cualidades principales, una de ellas es ser generales, es decir, capaces de adaptarse a diferentes situaciones.

Además, ser interactivos o con capacidad para comprender y responder rápidamente a instrucciones o cambios en su entorno; y ser diestros, que quiere decir poder realizar las tareas que las personas generalmente hacen con las manos y los dedos, como manipular objetos con cuidado.

“Si bien nuestro trabajo previo demostró avances en estas áreas, Gemini Robotics representa un avance sustancial en el rendimiento en los tres ejes, acercándonos a robots verdaderamente de propósito general”, destacó Google.

Dado que los robots vienen en todas las formas y tamaños, Gemini Robotics ha sido diseñado para adaptarse fácilmente a diferentes tipos de robots.

Sobre Gemini Robotics-ER

Gemini Robotics-ER es un modelo de visión-lenguaje (VLM) con una comprensión espacial avanzada, que permite a los expertos en robótica ejecutar sus propios programas utilizando el razonamiento corporal de Gemini.

Así, este modelo mejora “con creces” capacidades como la de apuntar y la detección 3D para, por ejemplo, cuando se le muestra una taza de café, el modelo pueda intuir un agarre adecuado para cogerla por el asa y una trayectoria segura para acercarse a ella.

Estas capacidades de razonamiento, conseguidas al incorporar Gemini a ambos modelos, permiten a los diversos robots realizar una gama más amplia de tareas en el mundo real, destacó la compañía, que se ha asociado con Apptronik para crear esta próxima generación de robots humanoides.

Asimismo, también están trabajando con grupos probadores de confianza para guiar el futuro de Gemini Robotics-ER.

“Esperamos explorar las capacidades de nuestros modelos y seguir desarrollándolos para que se apliquen en el mundo real”, resaltó la publicación de la empresa.

Cómo ha avanzado Google es sus modelos con IA

Desde Google DeepMind describen que han avanzado en la forma en que los modelos Gemini resuelven problemas complejos mediante razonamiento multimodal en texto, imágenes, audio y video. Sin embargo, hasta ahora, estas capacidades se han limitado en gran medida al ámbito digital.

La compañía resaltó que para que la IA sea útil para las personas en el mundo físico, deben demostrar razonamiento corporal (la capacidad similar a la humana de comprender y reaccionar al mundo que nos rodea), así como actuar con seguridad para realizar tareas.

Google anunció un “modo con IA” en su buscador

El 5 de marzo, Google anunció el lanzamiento de un “modo con inteligencia artificial” en su buscador. Se trata de una pestaña, como la de imagen o la de noticias, que funciona como un chatbot.

Por el momento, esta herramienta solo es “un experimento preliminar” para los suscriptores de Google One AI Premium.

Google lanzará Gemini: ¿en qué consiste esta nueva IA?

Google aclaró que como cualquier producto de inteligencia artificial que está iniciando “no siempre lo harán bien”.

“Por ejemplo, si bien nuestro objetivo es que las respuestas de IA en la búsqueda presenten información en función de lo que está disponible en la web, es posible que algunas respuestas puedan adoptar una personalidad o reflejar una opinión particular sin querer”, avisa en su comunicado la empresa.

De acuerdo con Google, el mayor problema de la IA generativa son las alucinaciones, que es cuando la inteligencia artificial da una respuesta bien estructurada, pero falsa.

Con información de EFE

La entrada Google DeepMind presentó Gemini Robotics: ¿cómo funcionan estos robots humanoides? se publicó primero en El Diario.

Google DeepMind presentó Gemini Robotics: ¿cómo funcionan estos robots humanoides?

Inspirada en un perro víctima de crueldad, Colombia aumenta penas por maltrato animal

En imágenes: protestas de jubilados en Argentina dejan al menos 20 heridos y más de 100 detenidos

elirreverente

En imágenes: protestas de jubilados en Argentina dejan al menos 20 heridos y más de 100 detenidos

Manténgase conectado

4K Carwash: El servicio de lavado de autos a domicilio que transforma tu vehículo en Miami

Renato Cisneros aborda los dilemas de la migración en su último libro: “Todo migrante vive dos vidas”

Los Ángeles, cercada por el fuego: la ciudad amanece con tres enormes incendios, dos muertos y 70.000 evacuados

Oposición venezolana propone reforma energética, busca elevar presión extranjera sobre Maduro

Kim Jong-un acusa a EEUU de avivar la tensión y advierte de una guerra nuclear

Maestras latinas en EE.UU., las preferidas en el cuidado infantil

¿Quién es Pam Bondi, la nominada de Trump para secretaria de Justicia?

Madre colombiana en campaña contra conductores ebrios en EEUU: “nuevas tecnologías pueden salvar miles de vidas”

El plan de tregua en Ucrania coloca a Putin ante el dilema de enfadar a Trump o a los nacionalistas rusos

¿Cómo quedaron los cruces de los cuartos de final de la Champions League?

Sobreviviendo a Michael Jackson

En imágenes: protestas de jubilados en Argentina dejan al menos 20 heridos y más de 100 detenidos

Noticias Recientes

El plan de tregua en Ucrania coloca a Putin ante el dilema de enfadar a Trump o a los nacionalistas rusos

¿Cómo quedaron los cruces de los cuartos de final de la Champions League?

Sobreviviendo a Michael Jackson

En imágenes: protestas de jubilados en Argentina dejan al menos 20 heridos y más de 100 detenidos

Categorias

Noticias Recientes

El plan de tregua en Ucrania coloca a Putin ante el dilema de enfadar a Trump o a los nacionalistas rusos

¿Cómo quedaron los cruces de los cuartos de final de la Champions League?