Google publica en la tienda gratis el reconocimiento de voz con IA "Edge Eloquent": utiliza Gemma con funcionamiento en el dispositivo móvil sin necesidad de conexión a Internet, lanzamiento inicial en iOS

動區BlockTempo

Google ha subido silenciosamente su aplicación gratuita de dictado por voz con IA sin conexión a la App Store de iOS esta semana: “AI Edge Eloquent”. Utiliza un modelo Gemma ASR de ejecución en el dispositivo, el audio no sale completamente del dispositivo y, de forma poco habitual, llegó primero a la plataforma iOS antes que a Android.
(Antecedentes: ¡Google lanzó el modelo abierto más inteligente Gemma 4! Cambia por completo a la licencia Apache 2.0; el rendimiento está a la altura de grandes IA de código cerrado)
(Aclaración de contexto: ¿romper el monopolio de NVIDIA? El modelo de IA más fuerte del mundo de Google “Gemma 3” usa 1 H100 y supera a DeepSeek y OpenAI)

Índice del artículo

Toggle

  • Hablar y convertirlo en texto; puedes usarlo con solo abrir la boca
  • iOS primero, Android después; la operación anormal de Google
  • Gemma entra en la vida diaria: validación de escenarios reales de IA en el dispositivo

Sin un evento y sin ningún anuncio oficial, Google ha subido “AI Edge Eloquent” a la App Store de iOS a comienzos de esta semana. Esta aplicación de dictado por voz con IA totalmente gratuita se centra en el reconocimiento de voz sin conexión; detrás funciona el modelo Gemma ASR (reconocimiento automático del habla) en el dispositivo de Google. Todo el procesamiento de audio se realiza localmente en el dispositivo, sin necesidad de conexión a la red.

Hablar y convertirlo en texto; puedes usarlo con solo abrir la boca

La lógica de funcionamiento de “AI Edge Eloquent” es bastante intuitiva: al abrir la App y hablarle al micrófono, la pantalla muestra texto y la forma de onda del sonido en tiempo real. Después de detener la grabación, la App filtra automáticamente muletillas conversacionales como “eh”, “ah” y corrige las pausas, ordenando el contenido dictado en texto limpio y listo para usar, y además lo copia automáticamente al portapapeles.

El diseño de privacidad también es uno de los puntos de venta principales de esta App. En el modo 100% sin conexión, los datos de audio no salen del iPhone del usuario y no se envían a ningún servidor. Google también ofrece una opción de “modo en la nube”: el reconocimiento de voz sigue realizándose en el dispositivo, y solo el texto reconocido (no el audio original) se envía al modelo en la nube de Gemini para una depuración adicional, con una calidad mayor.

El servicio completo es totalmente gratuito: sin cuota de suscripción y sin límites de uso.

iOS primero, Android después; la operación anormal de Google

Al mismo tiempo, los medios tecnológicos observaron un fenómeno poco común: casi todos los productos de Google se lanzan primero en Android. Especialmente en funciones de IA en el dispositivo, normalmente vienen acompañadas de dispositivos Pixel y del modelo Gemini Nano como prioridad. Esta vez, “AI Edge Eloquent” va en sentido contrario: en la descripción de la App incluso se escribe directamente que la versión de Android se lanzará pronto.

Hay analistas que ofrecen dos interpretaciones. La primera es una prueba de mercado: Google posiblemente eligió a propósito iOS, que no es su “plataforma principal”, para realizar un experimento. Así, sin interferir con el ecosistema de Android, podría evaluar la aceptación de los consumidores hacia el dictado por voz con IA en el dispositivo y los hábitos de uso.

La segunda es que la tecnología ya estaba lista: el modelo Gemma ASR de iOS podría haber alcanzado antes que el de Android el nivel de avance óptimo para ser usable. Google eligió publicarlo directamente, en lugar de esperar a que ambas plataformas salgan sincronizadas.

Gemma entra en la vida diaria: validación de escenarios reales de IA en el dispositivo

Desde el punto de vista técnico, el significado de “AI Edge Eloquent” no es solo el de una herramienta de dictado. Gemma es la serie de modelos ligeros de IA de código abierto de Google, diseñada para operar de manera eficiente en entornos con recursos limitados como los dispositivos móviles; y AI Edge es el marco de Google que permite a los desarrolladores ejecutar modelos de aprendizaje automático en el dispositivo.

Esta App básicamente traslada la capacidad de inferencia en el dispositivo de Gemma a las situaciones cotidianas de los consumidores.

Para los desarrolladores, AI Edge Eloquent también es un ejemplo de referencia: muestra cómo aterriza el modelo Gemma en productos de consumo y cómo una arquitectura híbrida de modo sin conexión y en la nube puede equilibrar privacidad y calidad.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.
Comentar
0/400
Sin comentarios