Meta y Google apuestan por los asistentes de voz con IA. ¿Despegarán?

7 min read

Las gafas de Meta toman una foto cuando dices: «Hola Meta, toma una foto». Una pequeña computadora que se adjunta a tu camisa, Ai Pin, traduce idiomas extranjeros a tu lengua materna. La pantalla artificialmente inteligente tiene un asistente virtual con el que se habla con un micrófono. El año pasado, OpenAI actualizó su chatbot ChatGPT para responder con voz, y Google lanzó recientemente Gemini, que reemplaza al asistente de voz en los teléfonos Android, apuestan las empresas de tecnología. en un renacimiento de los asistentes de voz años después de que la mayoría de la gente decidiera que hablar con las computadoras no era bueno. ¿Funcionará esta vez? Tal vez, pero puede que lleve algo de tiempo. Muchas personas todavía no han utilizado asistentes de voz como Alexa de Amazon, Siri de Apple y el Asistente de Google, y la mayoría dice que no quiere que los vean hablando con ellos en público. En estudios realizados en la última década También rara vez uso asistentes de voz. Y en mi último experimento con las gafas de Meta, que tienen cámaras y parlantes para brindarte información sobre tu entorno. He llegado a la conclusión de que hablar con un ordenador delante de padres e hijos en un zoológico sigue siendo muy incómodo. Me hace preguntarme si esto alguna vez se sentirá normal. No hace mucho, hablar por teléfono con unos auriculares Bluetooth hacía que la gente pareciera negra. Pero ahora que cualquiera puede hacerlo, veremos mucha gente caminando por ahí. ¿Y hablar con el ordenador como en una película de ciencia ficción? Planteo esta pregunta a expertos e investigadores en diseño. Y el consenso es claro: porque el nuevo sistema de inteligencia artificial mejora la capacidad de los asistentes de voz para comprender lo que De hecho, estamos hablando y ayudando. Es probable que hablemos con nuestros dispositivos con más frecuencia en el futuro cercano, pero aún faltan años para hacerlo en público. Esto es lo que debes saber. ¿Por qué los asistentes de voz se están volviendo más inteligentes? Nuevo asistente de voz Impulsado por Inteligencia Artificial Generativa Utiliza estadísticas y algoritmos complejos para adivinar qué palabras van juntas. Es similar a la función de autocompletar de tu teléfono. Eso les permite usar más contexto para comprender solicitudes y preguntas de seguimiento que los asistentes virtuales como Siri y Alexa, que solo pueden responder un conjunto limitado de preguntas. Por ejemplo, si le dices a ChatGPT: «¿De qué vuelos vienen?». ¿De San Francisco a Nueva York la próxima semana?”, y seguir adelante. «¿Cómo está el clima allí?» y «¿Qué debo traer?»: los chatbots pueden responder esas preguntas porque conectan palabras para comprender el contexto de la conversación (The New York Times demanda a OpenAI y Microsoft, que fue su último socio). año Utiliza artículos de noticias protegidos por derechos de autor sin permiso para entrenar sus chatbots). El asistente de voz más antiguo, Siri, responde a una base de datos de comandos y preguntas para cuya comprensión está programado. Falla a menos que uses palabras específicas, como «¿Cómo es el clima en Nueva York?» y «¿Qué debo empacar para mi viaje a Nueva York?». Es como la forma en que la gente se habla entre sí. La razón principal por la que la gente abandona los asistentes de voz como Siri y Alexa es porque las computadoras no pueden hacerlo. Entiende mucho de lo que te preguntan. Y es difícil saber qué preguntas funcionan, Dimitra Vergyri, directora de tecnología del habla en SRI, el laboratorio de investigación detrás de la versión inicial de Siri antes de que Apple la adquiriera, dijo que la IA generativa aborda muchos problemas que los investigadores han enfrentado durante muchos años. La tecnología permite a los asistentes de voz comprender el habla espontánea y responder con respuestas útiles, dijo John Burkey, un ex ingeniero de Apple que trabajó en Siri en 2014 y ha sido un crítico abierto de la misma. Dicha persona dijo que cree eso porque la IA era. creado artificialmente. Es más fácil para las personas obtener ayuda de las computadoras. Pronto será más probable que hablemos con nuestros asistentes, y una vez que comencemos a hacerlo, será suficiente. Eso podría convertirse en la norma». «Siri tiene un tamaño limitado; sólo sabe, tiene muchas palabras», dijo. «Pero pueden pasar años antes de que llegue la nueva bola». será ampliamente utilizado. Debido a que causan nuevos problemas, los chatbots, incluidos ChatGPT, Gemini de Google y Meta AI, son propensos a sufrir «alucinaciones», que ocurren cuando crean cosas porque no pueden encontrar la respuesta correcta. Cometen errores con tareas básicas como contar y resumir información de la web. Cuando un asistente de voz ayuda Y cuando no lo hacen Aunque la tecnología del habla está mejorando Pero es poco probable que hablar reemplace o reemplace las interacciones tradicionales con la computadora. con teclado los expertos dicen Las personas ahora tienen razones de peso para hablar con sus computadoras en ciertas situaciones cuando están solas, como configurar un mapa de destino mientras conducen. Sin embargo, en público, hablar con un asistente no sólo puede hacerte parecer raro, sino que muchas veces esto no lo es. posible. Cuando usé lentes Meta en el supermercado y les pedí que identificaran un producto, El comprador que escuchaba a escondidas respondió descaradamente: «Eso es un nabo». Todavía no quieres compartir tu correo electrónico confidencial del trabajo con las otras personas en el tren. También vale la pena considerar que el asistente de voz lea el texto en la barra en voz alta. “La tecnología resuelve problemas”, dice Ted Selker, un veterano en diseño de productos que trabajó en IBM y Xerox PARC. “¿Cuándo solucionamos un problema? ¿Y cuándo estamos creando problemas?” Pero hablar con una computadora te ayudará tanto que es fácil. Que no te importa lo extraño que les parezca a otras personas, dice Carolina Milanesi, analista de Creative Strategies, una firma de investigación. Mientras camina hacia la próxima reunión de la oficina Pedirle al asistente de voz que haga preguntas sobre las personas que está a punto de conocer puede ser útil. Al caminar, preguntarle al asistente de voz dónde girar es más rápido que detenerse para ver un mapa. Mientras visitaba el museo Sería fantástico si el asistente de voz pudiera darte una lección de historia sobre el cuadro que estás mirando. Algunas de estas aplicaciones ya se están desarrollando con nueva tecnología de inteligencia artificial. Cuando probé los últimos productos habilitados para voz, Puedo ver ese futuro. Mientras grababa un video de mí mismo haciendo pan y usando los lentes de Meta, decir «Hola Meta, graba un video» fue útil porque tenía las manos ocupadas, y pedirle a Ai Pin de Humane que personalizara mi lista de tareas pendientes fue más conveniente. pantalla del teléfono “Mientras caminas Es un punto interesante”, afirma Chris Schmandt, que lleva décadas trabajando en interfaces de voz en Laboratorio de medios del Instituto Tecnológico de Massachusetts Cuando se convirtió en uno de los primeros usuarios de un teléfono celular hace unos 35 años, la gente lo miraba fijamente mientras caminaba por el campus del MIT y hablaba por teléfono. Ahora esto es normal. Creo que llegará el día en que la gente ocasionalmente hable con sus computadoras cuando salgan. Pero llegará muy lentamente.

You May Also Like

More From Author

+ There are no comments

Add yours