Cómo Siri, Alexa y Google Assistant perdieron la carrera de IA


En un martes lluvioso en San Francisco, los ejecutivos de Apple subieron al escenario en un auditorio abarrotado para presentar el iPhone de quinta generación. El teléfono, que se veía idéntico a la versión anterior, tenía una nueva característica que pronto hizo vibrar a la audiencia: Siri, un asistente virtual.

Scott Forstall, entonces jefe de software de Apple, presionó un botón del iPhone para llamar a Siri y lo aguijoneó con preguntas. A pedido suyo, Siri verificó la hora en París (“8:16 pm”, respondió Siri), definió la palabra “mitosis” (“División celular en la que el núcleo se divide en núcleos que contienen la misma cantidad de cromosomas”, dijo) y sacó una lista de 14 restaurantes griegos altamente calificados, cinco de ellos en Palo Alto, California.

“He estado en el campo de la IA durante mucho tiempo y esto todavía me deja boquiabierto”, dijo el Sr. Forstall.

Eso fue hace 12 años. Desde entonces, la gente ha estado lejos de sorprenderse con Siri y los asistentes de la competencia que funcionan con inteligencia artificial, como Alexa de Amazon y el Asistente de Google. La tecnología se ha mantenido estancada en gran medida, y los asistentes parlantes se han convertido en el blanco de las bromas, incluso en un sketch de “Saturday Night Live” de 2018 que presenta un altavoz inteligente para personas mayores.

El mundo de la tecnología ahora está entusiasmado con un tipo diferente de asistente virtual: los chatbots. Estos bots impulsados ​​por IA, como ChatGPT y el nuevo ChatGPT Plus de la empresa OpenAI de San Francisco, pueden improvisar respuestas a preguntas escritas en un cuadro de chat con presteza. La gente ha usado ChatGPT para manejar tareas complejas como codificar software, redactar propuestas comerciales y escribir ficción.

Y ChatGPT, que usa IA para adivinar qué palabra viene a continuación, está mejorando rápidamente. Hace unos meses, no podía escribir un haiku adecuado; ahora puede hacerlo con gusto. El martes, OpenAI presentó su motor de inteligencia artificial de próxima generación, GPT-4, que impulsa ChatGPT.

El entusiasmo en torno a los chatbots ilustra cómo Siri, Alexa y otros asistentes de voz, que alguna vez provocaron un entusiasmo similar, han desperdiciado su liderazgo en la carrera de la IA.

Durante la última década, los productos se toparon con obstáculos. Siri se topó con obstáculos tecnológicos, incluido un código torpe que tardó semanas en actualizarse con funciones básicas, dijo John Burkey, un exingeniero de Apple que trabajó en el asistente. Amazon y Google calcularon mal cómo se usarían los asistentes de voz, lo que los llevó a invertir en áreas con tecnología que rara vez valía la pena, dijeron exempleados. Cuando esos experimentos fallaron, el entusiasmo por la tecnología se desvaneció en las empresas, dijeron.

Los asistentes de voz son “tontos como una roca”, dijo Satya Nadella, director ejecutivo de Microsoft, en una entrevista este mes con The Financial Times, declarando que la IA más nueva marcaría el camino. Microsoft ha trabajado de cerca con OpenAI, invirtiendo $13 mil millones en la puesta en marcha e incorporando su tecnología al motor de búsqueda Bing, así como a otros productos.

Apple se negó a comentar sobre Siri. Google dijo que estaba comprometido a proporcionar un excelente asistente virtual para ayudar a las personas en sus teléfonos y dentro de sus hogares y automóviles; la compañía está probando por separado un chatbot llamado Bard. Amazon dijo que vio un aumento del 30 por ciento en la participación del cliente a nivel mundial con Alexa en el último año y que era optimista sobre su misión de construir IA de clase mundial.

Los asistentes y los chatbots se basan en diferentes tipos de IA. Los chatbots funcionan con lo que se conoce como grandes modelos de lenguaje, que son sistemas entrenados para reconocer y generar texto en función de enormes conjuntos de datos extraídos de la web. Luego pueden sugerir palabras para completar una oración.

En contraste, Siri, Alexa y Google Assistant son esencialmente lo que se conoce como sistemas de comando y control. Estos pueden comprender una lista finita de preguntas y solicitudes como “¿Qué tiempo hace en la ciudad de Nueva York?” o “Enciende las luces del dormitorio”. Si un usuario le pide al asistente virtual que haga algo que no está en su código, el bot simplemente dice que no puede ayudar.

Siri también tenía un diseño engorroso que requería mucho tiempo para agregar nuevas funciones, dijo Burkey, a quien se le asignó el trabajo de mejorar Siri en 2014. La base de datos de Siri contiene una lista gigantesca de palabras, incluidos los nombres de los artistas musicales y las ubicaciones. como restaurantes, en casi dos docenas de idiomas.

Eso lo convirtió en “una gran bola de nieve”, dijo. Si alguien quisiera agregar una palabra a la base de datos de Siri, agregó, “va en una gran pila”.

Entonces, las actualizaciones aparentemente simples, como agregar algunas frases nuevas al conjunto de datos, requerirían reconstruir toda la base de datos, lo que podría llevar hasta seis semanas, dijo Burkey. Agregar funciones más complejas, como nuevas herramientas de búsqueda, podría llevar casi un año. Eso significaba que no había camino para que Siri se convirtiera en un asistente creativo como ChatGPT, dijo.

Alexa y Google Assistant se basaron en una tecnología similar a la de Siri, pero las empresas tuvieron problemas para generar ingresos significativos con los asistentes, dijeron exgerentes de Amazon y Google. (En contraste, Apple usó con éxito a Siri para atraer compradores a sus iPhones).

Después de que Amazon lanzó Echo, un altavoz inteligente con tecnología de Alexa, en 2014, la compañía esperaba que el producto lo ayudara a aumentar las ventas en su tienda en línea al permitir que los consumidores hablaran con Alexa para realizar pedidos, dijo un exlíder de Amazon involucrado con Alexa. Pero aunque la gente se divirtió jugando con la capacidad de Alexa para responder a las indicaciones meteorológicas y configurar alarmas, pocos le pidieron a Alexa que ordenara artículos, agregó.

Es posible que Amazon haya invertido demasiado en la fabricación de nuevos tipos de hardware, como despertadores y microondas ahora descontinuados que funcionaban con Alexa, que se vendían al costo o por debajo del costo, dijo el exejecutivo.

La compañía también invirtió poco en la creación de un ecosistema para que las personas expandieran fácilmente las capacidades de Alexa, de la misma manera que lo había hecho Apple con su App Store, lo que ayudó a despertar el interés en el iPhone, dijo la persona. Si bien Amazon ofreció una tienda de “habilidades” para que Alexa controlara accesorios de terceros como interruptores de luz, era difícil para las personas encontrar y configurar habilidades para los parlantes, a diferencia de la experiencia sin fricciones de descargar aplicaciones móviles de las tiendas de aplicaciones.

“Nunca tuvimos ese momento de App Store para los asistentes”, dijo Carolina Milanesi, analista de tecnología de consumo de la firma de investigación Creative Strategies que fue consultora de Amazon.

A finales del año pasado, la división de Amazon que trabajaba en Alexa fue uno de los principales objetivos de los 18.000 despidos de la empresa, y varios altos ejecutivos de Alexa abandonaron la empresa.

Kinley Pearsall, una vocera de Amazon, dijo que Alexa era mucho más que un asistente de voz, y “somos tan optimistas sobre esa misión como siempre”.

Los fallos de Amazon con Alexa pueden haber llevado a Google por mal camino, dijo un exgerente que trabajó en Google Assistant. Los ingenieros de Google pasaron años experimentando con su asistente para imitar lo que podía hacer Alexa, incluido el diseño de parlantes inteligentes y pantallas de tabletas controladas por voz para controlar accesorios del hogar como termostatos e interruptores de luz. Posteriormente, la empresa integró anuncios en esos productos para el hogar, que no se convirtieron en una fuente importante de ingresos.

Con el tiempo, Google se dio cuenta de que la mayoría de la gente usaba el asistente de voz solo para una cantidad limitada de tareas simples, como iniciar temporizadores y reproducir música, dijo el exgerente. En 2020, cuando Prabhakar Raghavan, un ejecutivo de Google, se hizo cargo de Google Assistant, su grupo volvió a enfocar al compañero virtual como una característica destacada para los teléfonos inteligentes Android.

En enero, cuando la empresa matriz de Google despidió a 12.000 empleados, el equipo que trabajaba en sistemas operativos para dispositivos domésticos perdió el 16 por ciento de sus ingenieros.

Muchas de las grandes empresas de tecnología ahora están compitiendo para encontrar respuestas a ChatGPT. En la sede de Apple el mes pasado, la compañía celebró su cumbre anual de IA, un evento interno para que los empleados aprendan sobre su modelo de lenguaje grande y otras herramientas de IA, dijeron dos personas que recibieron información sobre el programa. Muchos ingenieros, incluidos miembros del equipo de Siri, han estado probando conceptos de generación de lenguaje cada semana, dijeron las personas.

El martes, Google también dijo que pronto lanzaría herramientas generativas de inteligencia artificial para ayudar a las empresas, los gobiernos y los desarrolladores de software a crear aplicaciones con chatbots integrados e incorporar la tecnología subyacente en sus sistemas.

En el futuro, las tecnologías de chatbots y asistentes de voz convergerán, dijeron expertos en IA. Eso significa que las personas podrán controlar los chatbots con el habla, y aquellos que usan productos de Apple, Amazon y Google podrán pedirles a los asistentes virtuales que los ayuden con sus trabajos, no solo con tareas como verificar el clima.

“Estos productos nunca funcionaron en el pasado porque nunca tuvimos capacidades de diálogo a nivel humano”, dijo Aravind Srinivas, fundador de Perplexity, una empresa emergente de IA que ofrece un motor de búsqueda impulsado por chatbot. “Ahora lo hacemos”.

cade metz reportaje contribuido.