Las grandes compañías tecnológicas quieren cambiar esto, y para dar el primer paso, dicen, lo primero es lograr que estos asistentes sean capaces de mantener con nosotros conversaciones fluidas que se desarrollen de forma natural.
Lenta evolución
¿Qué alternativas existen entonces para elevar el coeficiente intelectual de estos asistentes?Microsoft, por ejemplo, todavía no cuenta con un asistente virtual en su plataforma Windows Phone, pero la compañía está experimentando con una IA que ya opera en ascensores y computadoras de escritorio de su sede.
"La habilidad de un sistema a la hora de entender más ampliamente el contexto de una comunicación resulta ser muy importante", explicó
.
"Hay unas señales de contexto básicas; estas incluyen ubicación, hora del día, día de la semana, patrones de comportamiento de uso y el modo (estás conduciendo, caminando, sentado o en tu oficina)".
"El calendario de una persona puede ser una fuente rica en contexto, así como el correo electrónico".
Como un tango complejo
Según dice, para que una interacción sea natural el programa también necesita aprender a simular el ritmo y cadencia de los humanos al hablarse los unos a los otros.Para hacer esto, las computadoras deberían estar pensando en su respuesta mientras la persona todavía está hablando, en lugar de esperar a que terminen.
"Resulta que la conversación es más o menos como un tango muy, muy complejo, una danza entre dos personas".
"No involucra sólo hablar en turnos, como ves en los asistentes de celular de hoy en día. En realidad es una operación muy complicada, fluida, donde la gente habla, reflexiona y escucha una y otra vez, algunas veces haciendo todo a la vez".
Se cree que la IA diseñada por Microsoft podría estar basada en Cortana, uno de los personajes de su serie de videojuegos Halo y que ésta podría eser presentada en abril.
Paralingüística
Nuance, empresa especializada en dispositivos de reconocimiento de voz, dice que sus investigadores estudian actualmente lo que se conoce como "paralingüística", que analiza la forma en que los usuarios hablan en lugar de lo que dicen.
"Estamos analizando los elementos acústicos para ser capaces de detectar emociones en el habla", revela John West de Nuance.
"La entonación, lo que se conoce como prosodia (el tono utilizado cuando se habla) se desenvuelve bien cuando estás feliz. Si estás triste es más abrupta".
Según West, ya son capaces de introducir tonos de duda y otras señales no verbales. "Sin embargo, precisan ser cuidadosamente programadas porque tienen que entender dónde hacer las pausas, respiraciones y posiblemente una tos".
Aprender del usuario
Precisamente en este sistema se basa el dispositivo que está desarrollando bajo el nombre de Parlance y que funcionaría más o menos así:
-Humano: Quiero comer una pizza.
- IA: Perdón, pero no sé lo que es una pizza.
- Humano: Ok. ¿Sabes dónde puedo encontrar un buen restaurante italiano?
- IA: Sí, hay uno a 20 metros bajando la calle a tu derecha.
- Humano: Gracias.
Si el usuario parece satisfecho, dice Young, la computadora asocia este conocimiento a la base de datos.
"Así que la próxima vez que alguien le pregunta sobre una pizza sabe que se consiguen en un restaurante italiano. Y no se le ha dicho esto sino que lo aprendió a través de los mismos usuarios".
Young cree que la compra de la firma de IA DeepMind por parte de Google podría acelerar el desarrollo de este tipo de sistemas capaces de aprender por sí solos, mejorando así la calidad ofrecida.
No como en las películas
"Cuando llego en la mañana mi asistente de IA de mi puerta me reconoce y en una bonita voz británica dice: "Buenos días Eric". Y lo disfruto incluso sabiendo que es artificial", dice Horvitz.
"Así que creo que seremos capaces de crear personalidades muy atractivas. Sin embargo, a diferencia de lo que vemos en las películas, probablemente no lo verán en casa como muchos esperan o desean".