Las voces para los asistentes inteligentes

Las  voces para los asistentes inteligentes

La  elección  de  la  voz  de  es  de  las  cosas  más  complicadas  en  el  mundo  de  la  inteligencia  artificial.  El elegido  para  ser  la  voz del  asistente  debe  ser capaz  de  leer  y  grabar  un  guión  amplio  y  complejo  de manera  consistente  y  clara,  es  seleccionado  de  entre  una  base  de  25  personas aproximadamente.

La  voz  seleccionada  además  de  la  consistencia  y  la  claridad,  debe  tener  cuidado  en  el  volumen,  la intensidad,  la  velocidad    con  que  graba;  además  debe  ser  capaz  de  estar  grabando  entre  cuatro  y seis horas  seguidas.   

Nauce  es  una  empresa  que  desarrolla  tecnología  IVR  por  sus  siglas  en  inglés  Interaction  Voice Response  para  varias  empresas  en  el  mundo.  Esta  compañía  diseña  un  sistema  de  conversación entre un  humano  y una  computadora, esto  es una  tecnología  que  lleva  20  años.

Algunos  estudios  mencionan  que  las  personas  interactúan  con  las  máquinas  como  si  fueran humanos.  Sin  embargo,  la  mayor  complejidad  es  que  la  persona  se  sienta  cómoda  hablando  con los dispositivos  o estos  asistentes  virtuales, sin  tener  frases  o códigos tan  estructurados. 

Susan  Bennet,  locutora  estadounidense  de  poco  más  de  sesenta  años,  es  quien  da  voz  a  Siri,  la asistente  virtual  de  Apple.  Además  de  Siri  de  Apple,   existen  otros  asistentes  virtuales  para  los sistemas  operativos  y/o  aplicaciones  más  populares  actualmente.  Por  ejemplo,  para  Google  está  el Google Assistant;  para  el sistema  Android está  Cortana,  para  Amazon  es Alexa.

Stone  Temple  realizó  algunas  pruebas  a  los  asistentes  virtuales  para  ver  qué  tan  hábiles  eran, realizando  preguntas  que  esperaban  ser  respondidas  y  además  si  éstas  eran  correctas.  El  ganador para  el  número  de  respuestas  contestadas  fue  Google  Asistant,  seguido  por  Cortana  y  por  último Alexa;  sin  embargo,  lo  más  interesante  es  que  las  respuestas  sean  correctas,  Google  Asistant se llevó  el  primer  lugar  nuevamente  con  el  90%  de  respuestas  correctas,  segundo  lugar  Alexa  con  el 87  %  y  en  último lugar quedo Siri con  el 62%.

Stone  Temple  evaluó  cuál  de  los  cuatro  asistentes  es  más  inteligente  desde  una  perspectiva  de conocimiento,  pues  los  cuatro  tienen    capacidades  para  tomar  acciones  en  nuestro  nombre  como  hacer  una  reservación  en  un  restaurante,  o  de  un  vuelo. 

Pero  ¿cómo hicieron  este  estudio? 

En  esta  comparación  se realizó  5  mil  preguntas,  que se uso  de  un  estudio  hecho  anteriormente  en  el que  evaluó  Google  Home y  Amazon  Echo,  y  evaluó  los  resultados  para  los  asistentes  virtuales  con cinco  criterios.   

  • Si respondieron  verbalmente
  • Si recibió  la respuesta  de  una  base  de  datos
  • Si la  respuesta  proviene  de  una  fuente  externa  como Wikipedia
  • Qué tan  frecuente  no  entendió la  pregunta
  • Cuando el dispositivo trato de  responder la presunta, pero simplemente contestó mal

Hablando  de  asistentes  virtuales  más  “personalizados”  existe  Jarvis,  quién  es  el  asistente  virtual  de Mark  Zuckerberg,  quien  es  algo  así  como  su  mayordomo.  El  detalle  curioso  de  Jarvis  es  que  no  es una  voz  neutral  como  se  menciona  al  inicio  de  este  artículo,  Jarvis  tiene  la  voz  del  actor  Morgan Freeman.

La  mayoría  de  las  empresas  que  buscan  un  servicio  de  grabación  de  voces  para  inteligencia artificial  tienden  a  buscar  voces  neutrales,  puesto  que  uno  de  los  mayores  problemas  con  la inteligencia  artificial  es  que  la  gente  se  sienta  cómoda  con  ella,  y  esto  incluye  sentirse  cómodos hablando  con  los  dispositivos.  Por  ello  las  empresas  dedicadas  a  la  grabación  de  voces  con  ese  fin, deben  tomar  en  cuenta  la  cultura  e  incluso  la  zona  geográfica,  pues  estudios  también  demuestran que  dependiendo  de  factores  como  los  mencionados,  una  voz  puede ser  más  o  menos aceptable.   



There are no comments

Add yours