Datos, algoritmos e inteligencia artificial: así predice Spotify lo que más te apetece escuchar

Elena Neira
Imagen del videoclip 'Te felicito', de Shakira y Rauw Alejandro
Imagen del videoclip 'Te felicito', de Shakira y Rauw Alejandro

Spotify

El éxito de las compañías basadas en la suscripción mensual se sustenta, en gran medida, en la cantidad de horas de contacto con el servicio que consiguen generar, todo un reto cuando el catálogo está plagado de miles de referencias. 

Para lograr dicho objetivo Spotify confía en una sofisticada arquitectura tecnológica con la que trata de impulsar el mayor número de horas de escucha posible. Y parece funcionar. Lo confirma su posición de mercado. La compañía, fundada en 2006, cuenta con 406 millones de usuarios activos, muy por delante de competidores como Apple Music, Tencent Music, Amazon Music, YouTube Music, Netease o Deezer. También su influencia en el descubrimiento musical por parte de sus usuarios (la compañía asegura que 1/3 de los artistas “descubiertos” tiene lugar a través de sus recomendaciones). 

En realidad, la fórmula de Spotify no es sustancialmente diferente a la de otros servicios de suscripción. Su funcionamiento se sustenta en 3 pilares básicos (datos, algoritmos e inteligencia artificial) y un objetivo: conseguir la mejor selección de contenidos posible, capaz de impulsar un flujo de escucha que acompañe al usuario desde que se levanta hasta que se acuesta. 

El verdadero reto de Spotify es la magnitud de su oferta, ya que su catálogo ronda los 70 millones de canciones y crece con una media de 60.000 nuevas incorporaciones al día.

Como plataforma que vive del tiempo de contacto con el cliente, conseguir emparejarlo con lo que le puede gustar es vital. La puerta de entrada a la música favorita se encuentra, para la mayoría de los usuarios, en la página de inicio, una interfaz compuesta de distintas selecciones personalizadas. 

Lo que Spotify hace es empaquetar canciones creando listas de reproducción, al uso de las analógicas cassettes. Listas como Descubrimiento semanal, Tu radar de novedades, Más cosas que te van o Hecho para ti se han convertido para muchos en la opción de escucha por defecto, reemplazando a la búsqueda activa. Pero hacerlas y que sean útiles no es tarea sencilla. Para confeccionarlas el sistema necesita una materia prima fundamental: datos, tanto del usuario como del propio contenido. 

15 inventos tecnológicos que crees que llevan toda la vida contigo pero que hace 15 años no existían

Todas las canciones que se incorporan a la oferta de Spotify se analizan una a una de forma pormenorizada. La plataforma revisa todos los metadatos que el proveedor facilita al darla de alta : título, fecha, nombre del intérprete/s, autor de la letra, productor, discográfica, fecha de lanzamiento, género y subgénero, idioma, instrumentos empleados, tipología de la canción (por ejemplo, si es una versión, un remix, acústica o instrumental), tipo de artista etc. Pero el análisis no se detiene ahí. 

La verdadera magia de Spotify no está tanto en la información que el archivo lleva asociado como en los datos que afloran mediante un análisis de las pistas de audio. Este es el verdadero ingrediente del éxito. 

Gracias al análisis del audio en bruto el sistema es capaz de aislar más características de cada canción: su estilo (por ejemplo, si tiene una o varias voces o si es instrumental), cómo las puede percibir el usuario (si son canciones para bailar, energéticas o tranquilas, entre otras cosas) e, incluso, el tipo de emoción, positiva o negativa, que despierta su escucha. Y todavía hay un tercer análisis, que recurre al "lenguaje natural" en base a, por ejemplo, la información que proporcionan las letras (por ejemplo, si hablan sobre una ruptura o sobre pasarlo bien) o cómo se refieren a ella en otros sitios externos, como blogs o webs especializadas.

La segunda fuente de datos fundamental para que el sistema de recomendación de Spotify funcione son los propios usuarios, a los que monitoriza en cada sesión, analizando toda la huella digital que generan, ya sea a través de acciones directas y explícitas (como temas guardados, canciones a las que se le ha dado “me gusta” o las listas compartidas) como indirectas (por ejemplo, la duración de las sesiones, las canciones que se reproducen en bucle, las que se saltan etc.). También se tiene en cuenta información para dar contexto, como la ubicación geográfica, la hora del día o el dispositivo de acceso. 

El sistema de recomendación 

Un podcast de Spotify

Unsplash / Eddie Pipocas

El sistema de recomendación de Spotify trabaja integrando toda la información obtenida de las dos fuentes de información (contenidos y usuarios)

El artífice de las recomendaciones de Spotify se llama BaRT (acrónimo de Bandits for recommendations as treatments), una inteligencia artificial que utiliza todo lo que el sistema aprende a partir de cada canción cargada y cada sesión de actividad para recomendar mejor. BaRT está diseñado para aprender y predecir, de ahí que sus dos principales mecanismos para validar (o descartar) las sugerencias que hace sean la tasa de clic y las probabilidades de reproducción. 

En la práctica, se apoya en 2 actividades. La primera, la explotación de los datos proporcionados por el propio usuario (lo que reproduce, lo que elude, sus artistas favoritos, sus hábitos de escucha). La explotación de datos es valiosa, pero tiene un punto ciego: necesita datos para funcionar, de ahí que si el usuario ha interactuado poco lo más probable es que el sistema no termine de atinar. 

Para corregir este problema, se emplea un segundo mecanismo, de exploración, que se basa en los puntos de contacto que el sistema encuentra entre las preferencias del usuario con las de otros usuarios, asumiendo que las combinaciones musicales de otros probablemente sean útiles. Este es un mecanismo esencial en el caso de nuevos usuarios, a la hora de recomendar temas de lanzamiento reciente o tras largos períodos de inactividad. 

Los 20 mejores podcasts que deberías escuchar, según la redacción de 'Business Insider España'

Las listas de reproducción de Spotify que vemos al arrancar la aplicación son el resultado de la actividad de cientos de algoritmos que tratan de conectar, con la mayor precisión posible, a cada usuario con aquello que la plataforma considera que querrá escuchar, siempre a partir de toda la información que sabe de las canciones y de los usuarios. 

El sistema trata de comprender cuál es la motivación tras cada elección, de ahí que variables como el "estado de ánimo" implícito en las elecciones, la cantidad de canciones saltadas, las características comunes de las playlists o los tiempos de escucha sean particularmente relevantes. Uno de los indicadores más valiosos, por ejemplo, es lo que sucede en los 30 primeros segundos de una pista. Cuando la reproducción supera esa marca, la canción genera automáticamente una asociación positiva y comienza a generar datos de los que se puede aprender. 

En la actualidad Spotify se encuentra inmerso en una nueva ofensiva para acaparar el negocio del podcast. Sin duda todo lo que ha aprendido en los últimos 16 años lo sitúa en una posición privilegiada. A estas alturas no solo condiciona lo que escuchamos y cómo lo escuchamos, sino también nuestra predisposición a aceptar las novedades que nos pone delante. Ese arco de influencia sobre la satisfacción y formación de nuestros gustos es lo que, al final, marca la diferencia. 

Conoce cómo trabajamos en Business Insider.