Как алгоритмы делают Spotify лучшим музыкальным сервисом

Spotify наконец-то официально пришёл в Россию, ну а мы решили рассказать, что же делает этот стриминговый сервис таким особенным. Предлагаем вашему вниманию перевод статьи о работе его алгоритмов — на них и держится вся магия.


Набор мощных алгоритмов использует вашу музыку и ваши личные данные, чтобы сформировать весь ваш музыкальный экспириенс.

Spotify делает всё, чтобы заставить вас слушать как можно больше музыки.

Компания создала алгоритмы для управления всем: от вашего хоумскрина до плейлистов вроде «Discover Weekly». Spotify продолжает экспериментировать с новыми способами понимания музыки и того, почему люди любят определённые песни или жанры.

Пока Apple Music, Amazon Prime Music и Google Music полагаются на созданные сообществом и кураторами плейлисты, Spotify настраивает и расширяет музыкальные знания. Этим он и отличаются от конкурентов. Компания полагается на алгоритмы, потому что это единственный способ создать уникальный музыкальный экспириенс для каждого из более чем 286 миллионов пользователей.

Главный экран приложения Spotify — яркий пример того, как алгоритмы определяют ваш музыкальный вкус. Его цель — помочь пользователю быстро найти то, что ему понравится слушать. Об этом рассказала в своей презентации директор Spotify Research Мунии Лалмас-Роеллек на веб-конференции.

Она объяснила, что домашний экран управляется AI-системой под названием BaRT («Bandits for Recommendations as Treatments»). Задача системы — организовать каждый хоумскрин индивидуально для каждого пользователя.

Экран включает в себя «полки» — ряды плейлистов, которые следуют определенным темам. Порядок отображения плейлистов на этих «полках» также контролирует система.

Система BaRT является центральным балансирующим процессом Spotify. Вся его цель — дать вам музыку, которая понравится. Опираясь на вашу предыдущую активность, Spotify постоянно рекомендует новую, свежую музыку, чтобы вы не зацикливались на прослушивании одного и того же.

Система может быть сведена к двум понятиям: использовать и исследовать.

Использует — информацию о пользователе: историю прослушиваний, песни, которые вы пропустили или лайкнули, плейлисты, которые вы создали, вашу активность в социальных сетях и даже ваше местоположение.

Исследует — информацию об остальном мире: плейлисты и исполнители, похожие на тех, что вы слушали, популярность других исполнителей и многое другое.

Не менее важно, как приложение объясняет свой выбор пользователям. Названия «полок», например «Вернуться в прошлое» или «Больше того, что вам нравится», говорят пользователю, почему рекомендуются эти конкретные списки воспроизведения.

Spotify обнаружила, что объяснения имеют решающее значение для пользователей (согласно исследовательской работе BaRT 2018 года).

Успех для BaRT измеряется тем, слушаете ли вы музыку на «полках» и как долго вы это делаете. Согласно презентации, за чуть более чем 30 секунд алгоритм определяет потоковую передачу песни как правильную рекомендацию. Чем дольше вы слушаете рекомендуемую музыку, тем рекомендация лучше.

В интервью 2015 года с Quartz директор по продуктам Spotify Мэтью Огл, который с тех пор покинул компанию, сказал, что пропуск трека до 30-секундной отметки равняется дизлайку.

Существует не так много академических работ, подробно описывающих механику плейлиста «Discover Weekly». В 2015 году сотрудники Spotify сделали небольшую техническую презентацию об этой функции. Также в статье Quartz Огл делает небольшой обзор системы.

«Discover Weekly» — это 30 песен из плейлистов других людей с похожими на ваши музыкальными предпочтениями. Песни для плейлиста отбираются по двум признакам:

  1. звучат буквально так же, как ваши любимые;
  2. недавно упоминались в музыкальных блогах.

Брайан Уитмен, соучредитель The Echo Nest (стартап, приобретённый Spotify в 2014 году за 100 миллионов долларов для улучшения рекомендательных алгоритмов), написал в 2012 году, что его служба ежедневно просматривает более 10 миллионов связанных с музыкой веб-страниц, чтобы понять, что происходит в мире музыки.

«Каждое слово, написанное в Интернете о музыке, проходит через наши системы. Они ищут описательные термины, фразы и прочий текст».

пишет Уитмен.

Стажёр Spotify Сандер Дилеман, который работал в компании в 2014 году и занимался фундаментальной работой, анализируя слуховое сходство музыки, также объяснил алгоритм аудио-анализа в своём личном блоге.

Первоначальная проблема заключалась в том, что новая музыка загружалась в Spotify каждый день, но не было системы, которая бы рекомендовала пользователям музыку, созданную неизвестными исполнителями. Коллаборативная фильтрация (метод рекомендации музыки, которая нравится людям, имеющим сходные музыкальные интересы) не работает, если никто не знает артиста. Дилеман называет это «проблемой холодного старта».

Решением был анализ самого аудиофайла и обучение алгоритма распознавать нужные аспекты музыки. Некоторые эксперименты, которые проводил Дилеман, идентифицировали такие конкретные аспекты песен, как гитарный дисторшн, в то время как другие могли распознавать такие абстрактные идеи, как жанр.

Эта система теперь является важным элементом плейлиста «Discover Weekly», поэтому вы можете увидеть в рекомендациях артиста, о котором никогда не слышали.

У Spotify алгоритмы спрятаны повсюду. Кроме рекомендательных алгоритмов, которые приводят в действие ваш хоумскрин и плейлист «Discover Weekly», есть меньшие инструменты, о которых пользователи вряд ли подозревали.

Взять, к примеру, автоматическое продолжение списка воспроизведения. Эта функция анализирует песни в определённом плейлисте и пытается предсказать музыку, которая могла бы быть в нём — как если бы человек, который создал плейлист, просто продолжал бы добавлять в него музыку.

Spotify захотелось по-новому взглянуть на то, как должна строиться эта функция, поэтому компания собрала массив данных о плейлистах, сгенерированных миллионом пользователей Spotify. Эти данные использовались для понимания черт того, что люди считают хорошим набором треков.

В компанию были приглашены многие исследователи АI. На отраслевой конференции 2018 года они пытались помочь Spotify решить проблему и представить свои решения. По результатам анализа, проведенного организаторами после конкурса, вокруг проекта сформировалось более 100 академических и отраслевых команд.

Исследователи Spotify также разрабатывают способы обнаружения кавер-версий песен, которые могли воспроизводиться вместо песни, которую вы действительно хотели услышать. Получившаяся разработка способна отличить каверы от оригинального трека с высокой точностью, особенно инструментал и живые выступления.

Команда также работала над тем, чтобы согласовать текст песни с моментом, в котором он исполняется. Это открыло новые возможности для Spotify. В частности, помогло с функцией «Behind The Music», которая отображает тексты популярных песен.

«Выровненные по времени тексты могут обогатить впечатления от прослушивания музыки за счет включения караоке, текстового поиска песен и навигации внутри песни, а также других приложений».

писали разработчики Spotify.

Согласно исследованию, опубликованному в апреле 2019 года, Spotify изучил данные более 16 миллионов пользователей, отслеживая их активность с декабря 2016 года по февраль 2018 года. Отслеживалось, сколько раз в день кто-то слушал определённого исполнителя или песню и в каком штате США они находились.

Эти данные в сочетании с данными, которые оставляют о себе сами пользователи, позволили Spotify понять, меняется ли музыкальный вкус после переезда в другой штат. Также компания выяснила, как возраст влияет на вид музыки, которую слушает человек.

Команда вычислила переезд в другой штат хитрым образом — на основе данных о местоположении. Предполагалось, что сменили место жительства те пользователи Spotify, чьё постоянное местоположение изменилось за период трёх важных для США праздников: Рождество 2016 года, День благодарения 2017 года и Рождество 2017 года.

Изучая музыкальные вкусы людей в каждом штате, а затем сравнивая с ними людей, которые туда переехали, команда Spotify пришла к выводу, что в течение длительного периода времени местоположение начинает влиять на музыкальный вкус.

«Похоже, переезд меняет вкусы людей в сторону их нового окружения. Однако размер этого эффекта невелик. Слушатели, как правило, с большим желанием вспоминают своё прошлое, а не ориентируются на окружающих».

— писали они.

Изучая возраст, они также предположили, что музыка, которую человек слушает в возрасте от 10 до 20 лет, — это музыка, которая формирует «музыкальную идентичность». Преимущественно эту музыку человек будет слушать в будущем.

Всё это указывает на то, что Spotify владеет огромным объёмом данных, которые продолжает собирать у своих пользователей. Это необходимо для обслуживания клиентов и поддержки конкурентных преимуществ. В презентации 2015 года на тему «Discover Weekly» упоминалось, что Spotify записывает один терабайт пользовательских данных в день.

Тем не менее, эти данные используются в обслуживании клиентов. В ходе исследования компания ясно даёт понять, что успех всех этих алгоритмических сервисов возможен только потому, что каждое действие, которое вы выполняете в сервисе, отслеживается и регистрируется.

И это может оказаться секретным ингредиентом потоковой передачи музыки. В конце концов, Spotify удалось добиться успеха, несмотря на борьбу с такими технологическими гигантами, как Apple — количество платных подписчиков у Spotify всё ещё больше, чем у Apple Music.

Похожие материалы