Представете си 140 млн. души, които получават персонализирана плейлиста с 30 песни. Всеки понеделник. Сега си представете 110 млн. души, които получават персонализирани препоръки за това, кой филм или сериал да си пуснат, като дори „обложката“ му е специално пригодена за тях. Това са непосилни задачи, които никой човек не може да изпълни сам дори за един-единствен потребител, камо ли за стотици милиони от целия свят. Именно тук идват на помощ алгоритмите за препоръка.
Кому са нужни препоръки?
Всяка компания на планетата има за цел да спечели възможно най-много. В случая на компании като Netflix и Spotify това става чрез привличането, но и задържането на възможно най-много потребители, които да консумират възможно най-много съдържание. И когато казваме „възможно най-много потребители“, си говорим за наистина много - буквално стотици милиони, при това от различни култури и с изключително разнообразни вкусове и разбирания. Предизвикателството пред алгоритмите и разработчиците им от всяка такава компания е огромно, защото трябва да покажат подходящото съдържание, което да задържи всеки индивидуален потребител. Само така всеки от тях ще има мотивацията да продължи да плаща и използва въпросните услуги.
Един от основните „проблеми“ на тези услуги е и тяхното огромно предимство. Те дават достъп до ужасно много съдържание - милиони песни или хиляди филми и сериали, сред които със сигурност се крие по нещо интересно за всеки. Именно тук идва селекцията на съдържание, която, от една страна, улеснява потребителите, като въобще не им показва неща, които най-вероятно така или иначе не искат да виждат. От друга пък им показва неща, за които не знаят, че ще се развълнуват искрено - трогателна мелодия или изключителна история. А колкото до успеха на препоръките…
Spotify може да визуализира музикалния ви вкус като топографска карта с върхове, низини и отделни острови.
Над 80% от сериалите, които потребителите на Netflix си пускат, идват от системата за препоръки на платформата. В музикалния свят пък едва 9 месеца след старта си плейлистата Discover Weekly на Spotify, която е курирана от алгоритъм и е уникална за всеки потребител, е слушана от над 40 млн. души. Това са само два от многото примери за това, колко са важни препоръките за стрийминг услугите. А това, че на теория и донякъде на практика препоръките се изготвят от алгоритми, прави самите алгоритми също толкова ключови в бизнеса на тези компании. Как обаче работят те?
Трикракото столче на Netflix
Едно от най-големите постижения на Netflix е предлагането на съдържание, което потребителите обикновено не биха взели предвид. Така например един от осем души, които гледат сериалите на Marvel в платформата, никога преди това не е гледал неща, свързани или базирани на комикси. С комбинация от машинно самообучение (machine learning) и алгоритми компанията изследва предубежденията на потребителите и им показва неща, които обикновено не биха гледали, но все пак отговарят на търсенията и нуждите им.
Компанията описва тази система като трикрако столче. Неговият първи крак са потребителите и по-конкретно - всеки отделен профил (всеки абонат може да има до четири профила) и неговите навици. Те се проследяват както в зависимост от това, което гледат в момента, но и спрямо предишното изгледано съдържание, онова, гледано или преди година, или наскоро, и по кое време на денонощието то е било изгледано. Тези данни после се комбинират с втория крак на столчето, което представлява детайлни тагове за всеки филм или сериал. Генерирани от хора, които гледат внимателно всеки епизод или филм, таговете съдържат неподозирани детайли за тях. Какво е настроението им, какви емоции предизвикват, има ли самотен главен герой, корумпирано правителство или пък действието се развива в Космоса. Част от тях виждаме на началната страница с имена като Gritty drama или TV Dramedies, но повечето са скрити от потребителите.
Данните за използването на услугата и таговете тогава отиват към третия крак на столчето - алгоритмите. С тях Netflix разбира кое е важното за профила към момента. Дали филмът от вчера е от най-голямо значение, или всъщност е сериалът, който сте гледали преди година? Дали 10-те минути от сериала днес са с по-голяма тежест от изкльопването наведнъж на два сезона преди месец? Всички тези данни водят до създаването на „общности по вкус“, в които попадат профили от целия свят, гледащи подобни неща.
Ключовото е, че зрителите попадат в разнообразни общности - фактор, който повлиява на нещата, появяващи се на началния екран на услугата. Важен детайл за Netflix е, че компанията няма никаква причина да препоръчва определено съдържание повече от друго. Тя плаща твърда такса на създателите на съдържанието, така че няма значение дали даден филм или сериал е гледан от един или от 100 млн. души - разходът за компанията е същият. Затова и Netflix се ограничава до препоръчването на неща, които просто да държат потребителите в рамките на услугата. Пред Business Insider Крис Джаф, вицепрезидент за продуктови иновации в Netflix, обяснява, че целта на компанията е, когато имате свободно време и избор от различни дейности - книга, списание, телевизия, Facebook или Netflix, - по-често да избирате Netflix.
В ритъма на алгоритъма
Една от съществените разлики между Netflix и Spotify освен дреболиите около киното и музиката е в конкуренцията на услугите. Докато Netflix, HBO, Amazon Prime и т.н. се борят едни с други чрез комбинация от чуждо и оригинално съдържание, Spotify, Tidal и Apple Music нямат този лукс. С дребни изключения всички музикални услуги предлагат практически идентично съдържание и изборът на някоя от тях се базира на всичко останало, но най-вече на курирането на музика.
В забързаното ни ежедневие търсенето на нова музика е занимание, за което рядко имаме нужното време и внимание. Въпреки това вълнението да откриеш нова хубава песен остава изключително силно. Именно на това разчита Spotify с препоръките си и най-вече с Discover Weekly.
Дори напредналите алгоритми на Spotify и Netflix разчитат за някои ключови елементи на човешка намеса.
За разлика от Apple Music, където препоръките се правят от музикални редактори, Spotify разчита на алгоритми. Подобно на Netflix, и Spotify създава профил на вкуса на всички потребители, базиран на това, което слушат. Благодарение на този профил платформата дава рейтинг на афинитета към артистите, който е базиран на алгоритъм, определящ значението на даден артист за слушателя. Алгоритъмът също така разглежда жанровете, които слушате, за да определи в кои от тях е най-вероятно да искате да чуете нещо ново.
По-интересното е, че ако приемем музикалния вкус на всеки за един континент с върхове, които представляват любимата ни и най-слушана музика, и долини от песни и артисти, които намираме за приятни, то имаме цял океан от парчета и жанрове, които не ни допадат. Освен това обаче има острови от музика, която слушаме, но не харесваме. Това са например детските песни, които хлапето ви слуша от вашия профил, или онези три песни на ABBA, с които изневерявате на по принцип рокаджийските си нагласи. Алгоритъмът е достатъчно умен и знае, че не трябва да взима тази музика предвид.
В есенцията на работата на алгоритъма обаче е намирането на други потребители, които имат плейлисти с вашите любими артисти и песни. От тези плейлисти на ваши музикални сродни души той взима песните, които не сте слушали, филтрира ги според профила на вкуса ви и ги добавя сред препоръките, които виждате всеки понеделник в Discover Weekly. Цикълът се затваря напълно, защото поведението ви с Discover Weekly се отразява на профила на вкуса ви и всяко харесване, прескачане или добавяне на песен в плейлистата е сигнал за това, какво ви харесва и какво - не.
Хората около алгоритмите
Както Spotify и Netflix не изчерпват стрийминг услугите на пазара, така и описаните тук подходи не изчерпват ролята и функционирането на алгоритмите дори в тези две компании. Netflix използва умни системи за тестване на нови функции, включително и на различни обложки за едни и същи филми, като тези тестове стигат до стотици хиляди потребители всяка година. Spotify пък има и системи за анализ на естествен език, които ровят из популярни блогове за нова нашумяла музика, която става част от Fresh Finds плейлистите. Друга система за анализ на звука пък определя качествата на чисто нова музика, която не е в ничий блог или плейлиста.
По-интересното е, че тези ключови алгоритми до голяма степен разчитат на хората. И не става дума за екипите от инженери и програмисти, които разработват алгоритмите, а за милионите потребители на Spotify, които слагат музика в плейлисти, както и за десетките служители и фрилансъри, които тагват съдържанието на Netflix. Без този крак на метафоричното столче алгоритмите биха били абсолютно неспособни да вземат правилното решение за индивидуалния потребител. Затова и модерните алгоритми са много повече киборги, отколкото научнофантастичните андроиди, за които обичаме да си мечтаем.