Въведение в рекламите в браузъра на Brave

 Онлайн рекламата е двигателят, който стимулира създаването на онлайн съдържание от десетилетия. Съвременната екосистема за онлайн реклама се е развила до оптимизиране за конверсии (т.е. кликвания и покупки). Тази практика често води до постоянно и инвазивно поверително сърфиране и събиране на поведенчески данни за включване в аналитични модели, докато дадено лице разглежда на пръв поглед несвързани уеб сайтове чрез инфраструктура от трети страни за проследяване. През последното десетилетие потребителите все повече се оттеглят срещу тези практики, нарушаващи поверителността, както чрез приемане на продукти като Brave, които автоматично блокират тракери на трети страни, така и чрез законодателни и регулаторни действия като GDPR и други подобни.

Въпреки това, въпреки че е възможно да се потисне проследяването, има голям интерес от потребителите да получават подходящи препоръки. В резултат на това видяхме редица академични предложения като Privad [1] или Adnostic [2] за рекламни системи, запазващи поверителността. Brave Ads обаче беше първата внедрена система. Представени през април 2019 г., Brave Ads предоставят на настоящите 18 милиона активни потребители на Brave [7] месечно - избор да изберат реклама, запазваща поверителността, и да бъдат възнаградени за вниманието им.

Защо нещата се правят по този начин?

Докато изследователите и защитниците на неприкосновеността на личния живот често се фокусират върху предотвратяването на определено поведение, важно е да осъзнаете огромните възможности, предлагани от машинното обучение от страна на клиента. В действителност, в контекста на уеб браузър, самият браузър вижда цялото взаимодействие на потребителя с мрежата, което включва както „основно“ неаутентифицирано сърфиране, като четене на новини, така и очевидно чувствителни дейности, като четене на потребителски имейли или взаимодействия в социалните медии чрез уеб интерфейс.

Това означава, че с правилния подход може да се проектират модели за машинно обучение от страна на клиента за съвпадение на рекламите, които са по-точни от това, което се постига чрез проследяване на трети страни, което в крайна сметка води до сравнително малко кликвания. Това показва 7% повишаване на Brave Ads (9%) спрямо конвенционалните рекламни технологии (2%) по отношение на честотата на кликване [6]. 

Що се отнася до източниците на данни, можем да разгледаме няколко опции, само някои от които в момента се използват от Brave:

  • Страници, които потребителят посещава - това формира както дългосрочни, така и краткосрочни потребителски интереси - ако изградим модел, базиран на съдържанието на страниците, които потребителят е посетил през последните два месеца, ще получим доста добро усещане за общите им интереси като спорт или политика или земеделие.
  • Заявки за търсене - намерението за търсене е изключително мощно, тъй като често показва преки и непосредствени интереси на потребителя; това очевидно стои зад ефективността на базираната на търсене реклама - основният двигател зад успеха на търсачките като Google.

В обобщение, напълно е възможно както да обучавате, така и да прилагате модели за машинно обучение въз основа на поведението на потребителите на тяхното локално устройство; това, което далеч не е тривиално, е как да се създадат модели на ML, така че различните потребители да информират клиентите си.
модели за машинно обучение въз основа на поведението
Фигура 1: Текуща снимка на системата Brave Ads. Рекламодателите създават и провеждат кампании (1), които се разпространяват чрез Brave Ads Server във всички браузъри в дадена държава (2). Моделите ML, които не са свързани с кампания, се обучават офлайн и се публикуват в браузърите за извод на устройството (3) при съвпадение на реклами въз основа на поведението при сърфиране в сайтове на издатели и създатели на съдържание (4) и (5). Известията за реклами се отчитат чрез протокол за запазване на поверителността (6).

Преглед на системата за реклами на Brave

Основните функции на рекламната платформа включват доставка, съвпадение и отчитане на рекламите и тяхната ефективност, измерена например в кликвания или реализации. В Brave трябва да активираме всичко това по начин, зачитащ поверителността, който - ако бъде доведен до краен предел - може да изглежда като това, което предложихме в Темида [3]. За да постигнем тази визия, трябва да разделим и завладеем и по този начин текущото състояние на платформата Brave Ads е по-скоро стъпка, отколкото окончателен дизайн, както ще бъде посочено по-долу.

Фигура 1 описва потока от високо ниво на реклама, която прониква в устройството на потребителя. Всичко започва с това, че рекламодателите купуват инвентар на сървъра за Бреив реклами. Докато конвенционалните платформи за рекламни технологии предлагат оферти за рекламни възможности чрез търгове в реално време, понастоящем Brave продава директно на рекламодатели.

След като бъдат закупени, рекламите на рекламодателя ще бъдат добавени към каталог, който ще бъде доставен на крайния потребител в две стъпки. Първо каталогът трябва да бъде разпространен до устройствата на потребителя. За да запази разпространението на рекламите частно, браузърът не изисква реклами в реално време, но периодично изтегля каталог с подмножество от всички налични реклами. В момента това се прави чрез създаване на версия на каталога за всяка държава. Втората стъпка на доставката се случва в браузъра и включва основен модел на вниманието на потребителя, за да избере и покажете реклама в ненатрапчив момент.

Освен показването на реклами в точното време, от първостепенно значение е да избере само реклами, подходящи за потребителя. Съчетаването в настройка за запазване на поверителността е експоненциално по-трудно, отколкото в конвенционалните рекламни технологии, тъй като изключва повечето подходи, базирани на извличането на данни. За тази цел използваме комбинация от общо предназначение и специфично за потребителя машинно обучение на устройството, както е подробно описано в следващите раздели на тази публикация.

И накрая, трябва да докладваме за показатели за ефективност като импресии, кликвания и реализации. За да дадем възможност за свързване и частно отчитане, разработихме протокол, базиран на пропуск за поверителност. Механизмът е описан подробно в нашата Wiki [5].

След като направихме общ преглед на ключовите понятия на системата, нека да се потопим по-дълбоко в съвпадението на частните реклами и как използваме машинно обучение на устройство за повишаване на производителността.

Частно съвпадение на рекламите

Съпоставянето се разделя главно на контекстно и поведенческо съвпадение. Следващият раздел представя накратко и двете концепции и обяснява как рекламодателите могат да провеждат кампании и при двата режима.

Контекстна реклама

Строго казано контекстната реклама разглежда само независимия от потребителя контекст на дадена реклама. За конвенционалните реклами в страницата това включва характеристики на уебсайта, показващ рекламата, като темата за съдържанието. Тъй като Brave използва системни известия, независими от страницата, за да показва реклами, ние използваме краткосрочно обобщение на историята на сърфиране на потребителя, за да установим съответния контекст. Предимството на показването на реклами, независимо от една страница, е, че това повишава безопасността на марката. Недостатъкът на контекстуалния подход е, че той може да не отразява търговското намерение на потребителя да закупи рекламиран продукт или услуга. Тук влиза в действие поведенческото съвпадение.

Поведенческа реклама

За разлика от контекстното съвпадение, поведенческият подход не се интересува особено от непосредствения контекст на сесията на сърфиране на потребител, а се фокусира повече върху модели, които се появяват от поведението на потребителя за дългосрочно сърфиране, като често посещавани уебсайтове, онлайн търсения или внимание, отделено на различни видове съдържание.

Поведенческата реклама обикновено прави разлика между интерес и намерение, когато намерението за покупка е особено ценно за рекламодателите, които искат да достигнат до аудитории, които са „на пазара“ за техния продукт или услуга. Поведенческото насочване традиционно включва проследяване на потребителите през сегменти на аудитории на трети страни, ретаргетирайки ги с реклами, докато разглеждат и започват своята покупка. Текущите методи разчитат на събирането на данни на трети страни. Brave въвежда иновации, като първи на пазара с механизъм за намерение за запазване на поверителността, който използва локално достъпни данни, които никога не напускат устройството.     

За да разберем какво може да се интересува даден потребител, ние използваме набор от евристики, които са информирани от потребителските изследвания и познанията в бранша в търсенето и маркетинга на ключовите думи. Предизвикателството на този подход е, че трябва да отговорим на въпроси като „какво търсят потребителите, когато искат да си купят нов смартфон“ априори, без да наблюдаваме действителни потребителски данни. 

За да обобщим, в Brave ние предлагаме две частни средства за съвпадение на рекламодателите, които могат да се разберат като контекстна реклама, за да се съпоставят потребителите въз основа на интереси и поведенческа реклама, за да съответстват на потребителите въз основа на намерението за покупка.

Локално машинно обучение

Машинното обучение е ключов компонент за активиране на частно съвпадение на платформата Brave Ads. Фигура 2 дава преглед от високо ниво за това как се прави това. Всяка стъпка в процеса на публикуване на моделите в нашата среда за обслужване на модели е офлайн, в смисъл, че не включва браузъра. Моделите са обучени на публично достъпни източници на данни като обичайно обхождане, където едно от ключовите предизвикателства е генерирането на точни етикети в мащаб. След QA моделите периодично се публикуват и изтеглят от браузъра. След това браузърът използва тези модели с „общо предназначение“, за да прави прогнози за релевантността на рекламата за историята на сърфиране на даден потребител. Струва си да се спомене, че ние никога не се опитваме да направим извод за интерес към уебсайтове, базирани на вход като вашия имейл или социални медии. 

ML за обучение и публикуване на модели

Фигура 2: ML за обучение и публикуване на модели за заключение на устройството.


Поглед в бъдещето

Има много възможности за подобрения, когато става въпрос за разбиране на интереса и намеренията на потребителя. Едно от най-очевидните ограничения на текущата система е нейното непознаване на скритите предпочитания на потребителя. Представете си потребител, който е ентусиазиран от дома и градинарството, но никога не разглежда свързано съдържание на работния си лаптоп. В този случай локалните потребителски модели никога не биха предсказали интерес за този сегмент. По този начин се нуждаем от начин за изследване на сегменти, независими от явното поведение при сърфиране. Един клас алгоритми за справяне с подобни базирани на проучване проблеми се нарича многоръки бандити. Вече проведохме изследвания и публикувахме работа за превръщането на такива бандити в частни [4]. 

В момента работим по внедряването на първата версия на споменатите бандити в браузъра. 

За по-задълбочено разбиране на дизайнерските решения и алтернативни подходи препоръчваме да прочетете [1] и [2]. В следващите публикации в блога ще докладваме за нашия напредък в изграждането на системата, докато се приближаваме към напълно децентрализирана и недоверена версия на частната рекламна платформа на Brave.

Препратки


0 Коментари

Най-нови