CDO2DAY
Цифровой анализ

Новая нефть требует новых подходов

Фото: JAVIER TRUEBAMSF/Science Photo Library/East News

Современное законодательство в России не способствует обороту данных. При этом создание дата-брокеров - специальных компаний, которые бы собирали данные, обрабатывали их и продавали в виде аналитики бизнесу или госорганам - решило бы многие проблемы рынка данных в нашей стране

С данными люди поступают умнее, чем с нефтью — их не любят продавать и покупать сырыми. Как правило, их принято покупать уже в обработанном и систематизированном виде (отчета, инфографики и т.д), говорит директор Ассоциации больших данных Алексей Нейман.

Информацию продают и покупают во всем мире: политические консультанты – для влияния на итоги выборов, транспортные компании – для прогнозирования маршрутов, ритейлеры и производители товаров – для таргетирования рекламы. Часто компании получают доступ к ним вне зависимости от желания пользователей и при этом абсолютно легально. Например, если вы пользуетесь хоть одной социальной сетью, то, скорее всего, она о вас знает больше, чем ваш партнер, объясняет Нейман.

Сейчас рынок сбора данных в России представлен компаниями (соц.сети, операторы, банки), которые собирают данные, чтобы нарастить обороты и улучшить эффективность работы собственных сервисов и систем, но, в то же время, готовых дополнительно монетизировать накопленную информацию.

Логично, что такие операторы данных хотят монетизировать собираемую ими обезличенную информацию, рассуждает Нейман, но возникает проблема — данные сырые. Они не систематизированы, не визуализированы и скорее всего они представляют из себя набор таблиц. А также среди этих данных могут быть те, которые являются конкурентным преимуществом этих компаний, например, данные о клиентах. Поэтому их как и не нефть, выгоднее и безопаснее сначала обработать, сделать на их базе  аналитические продукты. И продавать уже их в виде отчетов или потоковых данных, говорит он.

Рынок аналитики данных для третьих лиц в России развит достаточно слабо. Один из возможных вариантов их сотрудничества — когда банк приходит к оператору за аналитическим продуктом. Банк задает его параметры (форму, содержание и т.д) и получает его на выходе готовый отчет или график. Но такой продукт «под ключ» очень дорогой, а его производство не масштабируемо, так как такие отчеты специфичны для каждой отдельной задачи и компании.

Решить эту проблему мог бы дата-брокер — посредник между теми, кто данные покупает, и теми, кто их продает. Такие компании существуют за рубежом, однако в России их нет и юридически они появится не могут — нет законодательной базы, объясняет Нейман. 

Как работают дата-брокеры
Анализируя данные о пользователях, интернет-платформа может выбрать тех, кто подходит под заданные критерии // East News

Дата-брокеры агрегируют данные из множества источников (это могут быть общедоступные источники, сами пользователи, третьи лица – «доноры» данных). Это массивы персональных и потоковых данных – сотни атрибутов по миллионам людей. Накапливаемые данные могут включать самую разную информацию – о политических взглядах, религии, покупках, планах усыновить ребенка, наличии заболеваний сердца и иные чувствительные данные. Сложно переоценить значение этих данных для бизнеса, объясняет старший юрист практики по оказанию услуг в области интеллектуальной собственности, технологий и защиты данных, PwC Legal Артем Дмитриев.

Предположим, магазин зоотоваров хочет открыться в новом районе, приводит пример Нейман. Для этого нужно определить, сколько в районе собачников и кошатников. Можно, наверное, выехать в район и попытаться следить самим за количеством владельцев питомцев. А можно запросить  у операторов аналитику по данному району, какое количество человек, например, утром гуляет с собакой. Либо у банков аналитику по покупкам кошачьего корма и других зоотоваров в магазине. Но продукт все равно получился бы слишком дорогим из-за специфичности запроса.

Цена таких аналитических продуктов ничем не обусловлена, говорит Нейман. Она может варьироваться от компании  к компании и конечная цифра зависит от того, как удалось договориться . Сейчас даже один и тот же сервис по рассылке SMS банкам операторы продают по разной стоимости. И это тормозит развитие рынка. Крупные игроки, например, могут заплатить семизначную цену за такой продукт. А вот малый бизнес не сможет позволить себе подобную роскошь. Да и вряд ли осмелится пойти напрямую, например, к «большой четвёрке» мобильных операторов или к крупнейшим банкам за аналитикой. 

Эту проблему мог бы решить дата-брокер — связующее звено между продавцом и покупателем. Такая компания представляла бы из себя маркетплейс со всеми возможными информационными продуктами, по более общим запросам. Она бы сама закупала, анализировала и визуализировала все данные от, например, всех операторов по тематикам, а затем выставляла бы на продажу. Существование такой структуры сделало бы к данные доступнее, а рынок — понятнее, говорит Нейман.

Сложные аналитические сервисы не имеют фиксированной стоимости так как она зависит от большого числа факторов, объясняет представитель «Билайна» Анна Айбашева. В них входит, например, география анализа (например, в рамках одного проекта могут анализироваться как несколько городов, так и большая часть территории РФ) и от периода анализа (например, один месяц, либо целый год). Также вносить коррективы в стоимость конкретного решения для клиента может сложность проекта, задействование больших вычислительных ресурсов и работы аналитических команд, говорит она.

Какие сервисы есть в России
Аналитика больших данных подсказывает операторам связи, где лучше открывать их салоны // А.Гордеев/Ведомости/PhotoXPress/East News

Самое близкое к дата-брокериджу в России — рынок таргетированной рекламы. Он работает благодаря cookies, по которым компании собирают данные о пользователях, посещающих веб-страницы, чтобы затем таргетировать рекламу по сегментам (например, «владельцы животных»).

Если раньше аналитические продукты были востребованы в основном крупным бизнесом, то сейчас этот тренд захватил средний и даже малый бизнес, говорит представитель «МегаФона» Юлия Плехова. Предприниматели хотят решения, которые, например, позволяют таргетировать их рекламные сообщения на узкие целевые аудитории, подтверждает представитель МТС Алексей Меркутов. 

Компании видят пользу дата-сервисов для улучшения бизнес-процессов, повышения качества работы с пользователями, организации рекламных кампаний, продолжает Плехова. Результатом оказания услуг дата-аналитики в большей части дата-сервисов являются агрегированные деперсонифицированные аналитические отчеты, подготовленные с использованием машинного обучения и алгоритмов искусственного интеллекта, говорит она.

В целом со стороны сегмента малого и среднего бизнеса есть два типа запроса – во-первых, это массовые продукты аналитики по подписке и геоаналитика, говорит представитель Теле2 Дарья Колесникова. Салоны красоты, кафе и небольшие магазины, к примеру, используют их, чтобы выстроить взаимодействие  с потенциальными клиентами. Например, сервис «SMS-таргет» позволяет владельцам малого и среднего бизнеса привлечь новых клиентов и рассказать лояльной аудитории об акциях и услугах компании. Специальный веб-интерфейс помогает настроить и провести SMS-рассылку с точным отбором своей целевой аудитории. Клиент, продолжает Колесникова, может учесть следующие параметры рассылки: пол, возраст, операционную систему мобильного устройства пользователя и уровень его дохода. Также при запуске рекламной кампании бизнесмену полезно задействовать геотаргетинг. Например, владелец нового кафе может отправить SMS о его открытии абонентам, находящимся поблизости.

С помощью сервиса «Билайна» «Бизнес.Вместе» предприниматели могут находить деловых партнёров в своём городе или районе, проводить совместные акции, привлекать новых клиентов без дополнительных вложений, обмениваться опытом, говорит Айбашева. А сервис «Билайн-Геоаналитика» помогает определять наиболее подходящие локации для открытия новых точек продаж, а государственным институтам развивать социальную и туристическую инфраструктуры, рассказывает она. Выручка «Билайна» от проектов с использованием технологий big data и искусственного интеллекта постоянно растет. По итогам 3 квартала 2020 года этот показатель увеличился более чем в 2 раза по сравнению с уровнем аналогичного периода прошлого года.

Аналогичный сервис Теле2 подходит, например, сетям франшизных салонов или аптек – он анализирует спрос потенциальной аудитории, говорит Колесникова. Бизнесмен, который хочет расширить свой бизнес, может за сумму от 10 000 до 30 000 рублей купить карту с локациями, на которых указана максимальная концентрация спроса на определенную услугу. Такой геопродукт компания может заказывать раз в год, поскольку потенциальная аудитория довольно стабильна и не обновляется ежемесячно. Геоаналитический таргетинг зависит от объемов пакета, продолжает она, но в целом стоимость одной таргетированной SMS-рассылки для предприятия составляет от 10 000 до 15 000 рублей. Это вполне доступный инструмент, который может позволить себе любой предприниматель. Малый и средний бизнес пока только нащупывает ценность этих продуктов, поэтому сейчас в продаже аналитических продуктов Теле2 фокусируется на крупных компаниях и госсекторе, подытоживает Колесникова.

Без дата-брокеров не обойтись
Уже сегодня анализ больших данных позволяет планировать маршруты городского транспорта // М.Фролов/Komsomolskaya Pravda/East News

В дата-брокерах есть необходимость не только для формирования предсказуемого ценообразования, но и для развития цивилизованного рынка данных, функционирующего в рамках закона. Это также их регулирование (потому что в России большое количество данных, которые продаются на черном рынке, зачастую, на физических носителях) и стандарты хранения информации и обращения с ней.  Ниша дата-брокеров пока свободна в России отчасти из-за отстающего законодательства. Для этого Ассоциация больших данных разрабатывает экспериментальную песочницу данных, чтобы установить «белую» зону использования данных и дать компаниям возможность легально и безопасно заниматься торговлей аналитических сервисов и продуктов на основе данных, говорит Нейман.

Отсутствие нормативно-правовой базы Нейман называет одной из очевидных проблем для создания дата-брокеров. Так сейчас отсутствует законодательное разграничение понятий аналитики и персональных данных. Для повышения точности предиктивной аналитики необходимо совершенствовать законодательство в области больших данных, соглашается Плехова из «МегаФона». Введение понятия полностью обезличенных данных, установление допустимых методов обезличивания позволило бы, соблюдая права пользователей, осуществлять обмен данными между различными компаниями для их дообогащения и повышения точности предиктивной аналитики, говорит она.

Big data в России

Рынок больших данных в России в 2018 году оценивается в 45 млрд рублей, а его ежегодный темп роста составлял с 2015 года 12%, подсчитала Ассоциация больших данных. При этом 15% рынка приходилось на цифровую инфраструктуру, 11% — на вертикальные решения и услуги, а 9% — на технологические инструменты. Масштабное внедрение больших данных добавит 0,3% роста ВВП до 2024 года, что составит 1,3 трлн руб. эффекта в 2024. Для сравнения - это около 15% выручки от экспорта нефти в 2018 году. А накопленный эффект с 2019 по 2024 год может составить 2,9 трлн руб., то есть примерно в полтора раза больше бюджета национальной программы «Цифровая экономика».

Отсутствие специального регулирования деятельности дата-брокеров в зависимости от применимой регуляторной модели (США, ЕС, Китай или Россия) может приводить к диспропорции интересов бизнеса и граждан, объясняет Дмитриев. Так, например, в России это очевидно приводит к невозможности полной реализации субъектами своих прав, включая в т.ч. отсутствие информирования об использовании данных (какие данные, в каких целях и кому передаются), отсутствие возможности отказаться или запретить обработку данных, сложности обеспечения защиты данных и предотвращения масштабных утечек данных и др. 

В тоже время, продолжает Дмитриев, это вовсе не означает, что все компании, монетизирующие данные в России – правонарушители. При этом сложившиеся в России формализм регулирования, бумажный контроль его соблюдения, бизнес-ментальность и даже, потребительская виктимность в совокупности способны оставить безнаказанной даже бесконтрольную торговлю данными. И эта проблема мало связана с отсутствием специального отраслевого регулирования. Дмитриев считает, что такие компании должны подлежать большему контролю со стороны регуляторов, должны внедрять повышенные меры информационной безопасности и ограничения несанкционированного доступа. 

Например, регуляторы Великобритании, Франции, Ирландии и других стран в течение последних лет пристально следят за деятельностью дата-брокеров в рамках GDPR и иных актов общего регулирования. Так, в октябре 2020 года британский регулятор завершил двухлетнее расследование в отношении таких дата-брокеров, как Equifax, Experian, TransUnion и потребовал устранить допущенные нарушения при обработке данных в соответствии с GDPR.

Своего рода прорывом стал закон о дата-брокерах в американском штате Вермонт, который вступил в силу в 2019 году. Он не только вывел компании из серой зоны, но и включил в единый реестр, где их сейчас больше сотни (к ним, в частности, причислен Oracle). Тем не менее, принятый в США закон не покрывает все ключевые элементы обработки данных дата-брокерами, объясняет Дмитриев. Например, дата-брокеры не обязаны получать согласие пользователей на агрегирование/продажу их данных даже в случае обработки биометрических/специальных категорий данных; не обязаны раскрывать информацию о субъектах, категориях данных, клиентах дата-брокеров; пользователи не могут получить доступ к перечню их данных, обрабатываемых конкретным дата-брокером. В других странах в отсутствие специального регулирования могут возникать сложности с эффективным контролем за обработкой данных дата-брокерами и их клиентами, говорит он. 

Создание дата-брокеров позволило бы бизнесу обеспечить одновременно прозрачность обработки данных для субъектов и наличие правомерного основания использования данных для бизнеса. Ведь данные служат не только для обогащения бизнеса, но зачастую приносят пользу и самим потребителям, например, дают возможность производителям создавать востребованные продукты и контент, создают действительно удобные сервисы с предиктивной аналитикой и многое другое, подчеркивает Дмитриев.

Сейчас все в России одержимы созданием экосистем, поэтому все хотят аккумулировать как можно больше данных и быть автономными. По оценкам Morgan Stanley один только Сбербанк тратит на ее строительство 200 млрд рублей в год (для сравнения: Mail.ru и «Яндекс» с 2010 года вложили в свои экосистемы 130 млрд рублей). Часто крупным компаниям проще купить небольшие инновационные стартапы и ввести во внутренний контур их данные и технологии, чем вести с ними бизнес, из-за потенциальных рисков нарушения законодательства. Это бы не потребовалось при наличии развитого легального рынка дата-брокериджа, подытоживает Нейман.

Егор Сонин

Смотрите еще