Посол Европейского союза в России Маркус Эдерер в начале встречи отметил высокий уровень технологий российских компаний. Он считает их одними из участников той системы, которую Европейский союз стремится создать. По словам посла, один из важнейших вопросов современного мира: «Как управлять данными в цифровой экономике?». Covid-19 ускорил переход в цифровое общество и показа: насколько все сферы зависят от платформ, причем, большинство из них — американские.
Эдерер описал стратегию по защите данных и организации их свободного распространения внутри Европы. Директива о данных (Data Governance Act) содержит три основных компонента. Во-первых, данные, которые находятся в государственном секторе, должны быть доступными. Согласно новым правилам эти данные подлежат обмену, но их надо защищать.
Второй компонент — общие принципы посредников данных. Они должны обеспечить доверие между компаниями и физлицами, защиту данных. И каждый этот посредник должен уведомить соответствующие органы и соответствовать жестким требованиям для сохранения своего нейтралитета. При этом посредники должны быть нейтральной некоммерческой стороной.
Третий компонент Директивы о данных — эти принципы применяются ко всякому человек. «Допустим, у вас какое-то редкое заболевание. Вы можете поделиться данными, чтобы их исследовали. Так вы поможете другим людям. Но вы должны быть уверены, что данные будут защищены, чтобы вы не потеряли контроль над своими данными. Их использование должно быть целевым».
Эдерер отметил, что что Европейский союз не пытается создать стену между собой и Россией. Он стремится организовать правила игры, чтобы все компании могли одинаково работать на европейском рынке. Границы для данных должны быть открыты, по мнению Эдерера.
Более детально представил содержание и идею Директивы о данных эксперт в области данных Европейской комиссии Шимон Левандовски. Директива призвана удовлетворить потребность в данных, как сказал он. Сейчас многие данные недоступны или высоки трансакционные издержки их получения, есть также проблема недоверия, по его мнению. Компании опасаются открывать свои данные, так как думают, что конкуренты будут использовать их против них самих. Чтобы решить эти проблемы, нужно создать единый рынок данных.
Директива учитывает как личные данные, так и данные бизнеса. Левандовски подчеркнул важность именно индустриальных данных: «Умные машины, умные устройства, интернет вещей — всё это генерирует огромные массивы данных. Именно они позволят создать европейский цифровой континент. То, что мы делаем сейчас — это основа для построения будущего цифрового общества.
Все сектора экономики будут участвовать в обмене данными — финансовый, сельское хозяйство, различные производства, энергетика, образование и здравоохранение. Данные есть во всех секторах. Пока все рынки данных являются секторальными. Цель Евросоюза — объединить их, создать единое европейское пространство данных.
Посредники — наиболее важный компонент для рынка данных. Они должны быть некоммерческими организациями, вроде Красного креста, и организовать свободный, добровольный переток данных. Этот институт уже существует — дата-брокеры накапливают данные и продают их. Но в Европе хотят создать нечто иное — частных и независимых посредников, по словам Левандовски. Они будут соединять поставщиков и потребителем данных. Сами они будут лишь предоставлять техническую инфраструктуру, и не воспринимать сами данные как актив.
За посредниками будет организован государственный надзор, но без прямого влияния, контроля или государственного финансирования. Такими посредниками могут стать крупные благотворительные организации, университеты, исследовательские компании и пр. У них может быть бизнес на стороне, но он не должен вступать в конфликт с их деятельностью «дата-альтруизма».
Уже более 400 участников рынка подали заявку на получение статуса посредника. Есть даже игроки, которые почти соответствуют требованиям, но еще не до конца. Они все еще не до конца трансформировались в некоммерческие организации. А поставщики данных должны быть уверены, что их данные не будут использоваться негативно.
Левандовски назвал посредников «дата-альтруистами». Он уверен, что многие готовы безвозмездно распространять данные. «Мы должны высвободить потенциал обмена данными, как на благо экономики и бизнеса, так и на благо всего общества», — сказал Левандовски.
Управляющий партнер международной юридической компании Dentons Виктор Наумов рассказал, как в разных странах выстраивают государственную политику в области данных. По его словам, ни в одной стране мира сейчас нет комплексного законодательства, которое регулировало бы все виды данных, определяло бы права и обязанности участников рынка. Регулирование в области данных сегодня фрагментарно во всем мире.
Существует множество различных государственных проектов по регулированию данных, по словам Наумова. Например, в Канаде в 2014 г. запустили Open Government Portal для доступа к информации департаментов правительства. Похожий проект по раскрытию данных запускали в Мексике в 2015 г. Чуть позже в Израиле и Китае создавали проекты по упрощению обмена данными. В Австралии продолжают идеи Европейского Союза, по мнению Наумова. Они стремятся создать централизованный подход к раскрытию информации. В Норвегии среди различных механизмов распространения данных рассматривают технологии искусственного интеллекта.
Все страны стремятся найти баланс между защитой частной жизни и коммерческими и государственными интересами по использованию данных. Пока никому не удалось найти наиболее оптимальное решение. По словам Наумова, ближе всех к цели Япония. В этой стране реализован многомерный план использования разных видов данных. Там представлен целый список критериев в анонимизации и рисков деанонимизации.
По мнению руководителя Лаборатории машинного интеллекта компании «Яндекс» Александра Крайнова, существует две категории данных. Совместное использование первой категории, менее чувствительной к раскрытию, предельно эффективно. Но есть чувствительные данные и надо думать, прежде чем их куда-то передавать. Внутри экосистемы «Яндекса» есть данные, которые не перетекают даже из одного продукта в другой. Например, информация о том, куда пользователь поехал на такси не влияет на поисковую систему и наоборот, по мнению Крайнова. Такая информация не сильно помогает сервисам.
С другой стороны, есть агрегированная информация, которая не столь чувствительна для пользователя, но важна для сервисов. Например, можно оценить, где более всего востребованы транспортные услуги, можно проанализировать, насколько в том же месте будет востребован другой тип транспорта. Есть понятная закономерность: чем более очевидны безопасные данные, тем необходимее их совместное использование — даже выкладывание в открытый доступ.
Крайнов оценил намерение ЕС стимулировать обмен данными. Объединившись, можно делать много важных проектов. В пример Крайнов привел индекс самоизоляции, который запустил «Яндекс» в период пандемии. В пандемию коронавируса подобный обмен данными между компаниями и государством помогает лучше понять картину мира.
Подходы России и Европы к защите персональных данных довольно схожи, как отметил Заместитель руководителя Роскомнадзора Милош Вагнер. Он согласился, что данные не должны покидать определенную территорию и отметил, что в российском законодательстве это тоже предусмотрено.
Дополнительное регулирование можно рассматривать и для применения в России, по мнению Вагнера. Однако раскрытие данных из государственных источников или в результате альтруизма данных может принести пользу технологически продвинутым странам, а третьим странам это, наоборот, невыгодно, по его мнению.
Вагнер задал вопрос, как Европейский Союз намерен вовлекать третьи страны, в том числе Россию, чтобы трансграничные потоки данных циркулировали не только внутри Европейского Союза. Какие требования ставятся таким странам? В ответ Левандовски заметил, что ЕС не против трансграничного обмена данными с Россией, но есть важное условие — когда данные покидают территорию ЕС, к ним должны применяться такие же механизмы защиты, что и в Европе.
Для обмена данными не всегда нужны посредники, по словам Старшего управляющего директора департамента управления данными Сбербанка Бориса Рабиновича. Достаточно создавать экспериментально-правовые песочницы, в которых все участники эксперимента могли бы полноценно работать. Подобные проекты реализует Ассоциация больших данных.
Кроме того, Альянс по искусственному интеллекту (в него входят «Яндекс», Сбербанк и др.) планирует создать маркетплейс доступных данных и подготавливать в его рамках дата-сеты для обучения искусственного интеллекта. Это позволит разработчикам повысить качество моделей. Однако у Альянса пока нет возможности объединить данные из различных источников. Рабинович воспользовался случаем и попросил у государства помощи в разработке механизмов распространения таких данных.
Минцифры не собирается ограничивать развитие рынка данных или создавать искусственные препятствия, как уверяет Директор Правового департамента Минцифры РФ Роман Кузнецов. Более того, по его мнению, применение больших данных необходимо для развития экономики страны. Однако необходимо обеспечить защиту прав субъектов персональных данных. «Если безопасность данных приносится в жертву, мы к таким предложениям относимся с осторожность», — заверил Кузнецов. Чиновник отметил, что важно обеспечить обезличенность данных и при этом экономически эффективно их использовать. Представленная Директива о данных — это большой вызов, потому что у России пока нет готовых подобных решений.
Вопрос доверия при обмене данными — один из важнейших вопросов, по словам президента Ассоциации больших данных Анны Серебряниковой. Она согласилась с Рабиновичем, что создание равноудалённых площадок может решить эту проблему. Экспериментально-правовые «песочницы», на которых игроки обмениваются данными, позволят сформировать атмосферу доверия. Для такой «песочницы» как раз и делает проект Ассоциация больших данных. Это площадка, где крупные компании доверяют друг другу, делятся обезличенными данными и реализуют совместные проекты. В таких «песочницах» происходит обмен обезличенными данными, но не персональными.
Серебряникова также отметила успех в использовании обезличенных медицинских данных в период пандемии. Медицинские организации оказались пионерами в области данных, разрешив использовать их искусственному интеллекту. Этот опыт нужно повторить и в других отраслях, чтобы открывать обезличенные данные для искусственного интеллекта.
За последние годы Россия сделала большой шаг в раскрытии нечувствительных данных, по словам директора Департамента управления делами Министерства экономического развития Василия Пушкина. Создан портал открытых данных data.gov.ru, на нем размещено более 20 000 читаемых машинами наборов данных. “Однако не все наборы соответствующего качества,” — посетовал он.
Дополнительное регулирование требуется в области чувствительных данных для их раскрытия и формирования требований к потенциальным потребителям этих данных, по словам Пушкина. В прошлом году вышел закон об экспериментально-правовых режимах, а сейчас готовятся дополнительные требования. Они позволят создать новую «песочницу» по работе с большими данными. В рамках этой «песочницы» проверят контроль за данными и качество их обезличивания. Это позволит сформировать критерии обезличивания данных