Forbes Russia: Как в России будут регулировать большие данные

Одной из самых обсуждаемых тем форума RIW (Russian Internet Week) стали большие данные. В России до сих пор не понимают, что считать большими данными и как с ними работать.

Большие данные позволяют получать новую, неожиданную и даже секретную информацию. Согласно прогнозам, рынок больших данных к 2022 году вырастет до $119 млрд. Кому они достанутся и что на этом рынке будет делать Россия?

Многие эксперты, выступавшие на RIW, отмечали, что в большинстве случаев термин «большие данные» используется не совсем корректно: он предполагает любые данные, из которых можно извлечь некую информацию, причем совсем не обязательно, чтобы они имели большой объем.

Тем временем в России 23 ноября в Госдуму был внесен законопроект, который наделял статусом больших пользовательских данных базы на 1000 абонентов и более. Контролировать работу с данными будет «Роскомнадзор».

Контроль информации

К 2024 году рынок больших данных в России достигнет 300 млрд рублей. В связи с этим важно разграничить понятия и подходы к регулированию персональных и больших деперсонифицированных данных, предупреждает президент Ассоциации участников рынка больших данных, операционный директор «Мегафона» Анна Серебряникова. Персональные данные уже регулируются законом о персональных данных, и излишние запреты в области больших данных не позволят бизнесу реализовать потенциал роста цифровых продуктов и услуг, созданных на основе анализа больших данных. Выступая на RIW, она отдельно отметила важность усилий Ассоциации по организации доступа к большим данным для стартапов и других участников рынка, не обладающих массивами больших данных, чтобы разработки в этой области могли вести все участники рынка.

Директор Ассоциации участников рынка данных, директор АНО «Информационная культура» Иван Бегтин отметил, что после того, как прекратилась активная деятельность Открытого правительства Михаила Абызова, стало сложно получать информацию из государственных источников открытых данных. Приходится заниматься длительной перепиской по каждому случаю.

«Нужна прозрачная политика предоставления этой информации, государство должно начать выступать в роли мягкого регулятора, — объясняет Бегтин. — В России более 300 государственных информационных систем, многие из которых несовместимы друг с другом. Регулятор мог бы взять на себя функцию оптимизации их работы, чтобы можно было с помощью одного инструмента получать данные из разных систем».

Компромиссной точкой зрения могло бы стать предложение вице-президента и технического директора Mail.Ru Group Владимира Габриеляна. Он считает, что до тех пор, пока взаимодействие между обладателями данных (компаниями) и их субъектами (пользователями) еще не сложились, правильно будет регулировать оборот таких данных, этические моменты и способы обеспечения безопасности субъектов данных средствами саморегулируемых организаций, состоящих из профессионалов рынка. Только после того, как будут выработаны приемлемые для всех участников нормы и правила, станет возможным перенести их в законодательное поле. Принятие законодательных актов на текущем этапе приведет, с одной стороны, к деформации возможных взаимодействий участников рынка, а с другой, к устареванию законодательных актов сразу в момент их принятия ввиду быстрого развития рынка.

Безопасность данных

Одна из главных опасностей при использовании больших данных — слишком большие возможности. Как отметили участники эксперты, когда большие данные помогают быстро проехать маршрут, пользователь их воспринимает благосклонно, но когда для него таргетируют более эффективную рекламу, он, скорее всего, отнесется к этому негативно.

При этом данные не обязательно должны быть персонализированными. При наличии достаточного количества наблюдений привычки пользователя можно предсказать по нескольким его действиям. Примерно так подбираются фильмы онлайн-сервисами. После выбора нескольких картин пользователя относят к одному из сотен (или тысяч, или даже десятков тысяч) профилей: этого хватает, чтобы предсказать его вкусы. Хорошо, когда человек сам хочет, чтобы его предпочтения были угаданы, однако далеко не все стремятся к тому, чтобы об их вкусах узнали.

Кроме того, некоторые технологии не нарушают правил и законов, но могут пересечь дозволенную черту при соответствующем применении. Это необходимо учитывать, выбирая меры для обеспечения безопасности больших данных.

Тема больших данных по-прежнему находится на этапе осознания, как и обсуждение связанных с ней рисков, высказал свою позицию вице-президент, исполнительный директор Кластера информационных технологий Фонда «Сколково» Константин Паршин. Приводя пример Liberator — распечатанного на 3D-принтере пистолета, — он отметил, что вряд ли можно было предсказать такой вариант использования 3D-печати.«В мире данных мы живём гипотезами: здесь регулирование становится ответом на прецеденты. Мы ещё не сталкивались с серьёзной утечкой или неправомерным использованием больших данных, а уже говорим о регулировании, — заметил Паршин. — Вопрос в том, что невозможно предсказать те угрозы, которые могут произойти: будет отрегулировано в одном месте, проблема случится в другом. В противном случае нам пришлось бы по аналогии запретить любое автомобильное движение, чтобы обезопасить людей».Константин Паршин предположил, что наиболее правильный метод — это создание организаций и структур быстрого реагирования, которые смогут оперативно прорабатывать меры регулирования по конкретным кейсам.

«Надо воспринимать работу с любыми данными таким образом, как будто это ваши личные данные, — призывает Габриелян. — Любой факт использования данных может как сделать жизнь людей проще, так и оказать неприемлемое влияние на мнение пользователя.

Касательно вопроса прав на данные, собранные площадкой (соцсетями и операторами), Габриелян сказал, что взаимодействие с пользователем в части удаления или изменения этих данных должно происходить через ту точку (площадку), на которых он их изначально размещал.

Представитель Администрации президента Алексей Гореславский отметил, что у госорганов нет задачи вводить новые законы, но есть желание сделать более релевантным регулирование больших данных. «Давайте не будем друг друга агитировать использовать большие данные. Мы все понимаем их перспективы, — сказал Гореславский. — Давайте обсуждать правила этого общежития, давайте формулировать их совместными усилиями».

Заместитель директора АНО «Институт развития интернета» Ренат Салихов отметил, что с ростом объёма данных, а также развитием инструментов для их обработки и анализа, возрастает ценность информации, которую они несут, а также риски при утечке или несанкционированном использовании. Он добавил, что есть разные данные: большие, персональные, а ещё государственные, биометрические, а также множество других видов. Все они требуют разного подхода в вопросе оборота и регулирования. «Участникам рынка необходимо объединяться, чтобы выработать общие элементы и разумные правила работы с данными, которые максимально защищают интересы пользователей и государства, гарантируют безопасность, при этом давая развиваться бизнесу. Для этого нужна площадка для формирования консолидированной позиции отрасли», — заключил Салихов.

Заметные игроки рынка сошлись на том, что независимо от уровня контроля важно не задушить саму возможность работы с большими данными для развития индустрии.

Александр БАУЛИН, Forbes Staff