в будущем частной жизни может не остаться места.



Предыдущая | Следующая
 

Вы носите телефон, пользуетесь публичным Wi-Fi, на улицах вокруг вас камеры, а на вашем ноутбуке хранятся личные фотографии. Вам кажется, что никто не знает про вас больше, чем вы рассказываете сами. Но контекстная реклама в поисковике в курсе, что вы задумали купить новый автомобиль, а таргетированные объявления в социальной сети показывают горящую путевку в вашу любимую страну. На самом деле, тот, кто вами заинтересуется всерьез, узнает все. В современном мире анонимность исчезает.

Бельгийский университет UCLouvain и британский Imperial College London провели исследование об анонимности, а The Guardian опубликовал их выводы: ученые обнаружили, что полностью анонимизировать сложные наборы данных на текущий момент невозможно. Согласно построенной модели 15 демографических атрибутов раскроют личность носителя с вероятностью 99,98%. В реальности для достижения результата понадобится даже меньше: в 2008 году анонимный массив данных с рейтингами фильмов Netflix был деанонимизирован — путем перекрестного сравнения оценок с оценками на IMDb.

Имея базу обезличенных данных, специалист составит SQL-запрос, включающий нужное количество атрибутов — и найдет искомого человека. Вероятности подсчитаны выше. Данные о вас собирают постоянно: во время регистрации на новом онлайн-сервисе, при посещении частной клиники или при заказе такси в приложении. Но можно шагнуть еще дальше — сегодня бурно развиваются нейросети, работающие с big data. Они в состоянии переварить гигантские массивы данных. И уже помогают искать людей в толпе.

В 1994 году в Китае была основана компания Tiandy Technologies Co, специализирующаяся на видеонаблюдении. Тогда в Китае — да и остальном мире — это было новой отраслью. За прошедшие годы ее владелец, Дай Лин, стал миллиардером, а Tiandy является одним из ведущих поставщиков оборудования для национальной системы видеонаблюдения в Китае. По количеству камер видеонаблюдения Китай находится на первом месте в мире.

 

В Чунцин, крупнейшем городе центрального подчинения Китая, установлено 2 600 000 камер. 168 камер на тысячу человек, к 2020 году прогнозируют по одной камере на каждую пару людей. Громаднейшая система, которая в связке с ИИ уже используется для постоянного наблюдения за гражданами. Любопытно, но проект носит название China Skynet. С одноименным искусственным интеллектом из вселенной Терминатора система имеет не так много общего — она не сражается с людьми, а помогает одним следить за другими.

Национальная система видеонаблюдения Китая распознает конкретного человека в толпе людей — в 2017 году корреспондент BBC Джон Судворт (John Sudworth) вместе с полицией Гуйяна проверял эффективность ее работы. Полицейские получили в распоряжение его фотографию, а сам Джон отправился в импровизированный побег. Корреспондента поймали за семь минут: он направился к железнодорожной станции, по пути был зафиксирован тремя камерами видеонаблюдения. На самой станции Скайнет также сумел его идентифицировать. Там его уже ждала полиция. Разумеется, Джон не прибегал к хитроумным уловкам и не пытался уйти в подполье: но факт — если ты попадешь в объектив хотя бы одной камеры, то тебя поймают.

На достигнутом Китай не останавливается: контент, размещенный в групповых чатах и социальных сетях, проверяется, отдельные группы населения обязывают устанавливать на личные смартфоны Jingwang — приложение, которое сканирует файлы и определяет потенциально опасные. Также в Китае действует система оценки благонадежности граждан: технология отслеживает действия человека, анализирует их и решает, является ли субъект надежным гражданином. Хорошим гражданам полагаются бонусы: скидки на электроэнергию, пониженные проценты по кредитам в банке и прочее. Попавших в ряды «неблагонадежных» ждут проблемы: запрет на выезд из страны, отчисление из университета, отказ в кредите и невозможность отдать детей в лучшую школу. Неблагонадежным закрывают многие социальные возможности.

Сами китайцы изначально относились к системе настороженно, но сейчас некоторые отмечают, что она помогает — люди заботятся о своих баллах. Для этого они исправно платят по кредитам, соблюдают правила ПДД, прилично ведут себя в общественных местах. Кажется, что система делает общество лучше. Но с ней есть проблемы: китайский студент был отчислен за то, что его отец не смог расплатиться с кредитом в $29 900. Отец угодил в черный список должников, его рейтинг благонадежности упал — социальный рейтинг сына также понизился, и он не смог продолжить обучение.

Изображение: MERICS

Подобные системы способны повысить общественную безопасность и комфорт, если они будут работать на благо. В то же время они являются грозным оружием в руках системы, которая желает контролировать каждый шаг людей. Вы хотите, чтобы вас оценивали по вашим друзьям и знакомым, по заведениям, которые вы посещаете в пятницу, по списку ваших покупок, запросам в Интернете и плейлисту? Никто не захочет остаться без частной жизни. Людям необходимо личное пространство.

Не думайте, что рассказанное выше является исключительно уделом китайцев — в России система распознавания лиц уже работает в метро, а Сергей Собянин сообщил, что в 2019 году она заработает и на московских улицах. Схожая система есть в Англии: в Лондоне и окрестностях установлено около 500 000 камер. Они помогают отслеживать преступников.

В будущем эти системы шагнут дальше, они научатся не просто распознавать лица — они смогут определять эмоции человека в толпе. Посетите выставку про Интернет вещей или ИИ, и вы с большой вероятностью найдете там площадку о безопасных городах. И там будут доклады о глобальных системах видеонаблюдения и отслеживания. Эти механизмы — непременный атрибут нашего будущего. За вашими действиями в интернете уже сейчас следят, вашими персональными данными уже торгуют. Данные о людях будут собираться, учитываться и обрабатываться искусственным интеллектом, а за самими людьми на улицах будет следить система наблюдения. Хочется верить, что это станет инструментом повышения безопасности и комфорта жизни граждан и не приведет нас во вселенную «1984» Джорджа Оруэлла.

 

о китайском скайнете (слежка)
https://www.nature.com/articles/s41467-019-10933-3
Абстрактные
В то время как богатые медицинские, поведенческие и социально-демографические данные являются ключом к современным исследованиям, основанным на данных, их сбор и использование вызывают законные проблемы конфиденциальности. Анонимизация наборов данных путем де-идентификации и выборки перед их распространением является основным инструментом, используемым для решения этих проблем. Здесь мы предлагаем метод генеративной связки, который может точно оценить вероятность того, что конкретный человек будет правильно идентифицирован, даже в сильно неполном наборе данных. На 210 популяциях наш метод получает оценки AUC для прогнозирования индивидуальной уникальности в диапазоне от 0,84 до 0,97 с низкой частотой ложного обнаружения. Используя нашу модель, мы находим, что 99,98% американцев будут правильно повторно идентифицированы в любом наборе данных, используя 15 демографических атрибутов. Наши результаты показывают, что даже анонимизированные наборы данных с высокой степенью выборки вряд ли будут соответствовать современным стандартам анонимизации, установленным GDPR, и серьезно оспаривают техническую и юридическую адекватность модели освобождения и забывания де-идентификации.
и далее в статье

---

https://www.theguardian.com/technology/2019/jul/23/anonymised-data-never-be-anonymous-enough-study-finds
«Анонимные» данные лежат в основе всего, от современных медицинских исследований до персонализированных рекомендаций и современных методов искусственного интеллекта. К сожалению, согласно статье, успешно анонимизировать данные практически невозможно для любого сложного набора данных.

Предполагается, что в анонимном наборе данных была удалена вся информация, позволяющая установить личность, при этом сохранялась основная полезная информация, позволяющая исследователям работать, не опасаясь вторжения в частную жизнь. Например, больница может удалить имена, адреса и даты рождения пациентов из набора медицинских карт в надежде, что исследователи смогут использовать большие наборы записей для выявления скрытых связей между состояниями.

Но на практике данные могут быть анонимизированы различными способами. В 2008 году анонимизированный набор рейтингов фильмов Netflix был анонимизирован путем сравнения рейтингов с публичными оценками на веб-сайте фильма IMDb в 2014 году; домашние адреса нью-йоркских таксистов были обнаружены из анонимного набора данных отдельных поездок по городу; и попытка департамента здравоохранения Австралии предоставить анонимные данные о медицинских счетах может быть подтверждена перекрестными ссылками на «обыденные факты», такие как год рождения у пожилых матерей и их детей или у многодетных матерей.
и далее по статье

---