Матрица атакует! О тайне частной жизни придется забыть
В США началось тестирование компьютерной системы ADVISE, после запуска которой о тайне частной жизни американцам придется забыть. Вы уже запаслись сухим горючим (уротропином), ацетоном и серной кислотой? Поинтересовались, как сделать из всего этого циклотриметилентринитроамин (гексоген)? И выразили вдобавок в своем блоге неприязнь к политике Джорджа Буша? Поздравляем! Вы на карандаше у американских спецслужб. Фантастическая картина будущего без преступлений, нарисованная пять лет назад Стивеном Спилбергом в фильме “Особое мнение”, как никогда, близка к реальности. Но если в кино предсказанием преступлений занимались люди, обладающие даром предвидения, то природа реальных современных систем обнаружения дурных намерений – небиологическая. На днях министерство национальной безопасности США начало тестирование компьютерной системы ADVISE, способной выяснить всю поднаготную любого гражданина или гостя Америки и даже спрогнозировать, не собирается ли он захватить, к примеру, самолет и куда-нибудь на нем врезаться.
Власть – Советам
В январе 2003 года губернатор штата Флорида Джеб Буш принимал у себя вице-президента США Дика Чейни. С особой настойчивостью брат хозяина Белого дома демонстрировал дорогому гостю созданную местной компанией Seisint, Inc. компьютерную программу “Матрица” – по обмену антитеррористической информацией между штатами – и просил помочь с выделением средств на ее доработку. Чейни на уговоры не поддался, несмотря на родственные связи радушного хозяина. Просто потому, что в то время администрация Джорджа Буша уже финансировала создание более сотни всевозможных “матриц” – систем сбора и анализа персональной информации. Спецслужбы США, не сумевшие предупредить террористические атаки 11 сентября 2001 года, не жалели сил и денег на реализацию проекта TIA (Total Information Awareness) – “Тотальное информационное предупреждение”. На словах проект этот был направлен на заблаговременное предотвращение терактов, на деле – грозил покончить с частной жизнью как таковой. Даже прежний состав Конгресса, лояльный администрации Буша, в конце концов возмутился и летом 2003 года напрочь запретил TIA – по причине нарушения закона о защите частной информации.
Но идея “матрицы” не умерла. Как выяснилось, перспективные программы сохранились в недрах американских ведомств и финансируются по тайным статьям расходов, неподотчетных Конгрессу. В частности, специалисты министерства национальной безопасности проводят тестирование электронной системы ADVISE (Analysis, Dissemination, Visualization, Insight and Semantic Enhancement, что можно перевести как “анализ, распространение, наглядное воспроизведение, понимание и осмысление информации”). В бюджете текущего года на нее отпущено 40 миллионов долларов. Аббревиатура названия программы созвучна английскому слову “советовать”. А потому к современной Америке вполне применим лозунг “Власть – Советам”. Дело в том, что система ADVISE не только предоставляет, как это говорится в официальных бумагах, “практические возможности для антитеррора”, но и позволяет отслеживать частную жизнь буквально каждого человека.
В настоящее время прототипом системы пользуются аналитики разведуправления министерства национальной безопасности. Программа перелопачивает базу данных министерства и некоторые другие информационные массивы с целью поиска следов террористической активности. При этом ADVISE является ядром разрабатываемой правительством США крупномасштабной компьютерной системы, способной накапливать гигантские массивы информации и связывать на первый взгляд не имеющие друг к другу отношения данные в целостную картину. Анализируется все, начиная от интернетовских блогов и электронной переписки и заканчивая правительственными документами и разведывательными докладами.
Эта “матрица” развивается по так называемой спиральной схеме, то есть одни ее части уже функционируют, в то время как другие находятся на разных ступенях разработки. И каждый новый кирпич в этом здании, по мнению противников проекта, сокращает пространство частной жизни. “Программы, подобные ADVISE, вот-вот будут способны в полной мере связывать друг с другом любые электронные следы, которые мы оставляем, – говорит сотрудник организации Electronic Frontier Foundation (EFF) Ли Тиен, – накапливать, анализировать их в таких комбинациях, которые нам и в голову не приходят, когда мы живем своей обычной жизнью и делаем такие привычные вещи, как покупка продуктов, заправка машины или путешествия в Интернете”.
Представители министерства национaльной безопасности США утверждают, что программы, работающие по технологии Data Mining, уже позволили раскрыть ряд террористических заговоров. Например, летом прошлого года были предотвращены якобы готовившиеся попытки захвата авиалайнеров.
Компьютер – двигатель торговли
Возможно, правозащитники даже слишком осторожны в своих оценках. Дело в том, что программы, подобные ADVISE, уже активно используются. Они основаны на технологии data mining. В русском языке пока нет аналога этому термину. Согласно новейшим словарям, речь идет не просто о сборе, накоплении или анализе огромных массивов данных, а об их специфической сортировке и выявлении скрытых закономерностей в, казалось бы, никак не связанных между собой событиях. Первыми метод взяли на вооружение маркетологи. Простейший пример: если компьютерный анализ чеков на покупки показывает, что клиенты, покупающие уксус, обычно берут также и хлеб, то служащие отдела маркетинга рекомендуют ставить эти товары рядом.
Сама по себе техника “дэйтамайнинга” не нова. Она используется в математике, кибернетике, генетике. В ее теперешнем виде система была изобретена и запатентована инженерами компьютерной компании IBM. Сравнительно быстро ее освоила американская индустрия торговли, давно присматривавшаяся к инструментам выявления закономерностей в поведении и предпочтениях покупателей.
Торговые сети стали сводить в целое электронную информацию, оставляемую гражданами в различных местах, и создавать индивидуальные и групповые профили потребителей. Они включают SSN (номер социального обеспечения), сведения о здоровье и заболеваниях, доходах, привычках, расовой и этнической принадлежности, семейном положении, размерах одежды, типах имеющихся автомобилей, арестах и судебных разбирательствах, членстве в клубах, любимых книгах, наличии или отсутствии животных в доме, круге общения и т. д. Наверняка многие американцы удивятся, если узнают, что одна из фирм, создающих и продающих такие профили, – Claritas – делит всех граждан Америки с точки зрения потребления на 15 групп: “пригородная элита”, “городской цвет”, “влиятельные”, “общество малых городов”, “весомые провинциалы”, “крестьяне” и другие.
Точки на графике
Совокупность программ, создающих подобные профили, объединяется термином “бизнес-разведка”. Она работает с большими объемами информации – будь то базы данных или неструктурированный текст. Самое же занятное в системе – это семантический анализ. Яркий пример реализации семантики – раздел “Новости” портала “Яндекс” (news.yandex.ru). Программисты “Яндекса” научились не только упорядочивать события по темам, но и выделять цитаты персон, сортировать их по популярности. Корпоративные и государственные системы “шпионажа” расширяют эти функции и даже позволяют предсказывать отдельные события, находить потайные связи между людьми и явлениями. Например, система ADVISE рассчитана на обработку всей общедоступной и корпоративной информации в Интернете – от финансовых документов до новостных выпусков Си-эн-эн – и их сопоставление с документами американской разведки и правоохранительных органов.
Как это работает? В основе компьютерных систем обработки персональных данных лежит объектная модель. Семантический анализ выделяет из общего контекста людей, места, вещи, организации, события. На втором этапе между объектами устанавливаются связи. Например, человек A живет в городе Б и работает в организации В. Но самое интересное происходит на третьем этапе анализа – предсказательном. Из того, что два человека работают в одной и той же компании и имеют общего друга, система может решить, что они тоже дружны между собой. Такие неожиданные и неочевидные с первого взгляда выводы, которые делает компьютер, способны сильно помочь бизнесу. И не только ему.
Представление о том, зачем созданные для анализа потребительских предпочтений программы понадобились спецслужбам, дают имеющиеся в распоряжении “Итогов” материалы специального семинара, который был проведен министерством национальной безопасности США. В соответствии с заданными программой параметрами система создает “информационные единицы”, или “тела”, для дальнейшего хранения. Объемы хранимой информации по каждой теме поистине астрономические – один квадриллион “тел”. Если каждое “тело” считать размером с копейку, то, уложенные друг на друга, они составят почти километровую колонну.
Правда, хранение информации само по себе бессмысленно без умения своевременно извлекать нужное. И здесь заключена главная ценность разрабатываемой системы. Даже текстовые материалы она способна представлять в виде смысловых наглядных графиков. Изображенные в виде разноцветных точек “тела” нумеруются, и от них тянутся линии, отражающие степень их связанности друг с другом. На экране возникает картина, иногда напоминающая химическую формулу кристалла, а чаще – звездное небо. Элементарная ситуация: люди (черные точки), места работы (красные точки) и места проживания (голубые точки) в разной степени связаны друг с другом. На графиках отражаются буквально все связи людей, мест и событий, причем как несомненные, так и слабые или предполагаемые. Система обладает возможностями анализировать до трех миллионов таких связей в час.
Американские правозащитники ради сохранения тайны личной жизни советуют оставлять как можно меньше электронных следов – в частности, пореже пользоваться кредитными картами.
Правительственные источники утверждают, что ADVISE уже помогла вычислить некоторые террористические заговоры. На основе ее технологического дизайна строится ряд других систем предупреждения о возможных терактах.
В Америке далеко не все верят в благую цель создателей “большого брата”. После появления сообщений о системе ADVISE сенатор-демократ Расс Файнгольд решительно высказался за проверку счетной палатой Конгресса ее соответствия законодательству.
Тем временем эксперты из EFF и Центра защиты частной электронной информации (EPIC) призывают сограждан помнить, в какое время мы живем, и не оставлять без крайней на то необходимости своих компьютерных следов. Вот некоторые советы, которые предлагает EPIC. Минимизируйте количество информации личного характера, сообщаемой коммерческим или правительственым организациям, не сообщайте номер вашей соцстраховки никому, кроме случаев уплаты налогов, устройства на работу и открытия банковского счета. Не отвечайте на присылаемые вам по электронной почте предложения обзавестись кредитной карточкой, делайте это через ваш постоянный банк, не забыв при этом попросить его сотрудников ни с кем не делиться вашей личной информацией. Настаивайте на том, чтобы в банках, брокерских конторах, страховых компаниях и других организациях вас внесли в специальный список клиентов, запрещающих передачу кому бы то ни было персональных данных. Помните, что в этом случае американский закон о защите частной жизни целиком на вашей стороне. Не заполняйте вопросников в гарантийных карточках при покупках бытовой техники, достаточно хранить чек и сообщить только контактную информацию. Не покупайте ничего у продавцов, предлагающих товары по телефону. В противном случае вы попадете в список “респондентов”, который скорее всего окажется проданным десяткам или даже сотням других продавцов, и вас в лучшем случае завалят спамом, а в худшем – окажетесь точкой на графике системы ADVISE.
Справка: по оценкам исследовательской компании Gartner, за последние несколько лет фирмы по всему миру накупили уйму программного обеспечения. Только на лицензии систем управления предприятием (ERP), взаимоотношениями с клиентами (CRM), персоналом (HRM) и т. д. было потрачено свыше 40 миллиардов долларов. Оценки того, сколько терабайт информации скопилось в этих системах, никто не делал. Но и так понятно, что это огромный объем данных, в котором легко запутаться не только человеку, но и компьютеру. Как извлечь из этой информации пользу? На помощь приходит новый способ обработки данных – “системы добычи данных” (data mining) и управления знаниями (know-ledge management). Работая в тесной смычке, data mining и knowledge management формируют рынок средств информационной бизнес-разведки (business intelligence, BI). Спрос на средства BI по сравнению с общим рынком IT растет опережающими темпами. По оценкам, объем рынка BI в 2006 году должен был достичь 2,5 миллиарда долларов.
Николай Зимин, Сергей Коляда, Итоги