После терактов 11 сентября 2001 года американцы выступили с инициативой
о создании специального центра по анализу и визуализации данных.
Подробнее об этой программе рассказывает Сергей Матвеев, генеральный
директор компании EligoVision.
 Сергей Матвеев, компания EligoVision. Давайте вспомним известный шпионский
фильм-триллер "Три дня Кондора" – экранизацию нашумевшего в свое время
романа Дж. Грейди, написанного в 1974 году.
"Три
дня Кондора" – это история о работе американских спецслужб. Кондор –
работник одного из замаскированных отделов ЦРУ в Нью-Йорке – занимается
сравнительным анализом бульварно-детективной литературы и данных,
которые он получает из средств массовой информации. В результате герой
фильма приходит к выводам, которые невозможно получить при помощи
средств реальной разведки, к таким, например, как прогноз
надвигающегося переворота, террористических актов, появлений новых
изобретений и т.п. То есть это сюжет об анализе и выборке точечной
информации из разрозненных массивов данных, находящихся в открытом
доступе.
Но то фильм, а вот
и реальная история. В 60-х годах прошлого века, в то время как один из
известных советских поэтов ездил по Сибири, американцы сумели довольно
точно вычислить там, в Сибири, место, где тогда в СССР находился
крупный ядерный центр. Каким образом им это удалось? Они сделали это по
анализу текстов публиковавшихся новых стихов этого поэта, сопоставляя
их с местами, где они были написаны в процессе поездки. И опять же, все
данные были в открытом доступе.
Смысл
этих историй лично для меня заключается не в том, что существуют
какие-то особые способы получения и анализа информации. Смысл – в том,
что когда информация избыточна и получена из множества источников, ее
анализ позволяет получить гораздо более полную картину происходящих,
а также предстоящих событий.
После
терактов 11 сентября 2001 года американцы выступили с внутренней
инициативой о создании специального центра по анализу и визуализации
данных – National Visualization and Analytics Centre (NVAC). Главная
идея программы заключалась в том, как найти способы для "анализа
огромных массивов противоречивой, несовместимой и динамической
информации для определения и предотвращения внешних угроз, для защиты
внешних и внутренних границ страны и для адекватной реакции на
террористические акты и другие катастрофы".
Первый
этап программы стартовал в 2004 году и был рассчитан на 5 лет. Для
работы были приглашены ученые из лучших университетов, занимающиеся
визуализацией данных, а также эксперты в области написания алгоритмов
и создания математических методов обработки информации. Основная цель
инициативы NVAC – обеспечить государственную безопасность на всех
уровнях. Следовательно, средства, которые предстоит использовать
в работе, должны быть настолько совершенными и инновационными, чтобы
позволить анализировать огромные потоки данных, находящиеся сейчас
в открытом доступе, вычленять из них нужную информацию
и преобразовывать ее в понятные визуальные образы.
Визуальная
информация, постоянно поступающая в центр аналитики и визуализации,
многомерна, поэтому было принято решение представлять ее в трехмерном
виде – так человеку удобнее всего ее воспринимать. Это было важно еще
и потому, что со всеми данными на первом этапе работают обычные
операторы – работники ситуационных центров. А если в процессе
мониторинга возникают сложные ситуации, то к работе подключаются
эксперты.
Как же выглядят
вычлененные и преобразованные массивы данных на экранах мониторов
ситуационных центров? Как правило, эта информация представлена в виде
некоей геометрической формы, которая постоянно видоизменяется в связи
с поступлением новых данных в реальном времени. Это может быть
раскрашенная разными цветами поверхность или объемная структура
переменной плотности, которая будет вести себя как "живой" организм,
движущийся в зависимости от того, какая информация и в каких пропорциях
она входит в общий поток выбранных данных. Изменение цвета на
поверхности трехмерного объекта может означать превышение порога,
который задается экспертами. Например, мы смотрим на экран – и сразу
понимаем, сколько самолетов прилетело и куда, как в данный момент
происходит эвакуация населения или как изменились климатические условия
в регионе.
Практически все
данные представлены не в виде цифр или таблиц, а в виде трехмерных
геометрических образов со структурой разной плотности, поэтому кроме
алгоритмов вычленения информации и ее визуализации программа NVAC
нацелена и на разработку специальных устройств взаимодействия
с объемными визуальными "массивами" данных. Наша разработка – UnID
Pointer EligoVision – как раз подготовлена для работы с трехмерными
данными в ситуационных центрах и для взаимодействия с ними в реальном
времени.
Для чего это нужно?
Нам мало того, что мы видим на поверхности объекта аварийную зону
покраснения, – нам нужна возможность управлять этими данными
и моделировать ситуации в реальном времени, летать над поверхностями,
делать срезы, выводить определенную часть информации в отдельном окне,
изменять параметры и вносить различные весовые коэффициенты для данных.
Так, при наводнениях мы моделируем насыпи и дамбы, используя данные,
поступающие в реальном времени. Мы можем получить прогнозы
и смоделировать объемы осадков, которые должны выпасть на территории,
чтобы достичь критического уровня; определить, какие территории
необходимо эвакуировать и в какие сроки. Все модели строятся в реальном
времени на той геометрической объемной модели местности, которая
построена на основе данных, полученных со спутника. Программа NVAC
требует разработки многопользовательских, многофункциональных устройств
управления многомерными данными, и возможно, что UnID Pointer окажется
именно тем устройством, которое станет частью единой системы.
 Визуальный анализ позволяет наглядно представить взаимоотношение между переменными в комплексных многомерных массивах.
Работа
по созданию единых методов анализа и визуализации данных идет сейчас не
только в NVAC. В мире ежегодно проводятся крупные конференции по
визуализации информации, а также специализированные конференции, где
эксперты представляют различные алгоритмы работы с многомерными
данными. Мы легко можем визуализировать архитектурные объекты или
механизм работы сердца. Информацию же необходимо структурировать
и визуализировать так, чтобы стали понятны общие закономерности.
Количество пассажиров, температура воздуха, скорость ветра – все эти
данные нужно каким-то образом объединить и представить в виде единого
визуального, постоянно изменяющегося образа.
Программа
NVAC открыла много инициативных движений по всему миру, и сейчас
в Европе, в Азии и в России этим направлением активно занимаются.
|