Автор работы: Пользователь скрыл имя, 12 Сентября 2011 в 16:35, реферат
Одним из самых перспективных направлений работы Службы Безопасности является аналитическая разведка средствами ИНТЕРНЕТ. Этот комплекс мероприятий многие специалисты обозначают и как компьютерную разведку. Ее сущность заключается в поиске и передаче информации из компьютерных систем и сетей “всемирной паутины” с последующей верификацией и аналитической обработкой.
Глава 17. Аналитическая разведка средствами Интернет
Александр Доронин
Одним из самых перспективных направлений работы Службы Безопасности является аналитическая разведка средствами ИНТЕРНЕТ. Этот комплекс мероприятий многие специалисты обозначают и как компьютерную разведку. Ее сущность заключается в поиске и передаче информации из компьютерных систем и сетей “всемирной паутины” с последующей верификацией и аналитической обработкой.
Большой интерес к методам аналитической разведки проявляют, как государственные, так и не государственные спецслужбы. Это обусловлено тем, что в ИНТЕРНЕТ содержатся большие объемы информации, которая может представлять оперативный интерес как для первых, так и для вторых. Поэтому во многих странах, в частности в правоохранительных органах России (Управление "Р" МВД, Департамент информационной безопасности ФСБ), США (ФБР) и в Германии (ВКА), созданы специальные подразделения аналитической разведки в ИНТЕРНЕТ. Аналогичные подразделения функционируют в транснациональных корпорациях, которые все больше и больше превращаются в государства в государстве.
Помимо этого существуют
самостоятельные
Для глобальных исследований в ИНТЕРНЕТ используются специальные “процессоры сбора данных” (в некоторых источниках их называют еще “текстово-аналитические системы”, хотя название не совсем верно, т.к. анализируется не только текст, но и рисунки, чертежи и графики). В данном контексте термин “процессор” не имеет ничего общего с микропроцессором, это часть программы, которая определяет, каким образом сама программа управляет и манипулирует данными. Процессор сбора данных использует программное обеспечение, получившие название “робот”: “робот” извлекает нужную информацию, используя целый арсенал средств лингвистического, семантического и статистического анализа. Действуя автономно, процессоры сбора данных перехватывают любую запрашиваемую информацию, как только она появится в ИНТЕРНЕТ.
Самым первым был рассекречен французский процессор “Taiga” (“Traitement automatique de l’information geopolitique d’actualite”, “автоматическая обработка актуальной геополитической информации”). Этот программный комплекс первоначально разрабатывался для нужд французской разведки, где он потом ударно трудился в течение 11 лет, после чего был передан для коммерческого использования. Задачи которые перед ним ставят теперь уже гражданские специалисты остались теми же: “шарить” по ИНТЕРНЕТ для извлечения ценной информации из баз данных о патентах, сообщений информационных агентств и публикаций о научных конференциях.
Методика ведения компьютерной разведки с помощью данного программного обеспечения следующая: обрабатывая материалы открытого доступа, имеющиеся в ИНТЕРНЕТ-пространстве, программа статистического анализа составляет, так называемые карты работы в различных отраслях науки. В свою очередь, это позволяет аналитикам устанавливать наиболее перспективные научные разработки и областях, где конкуренция пока что сравнительно невелика. Результаты количественного и качественного анализа результатов работы научных лабораторий позволяют оценить степень творческой атмосферы исследовательских коллективов. Это так же может быть весьма полезным при выявлении “перспективных летунов”, то есть исследователей, которые за сравнительно короткий срок успевают поменять ряд представляющих интерес научных центров, а тем самым знакомы с многими результатами их работы.
Стоит упомянуть еще одну французскую разработку. Для проведения семантического анализа крупных информационных массивов компания “Acetic” совместно с учеными университета Париж VIII разработала пакет прикладных программ “Tropes”. Отбор требуемой информации происходит в соответствии с ключевыми словами и понятиями, связанными по смыслу. Так например, название типа самолета “Мираж” соотносится со словами “самолет”, “истребитель”, или сочетание слов “госсекретарь США” автоматически ассоциируется со словами “министр”, “политик”. Данное программное обеспечение позволяет одновременно анализировать два текстовых информационных фрагмента объемом в несколько десятков книжных томов. Помимо этого “Tropes” предоставляет возможность создавать необходимые для работы информационные “сценарии”, на основе которых автоматически осуществляется не только поиск, но и целевое группирование требуемых данных.
Технический прогресс
не стоит на месте, и весьма очевидно,
что если государственные спецслужбы
отдают для коммерческого
“Noemic”, сменивший “Taiga” на боевом посту, не только сканирует, но и автоматически осуществляет “объединение источников”, обрабатывая полученную информацию со скоростью одного миллиарда знаков в секунду независимо от того, существуют ли она в виде готовой базы данных или, например, передается электронным агентством новостей на любом языке в виде целостного текста. Этот семантический процессор сбора данных способен также подвергать обработке заслуживающие его внимания концепции, метафоры и совокупности идей. Если перед ним поставить задачу выявить, например, все случаи установления связей между гонконгскими и американскими фирмами, действующими в области микроэлектроники, за последние пять лет, то для ее выполнения ему хватит всего несколько часов.
Американский аналог этих программных комплексов, который называется “Topic”, также первоначально разрабатывался для нужд разведки. Данная система появилась на свет в результате длительных исследовательских работ, осуществлявшихся под контролем ЦРУ. Сегодня он также передан в коммерческое использование и все права на него принадлежат калифорнийской фирме “Verity”, мирового лидера по сбору документальных данных.
Не отстают от “Verity” и ее конкуренты, так например американская фирма “Intelligent Search Solutions” выпустила на рынок пакет программного обеспечения “InfoTracer”, предназначенный для сбора разведывательной информации экономического характера в сети ИНТЕРНЕТ. Для “фильтрования” информации указанное программное обеспечение использует ключевые слова и фразы, после чего автоматически составляются сообщения необходимого пользователям содержания. В них могут быть, например, данные о деловых операциях конкретной компании и ее партнерах, используемых ими технологиях и выпускаемой продукции, а также фамилии руководящего персонала.
В данной связи хотелось
бы отметить, что появление новых
сетевых информационных технологий
практически уравняло возможности
конкурентов в получении
Но следует отметить,
что аналитическая разведка средствами
ИНТЕРНЕТ, - это палка о двух концах.
Дело в том, что если отследить
и проанализировать тематику интересующих
конкретный хозяйствующий субъект
данных имеющихся в ИНТЕРНЕТ, то
достаточно просто можно построить
причинно-следственную цепочку и
выявить перспективные
А теперь вернемся в
российскую действительность и попытаемся
рассмотреть национальные особенности
ведения аналитической
Эти обстоятельства естественным
образом выделяют аналитическую
разведку в самостоятельное направление
деятельности подразделений безопасности
хозяйствующих субъектов, а в
сочетании с другими
Небольшое лирическое отступление. В данной главе мы основное внимание уделим информационно-поисковой составляющей аналитической разведки, так как в рассматриваемой нами методике поиск в ИНТЕРНЕТ - это в основном только предварительный подбор информации.
Большая часть информации, полученной в его результате, носит неявных характер и нуждается в аналитической обработке. Мой собственный опыт и практика работы моих коллег, позволяют утверждать, что только порядка 10-15 % нужной информации имеется в ИНТЕРНЕТ уже в готовом виде (необходима только верификация), а остальные 85-90 % получаются в результате сравнения, анализа и синтеза разрозненных и разбросанных по разным источникам фактов, по которым вполне можно составить хотя бы фрагментарную картину настоящего. Естественно, что информация, полученная таким образом, нуждается в уточнениях и верификации (проверке).
Но, во-первых, опять
же из личного опыта могу отметить,
что оперативность
во-вторых, как правило, на первоначальном этапе знакомства в большинстве случаев и этот объем удовлетворяет заказчика,
и, наконец, в-третьих, при наличие дальнейшего интереса к исследуемому хозяйствующему субъекту эта предварительная информация поможет заказчику расставить акценты и задать ориентиры в дальнейшей работе.
Детально с методикой аналитических исследований Вы уже достаточно подробно познакомились в главе "Информационно-аналитическая работа: обработка материалов средств массовой информации".
Кстати. Слегка переиначив вождя мирового пролетариата, стоит заметить, что вышеописанные методики “не догма, а руководство к действию”, в данной главе автор не претендует на всепригодный и всеобъемлющий алгоритм аналитической разведки. Ибо как говаривал незабвенный Козьма Прутков: “Невозможно объять необъятное”. Наша с вами цель значительно проще и прозаичнее - попытаться максимально минимизировать свои трудовые затраты, как моральные, так и финансовые.
Итак, приступим к делу.
1. Поисковые системы.
Самый простой и дешевый способ информационно-поисковой работы в ИНТЕРНЕТ - воспользоваться услугами бесплатных поисковых систем.
С помощью поисковых систем можно осуществлять различные манипуляции с информацией: индексирование текстов и поиск по одному (нескольким) ключевым словам (по индексу); морфологический поиск - разбор и отождествление различных грамматических форм слов; ранжирование по степени соответствия документа запросу.
На сегодняшний день самыми эффективными русскоязычными поисковыми системами являются Яндекс (http://www.yandex.ru), Апорт (http://www.aport.ru), Рамблер (http://www.rambler.ru). Из личного опыта могу посоветовать начинать именно с Яндекса, у него самая производительная поисковая машина, к тому же на его сайте имеются ссылки практически на все другие поисковики.
Поиск нужной информации в данном случае осуществляется по следующему алгоритму: задается ключевое (поисковое) слово или фраза, и система ищет данное слово или фразу в базе данных автоматически составленной поисковой машиной на основе текстового содержимого исследуемых сайтов.
Следуют отметить, результативность поиска в данном случае зависит от двух составляющих:
Во-первых, от степени соответствия ключевого слова или фразы поставленной информационной задаче, т.е. релевантности информационного запроса.
Причем, если по первому
запросу поисковая система
Помимо этого в современных поисковых машинах - западные AltaVista и HotBot, российские "Яндекс" и "Рамблер" существует (по крайней мере декларируется) функция интерактивного поиска ("найти похожие"). Она так же позволяет постепенно уточнить запрос: указать на один или несколько найденных документов и попросить найти документы, повествующие "о том же". Выполняется такой поиск путем превращения документа в поисковый запрос (естественно, с определенной степенью "сжатия", так как запрос слишком большим быть не может). Но нужно отметить, что работает эта функция весьма "капризно" - очень часто находит совсем не то, что ищешь.
Информация о работе Аналитическая разведка средствами Интернет