Александр Бурьяк - Аналитическая разведка
- Название:Аналитическая разведка
- Автор:
- Жанр:
- Издательство:Мир
- Год:2007
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Александр Бурьяк - Аналитическая разведка краткое содержание
Аналитическая разведка - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Мангейм Дж. Б., Рич. Р. К.: “Нас может интересовать, например, сколько времени или печатного пространства уделено интересующему нас предмету в том или ином источнике. Сколько слов или газетных столбцов было уделено каждому из кандидатов во время определенной избирательной кампании? Сколько статей или страниц бывает ежегодно посвящено в американских политологических журналах анализу государственно-политических проблем Африки?” (“Политология: методы исследования”, стр. 283) Привлекательность контент-анализа - в легкости осуществления собственно подсчета при условии использования компьютеров, опасность - в возможных последствиях недостаточного учета контекста.
Мангейм, Рич: “Возможная ошибка, связанная с грубо прямолинейным подсчетом слов, состоит в том, что одно и то же слово может употребляться в самых разных контекстах, изменяющих его значение.” (там же, стр. 274) Чтобы избежать такой ошибки, следует анализировать контекст. Это может делать оператор либо (с худшим качеством, но быстрее) компьютерная программа. “Прежде всего необходимо учитывать, что сообщения публикуются и соответствующим образом составляются не просто так, а с какой-то определенной целью - информирования, описания, призыва, предписания, самозащиты или даже дезинформации.” (стр. 285) “Если мы должны дать адекватную оценку значимости некоторого сообщения, нам зачастую надо для этого знать, кому оно адресуется и как распространяется.” (стр. 286) 18.6. Системы для фильтрования данных
Текстов в открытых источниках, как правило, много больше, чем способна проанализировать даже очень мощная разведывательная служба. Поэтому перед тем, как подвергнуться анализу, тексты обычно проходят фильтрование: разделение на скорее всего нужные и скорее всего ненужные.
Назначение программной системы для фильтрования данных - отбор текстов или текстовых фрагментов, содержащих требуемые сведения. Фильтрование может осуществляться формально (компьютерной программой) или неформально (оператором). Обычно сначала осуществляется формальное фильтрование, после чего полученные данные дополнительно проходят неформальный отбор. Также можно говорить о предварительном фильтровании, осуществляемом на уровне источников, авторов, заголовков, ключевых слов, резюме, и об окончательном фильтровании, осуществляемом на уровне полных текстов.
Программа формального отбора ищет тексты или текстовые фрагменты, содержащие указанные ключевые выражения. Программа должна узнавать ключевые выражения в различных вариантах их написания. Поиск может вестись в пределах файла, каталога, тома. На выходе программы может быть файл со строками или абзацами, содержащими нужные выражения, и ссылками на файлы, в которые эти строки или абзацы входят.
18.7. Системы поддержки неформального анализа текстов
В системах поддержки нетипового анализа больших массивов текстовых данных могут предлагаться следующие возможности:
- расцвечивание компонентов текста;
- поиск фрагментов текста;
- создание выборок фрагментов текста;
- параллельная демонстрация фрагментов текста;
- создание ссылок между фрагментами;
- размещение “закладок” различных типов;
- поддержка различных вариантов редакции фрагментов текста;
- поддержка различных вариантов структуризации для одного и того же набора фрагментов текста.
Возможные цели неформального анализа: выявление …
- замысла;
- представлений, лежащих в основе текста;
- слабых мест (противоречий, повторений, чрезмерных или недостаточных детализаций, очевидностей, неполноты или лишнего, неоптимальностей структуры);
- интеллектуального уровня, мыслительных парадигм и информированности авторов;
- состояния текста (законченный, почти законченный, далекий от завершения);
- перспективы доработки и использования текста.
18.8. Базы данных аналитической разведки
Для обеспечения разведывательной деятельности создаются базы данных следующих разновидностей: документарные, гипертекстовые, фактографические, геоинформационные, семантические.
*
Документарная база данных содержит документы в том виде, в котором они попали к разведслужбе или были разработаны ею. По возможности каждый документ дополняется следующим материалом:
- классификационным кодом;
- резюме (т. е. кратким пересказом);
- набором дескрипторов (т. е. ключевых слов);
- аннотацией (т. е. оценкой значимости, достоверности, состояния и пр.);
- списком имеющихся в документе ссылок на другие документы базы данных;
- списком ссылок на данный документ из других документов базы данных;
- формуляром доступа к документу: кто, когда, в связи с какой задачей обращался к нему;
- произвольными комментариями к документу, оставленными теми, кто имел к нему доступ.
В качестве ключей поиска могут использоваться следующие атрибуты документа: автор, язык, страна, дата публикации, подготовившее документ учреждение и т. п.
Документ может быть размечен. Разметка осуществляется посредством шрифтов, цветов, ссылок, дополнительных знаков, рамок, подзаголовков, пунктов, смещений и т. д. Различается авторская разметка и комментаторская разметка. Для одного документа может храниться несколько вариантов разметки.
Возможные запросы к документарной базе данных аналитической разведки:
- найти все документы, относящиеся к указанной теме;
- найти все документы, содержащие указанные фразы в названии;
- найти все документы, содержащие указанные фразы в тексте;
- найти все документы, ссылающиеся на указанный документ;
- найти все документы, на которые ссылается указанный документ;
- и т. д.
*
Если в документарной базе данных всякий текст представляется как линейная последовательность строк, то в гипертекстовой - как иерархия или сеть фрагментов, связанных взаимными ссылками.
Гипертекст - набор текстовых фрагментов, не имеющих линейного порядка, но связанных взаимными ссылками. Р. А. Грайс: “Различия между гипертекстом и написанным в стандартной форме документом состоит в том, что в гипертексте мы обеспечиваем пользователей связями, необходимыми для перехода от одного фрагмента в тексте к другому; традиционная публикация может иметь или не иметь такие связи (ссылки), но даже если они определены, то часто не обеспечивают быстрого доступа к смежной информации, как это предлагает гипертекст.” (ст. “Создание информационного пространства для потребителей с использованием гипермедиа”) Можно выделять гипертекстовые системы следующих типов:
1) статические (обновляемые редко), динамические (обновляемые часто);
2) малые (читаемые целиком), большие (читаемые выборочно);
Читать дальшеИнтервал:
Закладка: