Надежда Поврозник - Исторические информационные системы: теория и практика [litres]

Тут можно читать онлайн Надежда Поврозник - Исторические информационные системы: теория и практика [litres] - бесплатно ознакомительный отрывок. Жанр: sci_tech, издательство Литагент Высшая школа экономики, год 2021. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Исторические информационные системы: теория и практика [litres]
  • Автор:
  • Жанр:
  • Издательство:
    Литагент Высшая школа экономики
  • Год:
    2021
  • Город:
    Москва
  • ISBN:
    978-5-7598-2321-6
  • Рейтинг:
    4/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Надежда Поврозник - Исторические информационные системы: теория и практика [litres] краткое содержание

Исторические информационные системы: теория и практика [litres] - описание и краткое содержание, автор Надежда Поврозник, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Исторические, или историко-ориентированные, информационные системы – значимый элемент информационной среды гуманитарных наук. Его выделение связано с развитием исторической информатики и историко-ориентированного подхода, формированием информационной среды, практикой создания исторических ресурсов.
Книга содержит результаты исследования теоретических и прикладных проблем создания и внедрения историко-ориентированных информационных систем. Это первое комплексное исследование по данной тематике. Одни проблемы в книге рассматриваются впервые, другие – хотя и находили ранее отражение в литературе, но не изучались специально.
Издание адресовано историкам, специалистам в области цифровой истории и цифровых гуманитарных наук, а также разработчикам цифровых ресурсов, содержащих исторический контент или ориентированных на использование в исторических исследованиях и образовании.
В формате PDF A4 сохранен издательский макет.

Исторические информационные системы: теория и практика [litres] - читать онлайн бесплатно ознакомительный отрывок

Исторические информационные системы: теория и практика [litres] - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Надежда Поврозник
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Свешников, Михаил Иванович</ deputiname>.

Идентификаторы позволяют, например, объединить все упоминания о деятеле в источнике, а также одинаковые по смыслу, но варьирующиеся по написанию значения. Такая унификация на основе тегов является основой для более полного поиска по всей совокупности документов системы.

Отдельная группа элементов разметки может описывать работу над электронным документом, даты его изменений и историю (как, например, сведения о новых тегированных данных) [40] Подробнее о CEI и разметке средневековых хартий см.: Burkard B., Vogeler G., Gruner S. Informatics for Historians: Tools for Medieval Document XML Markup, and their Impact on the History-Sciences // Journal of Universal Computer Science. 2007. Vol. 14. № 4. P. 193–210 [Электронный ресурс]. URL: http://www. jucs.org/jucs_14_2/informatics_for_historians_tools/jucs_14_2_0193_0210_ burkard.pdf (дата обращения: 20.03.2020). . Группа вспомогательных тегов используется для корректного отображения факсимиле источников в браузере, по аналогии с обычным представлением HTML-документов [41] Documentation EditMOM // MOM [Электронный ресурс]. URL: http:// monasterium.net/mom/editmom-documentation (дата обращения: 20.03.2020). .

Использование разметки XML по единым стандартам способствует более активному развитию Semantic Web в плане наполнения семантическими публикациями исторических источников. Несмотря на массу средств и технологических решений, созданных для Семантической паутины, XML является одним из наиболее простых в использовании [Варфоломеев, Иванов, 2013].

Кроме электронных публикаций, XML востребован и для анализа текстов источников. Одним из направлений является компьютерная лингвистика и использование XML-разметки текстов при изучении языка и его развития, когда с помощью XML обозначаются морфологические и синтаксические признаки единиц текста (могут быть размечены как отдельные буквы и символы, так и их совокупности, а также слова, словосочетания, предложения и т. д.). Другой областью применения XML является текстометрический анализ, используемый в гуманитарных исследованиях.

В исторических информационных системах также применяется XML для анализа текстов. При этом системы имеют разные возможности и инструментарий для работы с историческими источниками. Так, на портале «Парламентская история позднеимперской России» [42] Парламентская история позднеимперской России [Электронный ресурс]. URL: http://parliament.psu.ru (дата обращения: 20.03.2020). опубликованы размеченные на основе XML указатели к стенографическим отчетам Государственной Думы начала XX в. Схема разметки разработана для изучения деятельности парламентариев (рис. 2.6) и анализа динамики развития указателей как исторического источника (рис. 2.7). Информационная система предоставляет доступ к размеченным файлам с возможностью их скачивания и дальнейшего анализа.

Для анализа, обработки данных и публикации источников, тексты которых размечены с помощью XML, требуется дополнительное программное обеспечение. Многие программные продукты для этих целей являются коммерческими. Однако в Лионском университете (Франция), в лаборатории ICAR, была разработана платформа TXM с открытым кодом [43] Projet Textométrie [Электронный ресурс]. URL: http://textometrie.ens-lyon.fr (дата обращения: 27.08.2018); см. также: Lavrentiev A., Heiden S., Decorde M. Analyzing TEI encoded texts with the TXM platform // The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013. Rome, Italy, 2013 [Электронный ресурс]. URL: http://halshs.archives-ouvertes.fr/ halshs-01118120 (дата обращения: 20.03.2020). . Данная платформа является программным обеспечением, предназначенным для работы в наиболее распространенных операционных системах (Windows, Mac OC X, Linux), а также поддерживает онлайн-публикацию источников при помощи веб-навигаторов с возможностью контроля доступа к ресурсам и их редактированию. Платформа TXM имеет широкие возможности для проведения текстометрического анализа текстов источников.

Рис 26 Пример организации данных по деятельности парламентариев на основе - фото 14

Рис. 2.6. Пример организации данных по деятельности парламентариев на основе XML-разметки указателей к стенографическим отчетам

Рис 27 DTDдокумент показывает структуру размеченных на основе XML - фото 15

Рис. 2.7. DTD-документ показывает структуру размеченных на основе XML указателей к стенографическим отчетам Государственной Думы I–IV созывов начала XX в.

Другие информационные системы интегрируют исследовательский инструментарий и источники и позволяют оперировать возможностями разметки. Так, в Ланкастерском университете (Великобритания) разработана платформа Corpus Query Processor для работы с созданными корпусами текстов [44] CQPWEB [Электронный ресурс]. URL: https://cqpweb.lancs.ac.uk (дата обращения: 20.03.2020). . Платформа содержит опубликованные корпусы текстов на различных языках, среди которых как национальные, так и специализированные корпусы, в том числе исторические (в первую очередь это совокупность корпусов периодической печати Великобритании с XVIII в. по настоящее время). Часть корпусов исторических текстов размечена на основе XML. Инструментарий платформы обеспечивает поиск по контексту с выбором необходимых метаданных, а также предоставляет широкие возможности для анализа текстов по заданной структуре разметки.

Развитие информационного пространства исторических источников и использование единых стандартов XML-разметки являются важной основой формирования гуманитарной семантической сети информационных ресурсов. Объединение создаваемых ресурсов – вопрос будущего, однако наработки в этом направлении свидетельствуют об эффективности и ценности такого подхода. Таким инструментом является Fawcett Toolkit [Robertson, 2009] – свободно распространяемая компьютерная программа для агрегирования исторических данных, размеченных на основе XML, и их визуализации в виде карт, таймлайнов и анимаций. Fawcett Toolkit агрегирует XML-теги, использованные редакторами ресурсов по действующему стандарту TEI P5. Таким образом, программа позволяет выявлять разнообразные ресурсы, размеченные общими тегами, в том числе персоналии, географические объекты, исторические события, даты и т. д.

Развитие Semantic Web и использование XML-разметки в исторических исследованиях открывают возможности для более глобальных научных изысканий, связанных с Data Mining [Meroño-Peñuela, Ashkpour, van Erp, Mandemakers, Breure, Scharnhorst, Schlobach, van Harmelen, 2014].

Таким образом, использование языка разметки XML при создании информационных систем позволяет учитывать содержание, структуру и иерархию текста; фиксировать различные прочтения и интерпретации источниковой информации; эффективно работать с многослойными текстовыми источниками; сделать заметной для машины ту информацию, которую историк считывает на интуитивном уровне, между строк. Использование разметки XML обеспечивает широкие возможности для обработки текстов, представления документов и анализа информации; позволяет повысить эффективность информационной отдачи источников, углубить представление об их информационном потенциале, получить скрытую для анализа традиционными методами источниковую информацию.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Надежда Поврозник читать все книги автора по порядку

Надежда Поврозник - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Исторические информационные системы: теория и практика [litres] отзывы


Отзывы читателей о книге Исторические информационные системы: теория и практика [litres], автор: Надежда Поврозник. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x