Надежда Поврозник - Исторические информационные системы: теория и практика [litres]

Тут можно читать онлайн Надежда Поврозник - Исторические информационные системы: теория и практика [litres] - бесплатно ознакомительный отрывок. Жанр: sci_tech, издательство Литагент Высшая школа экономики, год 2021. Здесь Вы можете читать ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.
  • Название:
    Исторические информационные системы: теория и практика [litres]
  • Автор:
  • Жанр:
  • Издательство:
    Литагент Высшая школа экономики
  • Год:
    2021
  • Город:
    Москва
  • ISBN:
    978-5-7598-2321-6
  • Рейтинг:
    4/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Отзывы:
  • Ваша оценка:
    • 80
    • 1
    • 2
    • 3
    • 4
    • 5

Надежда Поврозник - Исторические информационные системы: теория и практика [litres] краткое содержание

Исторические информационные системы: теория и практика [litres] - описание и краткое содержание, автор Надежда Поврозник, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Исторические, или историко-ориентированные, информационные системы – значимый элемент информационной среды гуманитарных наук. Его выделение связано с развитием исторической информатики и историко-ориентированного подхода, формированием информационной среды, практикой создания исторических ресурсов.
Книга содержит результаты исследования теоретических и прикладных проблем создания и внедрения историко-ориентированных информационных систем. Это первое комплексное исследование по данной тематике. Одни проблемы в книге рассматриваются впервые, другие – хотя и находили ранее отражение в литературе, но не изучались специально.
Издание адресовано историкам, специалистам в области цифровой истории и цифровых гуманитарных наук, а также разработчикам цифровых ресурсов, содержащих исторический контент или ориентированных на использование в исторических исследованиях и образовании.
В формате PDF A4 сохранен издательский макет.

Исторические информационные системы: теория и практика [litres] - читать онлайн бесплатно ознакомительный отрывок

Исторические информационные системы: теория и практика [litres] - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Надежда Поврозник
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Реляционные СУБД не ориентированы на работу с большими массивами текстов, рисунками, аудио- и видеоисточниками. Поскольку большинство исторических источников являются нарративными и представлены слабоструктурированными текстами, использование реляционной модели потребует либо искусственного расщепления, фрагментации источника, либо использования «слабой» модели с небольшим набором атрибутов, главным (или даже единственным) из которых будет текст источников. Даже если выбранная СУБД поддерживает возможность хранения в ячейке таблицы текстов большого объема, это не является эффективным. Фрагментация источника, его метаописание или выборочное извлечение частей текста вместо хранения его целиком вносят элемент субъективизма и могут затруднять повторное использование источниковой базы. Другая проблема текста – изменяемые правила орфографии и грамматики, ошибки и опечатки в источниках.

Даже в случае использования структурированных источников проблемой являются неунифицированные, значительно отличающиеся по объему и формату записи данных. Историкам сложно иметь дело с полями фиксированной длины, при этом значения полей часто вообще отсутствуют либо поля имеют множественные значения. Например, в пределах одной метрической книги могли использоваться разные способы записи даты рождения и разная степень детализации информации о родителях.

Распространенной проблемой реляционных исторических баз данных является работа с датами. Это связано с использованием даже в пределах одного источника разных хронологических систем, традиций записи дат, религиозных календарей, а также с неполнотой данных. Для разных событий в пределах одной базы данных может быть известна точность до века, года, месяца, дня или часа. Причиной тому может быть как неполнота исторических данных, так и специфика разных типов процессов и явлений. Так, дата начала экономического кризиса редко может быть определена с точностью до дня, для других же событий даже дневная точность будет недостаточной. Особенно остро это ощущается при создании ресурсов на основе больших хронологических периодов и при объединении в одной базе разнотипных событий. Решения этой проблемы существуют, но все они имеют недостатки – необходимо либо отказаться от точности, либо вводить для каждой даты несколько полей, порождая содержательную избыточность данных.

Еще одна типичная особенность – изменение топонимов и границ территорий (физическое и политическое).

Несмотря на указанные ограничения, реляционные модели и СУБД часто используются при создании историко-ориентированных информационных систем, однако одновременно развиваются альтернативные варианты.

2.4. XML-разметка текстов и исторические системы

Обеспечение доступа к историческим источникам – важная задача развития информационной инфраструктуры гуманитарных наук. С одной стороны, размещение источников в сети – залог успешного выполнения этой задачи, а с другой – формирование единой информационной среды зависит от качества создаваемых ресурсов и используемых методов, среди которых технологии XML-разметки имеют существенное значение, расширяя функциональные возможности систем.

XML – это язык глубокой разметки текстов, предназначенный для решения широкого круга задач: программной обработки документов; описания, структурирования, хранения и передачи данных; их отображения для просмотра пользователями. Разметка представляет собой набор тегов, позволяющих выделить элементы текста и его внешние особенности для компьютерной идентификации и сортировки информации. В частности, XML-разметка позволяет придавать унифицированные значения сущностям в тексте.

XML используется для того, чтобы размечать тексты согласно исследовательским или пользовательским задачам, в которых уровни разметки, смысловая нагрузка и дробность текстовых единиц могут быть различными. Все размеченные единицы текста семантически могут быть объединены в единую сеть. В этом заключается одно из ключевых удобств и преимуществ XML. Исследователи отмечают обширные возможности XML в повышении информационной отдачи исторических источников [Nellhaus, 2001; Варфоломеев, Иванов, 2006; Варфоломеев, Иванов, 2013].

Использование языка разметки XML в современных историко-ориентированных информационных системах сводится к решению следующих основных задач:

• обеспечение поиска информации, повышение эффективности навигации по данным;

• создание единой коллекции документов или взаимосвязанных коллекций на основе стандартизированных структур и описания;

• решение определенных научно-исследовательских задач при изучении источника;

• создание единого пространства исторических источников, развитие гуманитарной составляющей Semantic Web.

Применение XML-разметки возможно по отношению к метаописанию объектов, что широко используется в современных системах репрезентации исторических источников разных типов.

XML-разметка предоставляет широкие возможности для работы с машиночитаемыми текстовыми источниками. Уровни разметки зависят от назначения и цели ее использования и могут быть следующими:

1) разметка метаданных источников;

2) разметка структуры текстовых источников для создания сложных электронных публикаций;

3) разметка отдельных наборов ключевых слов и иных смысловых и формальных структурных элементов в тексте – маркировка географических объектов, персоналий, дат, событий и т. д.;

4) глубокая разметка и выделение смысловых единиц для решения определенных научно-исследовательских задач и расширения возможностей использования источников.

Развитие информационных технологий позволяет использовать при реализации проектов все уровни разметки одновременно.

В историко-ориентированных информационных системах XML-раз метка используется для обозначения метаданных, к которым в том числе относятся: сведения, позволяющие идентифицировать источник или коллекцию (данные об авторе, происхождении, историческом периоде, типе источника и т. д.); структурные метаданные, отображающие взаимосвязи и отношения элементов информационной системы; метаданные административного характера, отображающие сведения об основных процессах (например, об архивировании и хранении данных в системе и т. д.). XML позволяет оперировать размеченными данными, структурировать и извлекать необходимую информацию посредством запросов. При этом текстовые источники, представленные в системе, могут не являться машиночитаемыми и быть опубликованными в форматах изображений, т. е. в таких случаях обработке на основе XML подвергаются только метаданные. Разметка метаданных позволяет структурировать информацию для ее эффективной обработки, поиска, хранения и передачи.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать


Надежда Поврозник читать все книги автора по порядку

Надежда Поврозник - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Исторические информационные системы: теория и практика [litres] отзывы


Отзывы читателей о книге Исторические информационные системы: теория и практика [litres], автор: Надежда Поврозник. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x