Ив Жангра - Ошибки в оценке науки, или как правильно использовать библиометрию [калибрятина]
- Название:Ошибки в оценке науки, или как правильно использовать библиометрию [калибрятина]
- Автор:
- Жанр:
- Издательство:ООО «ЛитРес», www.litres.ru
- Год:2018
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Ив Жангра - Ошибки в оценке науки, или как правильно использовать библиометрию [калибрятина] краткое содержание
Ошибки в оценке науки, или как правильно использовать библиометрию [калибрятина] - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Как мы показали в предыдущей главе, настоящий подъем библиометрии связан с получением доступа к базам данных, позволившим автоматизировать анализ на макроуровне. Вплоть до 2004 года, когда фирма Elsevier запустила на рынок альтернативную базу данных, Scopus, Институт научной информации (ISI), созданный Юджином Гарфилдом, оставался монополистом в сфере библиометрической статистики. Поэтому большинство работ по наукометрии основываются на базах данных ISI. Однако в последние несколько лет стало появляться все больше исследований, использующих данные Scopus [33]. Из чего состоит индекс цитирования
Для начала напомним, какова структура Индекса научного цитирования, публикуемого Институтом научной информации (ISI) с 1963 года. В 1973 году к Science Citation Index (SCI) добавляется Social Science Citation Index (SSCI), а с 1978 года – Arts and Humanities Citation Index (AHCI). До распространения интернета они были доступны лишь в университетских библиотеках, получавших их по подписке в виде толстых томов, похожих на телефонные справочники, а затем, с 1980-х годов, в виде компакт-дисков. Разумеется, бумажный носитель нисколько не приспособлен для крупномасштабного анализа, и тома Индекса использовались в основном просто для библиографических поисков. И наконец, напрямую у ISI можно было получить всю совокупность данных в электронной форме.
На ил. 2 показано типичное содержание страницы из индекса цитирования в бумажном формате. На ней видны отсылки к статьям Эйнштейна за 1959, 1960 и 1961 годы. В настоящее время бумажная версия не выпускается, и все три базы данных объединены на платформе Web of Science, содержащей около 12 000 журналов по всей совокупности дисциплин. Они доступны в интернете по абонементу университетских библиотек, подписанных на услуги Thomson Reuters, фирмы, которая приобрела Институт научной информации в 1993 году.
В базе данных содержится не полный текст статей, а совокупность связанных с ними метаданных. В ней можно найти название статьи, журнала, где она опубликована, фамилии всех авторов, их институциональный адрес, тип документа (статья, письмо, обзор, книжная рецензия и пр.) и полный библиографический список ( ил. 3 ). Именно эта информация о ссылках и придает ИНЦ его специфический и (долгое время) уникальный характер. Поскольку в пристатейные списки литературы иногда попадают патенты, это дает возможность анализировать и ссылки на патенты [34]. В свою очередь, базы данных по патентам, также содержащие ссылки на статьи, с 1980-х годов стали использоваться для анализа связей между научными исследованиями и техническими инновациями [35].
Ил. 2. Выдержка из первого ИНЦ (источник: Eugene Garfield, American Documentation. July 1963, p. 196)
После перевода в электронную форму эта информация организуется в виде базы данных, позволяющей производить поиск по разным параметрам (автор, страна, институция, журнал и т. п.).
В бумажную эпоху поиск в ИНЦ был возможен лишь по фамилии первого автора, несмотря на то что у большинства публикаций уже тогда было более одного автора. Первые пользователи, социологи науки, подмечали это ограничение и предлагали включать также другие фамилии или по крайней мере фамилию последнего автора, который в больших исследовательских коллективах, типичных для «Большой науки», часто является руководителем. Однако Гарфилд, осознавая затратность подобного изменения в базе данных, в ответ напомнил, что ИНЦ – это прежде всего инструмент библиографического поиска, а не измерения эффективности исследователей [36]. В связи с усовершенствованием компьютерной техники современные библиометрические базы данных позволяют найти упоминания всех соавторов той или иной публикации.
Ил. 3. Типичный вид метаданных статьи в индексе цитирования
Инструмент для историков и социологов науки
С самого начала ИНЦ воспринимался как важный ресурс для историков и социологов науки. Еще до публикации первой версии в 1963 году Гарфилд заручился поддержкой отца социологии науки, Роберта К. Мертона, а также историка науки, ратовавшего за продвижение библиометрии, Дерека де Солла Прайса. Сам Гарфилд серьезно интересовался историей науки и в течение всей своей карьеры работал над совершенствованием программ, предназначенных для автоматической визуализации сетей цитирования между статьями [37]. Благодаря интересу к истории науки со стороны Гарфилда директор исследовательской службы в ISI Генри Смолл, сам по образованию историк науки, в 1981 году взял на себя руководство созданием индекса цитирования по физике за период с 1920 по 1929 год при финансовой поддержке Национального научного фонда. Это был период развития квантовой физики, что позволило детально изучить научную революцию с точки зрения библиометрии [38]. Этот интерес к историческому использованию ИНЦ в результате привел к созданию ретроспективной базы данных, включившей ведущие научные журналы с 1900 года в сфере социальных и естественных наук [39].
Ил. 4a. Динамика среднего числа ссылок, содержащихся в статьях, по крупным дисциплинарным направлениям, 1900 – начало 2010-х годов (источник: WoS)
Ил. 4б. Динамика среднего числа ссылок (цитат), полученных статьей через два года после ее публикации, по крупным дисциплинарным направлениям, 1900 – начало 2010-х годов (источник: WoS)
По мере накопления исследований по библиометрии были обнаружены характеристики публикаций и ссылок, которые необходимо учитывать при конструировании показателей, позволяющих адекватно описывать динамику науки на разных уровнях. Так, среднее количество ссылок на одного автора в значительной мере зависит от размера дисциплин и специальностей. Например, в математике исследователей гораздо меньше, чем в медицине. В целом, при прочих равных условиях среднее количество ссылок на ту или иную статью зависит от размеров содержащихся в статьях библиографий, то есть от числа статей в этих библиографиях. Чем выше это число, тем больше у автора шансов, что его процитируют. Среднее число ссылок в статьях по всем дисциплинарным направлениям со временем существенно возросло, что отражает резкий рост числа исследователей и публикуемых статей ( ил. 4a ). Иначе говоря, рост среднего числа ссылок на одну статью, как показано на ил. 4б , является простым следствием демографических изменений в науке. Из этого следует, что абсолютное число ссылок мало что означает само по себе и что сравнения между разными научными областями по этому показателю некорректны. Его всегда нужно рассматривать в контексте дисциплины, к которой принадлежит исследователь, и за определенный период.
Помимо этого, уже первые исследования показали, что процент самоцитирования в целом невелик (8 %), что ссылки на собственные публикации в журналах составляют примерно 20 % от их общего числа и что распределение цитирования отличается высокой концентрацией [40]. И наконец, как показывает ил. 5 , неравномерно распределены не только ссылки, но также сами публикации и гранты, получаемые исследователями [41]. Речь идет о распределениях типа Парето, подчиняющихся так называемому правилу 20/80: на 20 % исследователей приходится, в общем и целом, 80 % цитат и грантов. У публикаций концентрация несколько ниже: на 20 % исследователей приходится не более 60 % статей.
Читать дальшеИнтервал:
Закладка: