Далчи Грей - Пособие по журналистике данных
- Название:Пособие по журналистике данных
- Автор:
- Жанр:
- Издательство:неизвестно
- Год:2013
- ISBN:978-5-905600-08-1
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Далчи Грей - Пособие по журналистике данных краткое содержание
Пособие по журналистике данных - читать онлайн бесплатно полную версию (весь текст целиком)
Интервал:
Закладка:
Мы создали форму на сайте Google и наполнили ее вполне конкретными вопросам. Форма получилась действительно длинной, мы спрашивали, на какие суммы люди заказывали билеты, сколько в результате списывали с их кредитных карт, на какие соревнования они планировали пойти и т. д.
Мы разместили эту форму в виде небольшой картинки на главной странице сайта, и она очень быстро распространилась среди читателей. Важный момент здесь, я считаю, заключается в том, чтобы вы думали не только о том, «что мне необходимо знать для написания моей статьи», но и о том, «что люди хотят рассказать мне в данный момент». Только тогда, когда вы поймете, что люди хотят вам рассказать, вы сможете успешно применить краудсорсинг. Объем ответов, полученных в ходе данного проекта (который был одной из первых наших попыток краудсорсинга), был огромен. Мы получили тысячу ответов менее, чем за час, к концу дня количество ответов достигло семи тысяч.
Вполне понятно, что после этого мы стали более серьезно относиться к результатам. Изначально мы не предполагали, что получим так много ответов. Поэтому мы приняли для себя несколько оговорок: читатели Guardian могут быть более состоятельными, чем другие люди, лица, получившие меньше, чем они рассчитывали, будут более охотно общаться с нами, и т.д.
Мы не знали, какую ценность будут иметь результаты нашего проекта. В итоге мы получили семь тысяч ответов для нашего проекта, и мы выяснили, что около половины людей, запрашивавших билеты, ничего не получили. Мы изучили все полученные отклики, и, так как их было очень много, результаты представляли большой интерес.
Через несколько недель вышел официальный отчет, и наши данные были до невероятности близки к его цифрам. Они практически полностью совпадали с ними. Конечно, в этом была доля везения, однако сыграл свою роль и тот факт, что нам ответили столько много людей.
Если вы будете спрашивать читателей о подобных вещах в ленте комментариев, то вы будете ограничены в применении результатов. Поэтому следует подумать: «Какой инструмент лучше выбрать, чтобы получить нужную информацию?» Ленту комментариев? Или разработать приложение? И если вы решите разработать приложение, следует подумать, «Есть ли смысл тратить время на разработку? Оправдает ли оно затраченные на его разработку ресурсы?»
В данном случае мы сделали выбор в пользу форм на Google (Google Forms). Когда кто–то заполняет форму, вы видите результаты в виде строки таблицы. Т. е. даже если эта таблица еще пополняется, даже если ответы все еще продолжают поступать, вы все равно можете открыть ее и увидеть все имеющиеся на данный момент результаты.
Я мог попробовать проделать всю работу в Google, но я решил скачать их в Microsoft Excel и после этого отсортировать по возрастанию, чтобы найти ответы, в которых люди написали числа прописью, и исправить их. Я решил постараться исключать как можно меньше вариантов. Поэтому вместо того, чтобы принимать только действительные ответы, я пытался исправлять остальные. Люди использовали иностранные валюты, и я переводил их в фунты стерлингов, что было довольно утомительно.
Однако в целом анализ занял всего несколько часов, и в итоге я отмел все очевидно неуместные ответы. Многие люди решили заполнить форму, отметив при этом, что они ничего не платили за билеты. Забавно, но ладно. Таких оказалось менее сотни из более чем семи тысяч респондентов.
Несколько десятков человек написали откровенно большие суммы в попытке исказить результаты. Например, десять миллионов фунтов стерлингов. Оставшийся набор ответов я мог обрабатывать, исходя из обычных принципов работы с данными. Я сделал так называемую сводную таблицу. Я вывел средние значения. И т. д.
Мы не знали, какой ход наберет этот проект, поэтому над ним работали только я и редактор спортивного блога. Мы сели, подумали и решили, что этот проект может оказаться интересным. На весь проект, от начала до конца, у нас ушло 24 часа. У нас появилась идея, мы поразмышляли над ней за обедом, мы разместили форму на сайте, мы увидели, что идея пользуется популярностью, мы продержали форму на сайте до конца дня и на следующее утро поместили в сети ее результаты.
Выбор в пользу сервиса Google Docs был сделан потому, что он позволяет полностью контролировать результаты. Мне не пришлось пользоваться каким–то сторонними аналитическими инструментами. Я мог с легкостью поместить результаты в базу данных или в таблицу. Когда вы используете специальное программное обеспечение для опросов общественного мнения, вы зачастую можете использовать только предусмотренные им инструменты. Если бы информация, которую мы хотели собрать, требовала какого–то деликатного обращения, то мы могли бы не прибегать к сервисам Google и попробовать справиться со всем своими собственными силами. А в целом оказалось очень просто разместить форму Google Form на странице Guardian, при этом пользователю было практически не видно, что именно мы используем. Так что это оказалось очень удобно.
В качестве совета журналистам, работающим в сфере данных, которые хотят использовать краудсорсинг: вы должны очень точно знать, какую информацию вы хотите получить. Задавайте вопросы, которые могут иметь очень большое количество разных ответов. Попробуйте понять демографию аудитории, к которой вы обращаетесь, чтобы понять, не является ли ваша выборка предвзятой. Если вы спрашиваете о суммах и других подобных вещах, попробуйте указать, что ответ должен быть в цифрах, что пользователи должны использовать определенную валюту т. п. Многие все равно не выполнят эти указания, но чем больше вы регламентируете этот процесс, тем будет лучше. И всегда, всегда добавляйте поле для комментариев, так как большое количество людей заполнят поля опроса, но при этом им очень хочется довести до вас свое мнение по данному вопросу. Особенно если речь идет о нарушениях прав потребителей или произволе.
— Интервью Джеймса Болла, журналиста Guardian, Марианне Баучарт, блог «Data Journalism»
Использование и обмен данными: готический шрифт, мелкий шрифт и реальность
В данном разделе мы кратко рассмотрим положения законодательства о данных и базах данных, и посмотрим, что вы можете сделать, чтобы открыть ваши данные, используя имеющиеся общедоступные лицензии и правовые инструменты. Не позволяйте ниже перечисленным преградам ослаблять ваше стремление к журналистике, посвященной данным. Обычно вы не будете сталкиваться с правовыми ограничениями при использовании данных, и вы можете легко сделать так, чтобы они не мешали другим людям пользоваться опубликованными вами данными.
Следует признать, что сейчас добывать данные стало просто, как никогда. Раньше, до эпохи широкой публикации данных в Интернете, даже если вы обнаруживали нужную вам базу данных, вы должны были просить того, у кого она находилась, предоставить вам доступ к ней, отправляя для этого письмо или совершая личный визит. Теперь ваш компьютер просит другой компьютер отправить ему нужную копию . Это, конечно, очень упрощенная схема, но в настоящее время у вас есть право на копирование, а они (лица, создавшие или опубликовавшие данные) ничего не сделали и, возможно, даже не знают, что вы скачали себе копию.
Читать дальшеИнтервал:
Закладка: