Журналистика в эпоху данных

Стэнфордский университет подготовил серию из 9 видео «Журналистика в эпоху данных» (Journalism at the Age of Data), Исследователи вуза рассмотрели данные, не просто, как основной источник информации ближайшего будущего, но и как форму коммуникаций, возможность через данные рассказать историю. Далее «Журналистика в эпоху данных»

Журналистика в эпоху данных

Примеры журналистики данных

Примеры дата-проектов, про которые рассказывает «Пособие по журналистике данных». Это материалы, которые были созданы на основе анализа данных. Часто в таких проектах речь об обработке огромного количества информации, цифр. И очень интересно, как СМИ визуализируют эти данные в материалах, какие сервисы используют для работы с таким количеством информации. Далее «Примеры журналистики данных»

Примеры журналистики данных

Ошибки при работе с цифрами

Говорят журналисты и цифры – вещи несовместимые. А если цифры надо сложить или вычесть, или не дай бог, умножить и разделить, то репортеры любых рангов выкидывают белый флаг.

Так говорят, и только журналисты знают, насколько эта шутка близка к правде.

И это, на мой взгляд, самое парадоксальное в журналистике.

Большинство наших историй связаны с теми или иными цифрами. Идет ли речь о переписи населения, результатах выборов, итогах спортивных соревнований, росте цен на товары или девальвации национальной валюты – это работа с цифрами. И настолько же часто журналисты работать с цифрами не любят. Не считают их важными, редко перепроверяют, недостаточно внимательно относятся к десятым и сотым долям.

На BBC, устав от такой необоснованной нелюбви к цифрам со стороны журналистов, решили написать пост в корпоративном блоге о самых распространенных ошибках, которые репортеры и редакторы допускают, рассказывая свои истории с помощью цифр. Бизнес-редактор Роберт Пестон, редактор по вопросам экономики Стефани Фландерс и редактор отдела, посвящённого дому, Марк Истон, составили целый список таких ошибок журналистов. Полностью читать их в журналистском блоге BBC.

4 самые крупные ошибки из этого списка (перевод взят с сайта ijnet.org):

Невнимание к контексту

По словам экспертов, часто числа, о которых говорят журналисты, кажутся астрономическими без раскрытия дополнительного контекста. Например, когда политики обсуждают распределение фондов, огромные суммы — миллионы и миллиарды, о которых они рассказывают, должны рассматриваться в соответствии с размером задач, на решение которых эти суммы выделены.

К примеру, хотя сумма в 300 миллионов фунтов стерлингов (470 миллионов долларов США), которую бывший премьер-министр Великобритании Тони Блэр пообещал выделить на создание бесплатных детских садов и яслей, может показаться высокой, в статье отмечается, что на самом деле это сводится к 1,15 фунтов стерлингов (1,81 долларов США) на одного ребенка в неделю. “Таким образом, если сумма будет названа без рассказа о контексте, она кажется огромной, хотя на самом деле это очень небольшие средства, принимая во внимание ту задачу, которую они призваны были решить”, – говорят эксперты Би-би-си.

Публикация «шокирующих цифр»

Довольно часто журналисты соблазняются желанием шокировать читателя, рассказывая об огромных цифрах, не исследовав тему по-настоящему. Суммы, которые на первый взгляд заслуживают того, чтобы о них рассказали в печати, могут быть результатом ошибки или неправильного толкования смысла.

Рассказ об экстремальных цифрах в противовес среднему значению

Рассказывая о числах, старайтесь избегать крайних, случайных значений, не отражающих общую картину. Примером может служить статья с названием “Глобальное потепление может повысить температуру на 11 градусов Цельсия”, в которой была упомянута модель предсказания климата. На самом деле вероятность изменения климата на 11 градусов в данной модели — один раз их 2 000, а значит, заголовок статьи вводит читателя в заблуждение.

Рассказ об изменяющихся значениях без объяснения причин явления

Новости часто рассказывают о росте или падении значений, данных в цифрах, но зачастую читателям не рассказывают о предыстории. «Например, новости о том, что риск удваивается, если вы используете мобильный телефон; количество людей, которые были остановлены и обысканы полицией, увеличилось в 4 раза; возможность заболеть раком груди увеличивается у пьющих людей – все эти новости очень популярны в наше время, но часто они создают удручающее ощущение: они не дают никакой полезной информации”,- говорят эксперты. Важно рассказать как о причинах изменений, так и о том, какова была статистика до того, как ситуация изменилась (например, до изобретения сотовых телефонов), утверждают авторы списка.

Ошибки при работе с цифрами

The Data Journalism Handbook: принципы, методы, правила

handbook по дата-журналистикеЭту книгу написали… 70 человек. Пожалуй, не найти больше ни одного другого учебника по журналистике, где был бы такой впечатляющий список авторов. 

Называется она The Data Journalism Handbook. Книга, авторами которой стали журналисты ведущих западных изданий, развивающих направление дата-журналистики (в мире принято называть ее data-driven journalism). 

The Data Journalism Handbook — настольная книга для всех, кто изучает журналистику данных. И пока единственное руководство, в котором описаны принципы, методы, правила дата-журналистики.

Пособие расскажет как собирать информацию из цифр и данных, где ее искать, как обрабатывать полученные данные и как с помощью цифр рассказать журналистскую историю, как оформить все собранное в единый понятный проект.

Книга были издана на английском языке. В рунете предпринимались попытки перевести ее, но за дело взялись РИА Новости и в сентябре 2012 года презентовали ее на русском языке. Прочитать на русском языке ее можно бесплатно, но только онлайн. Читайте здесь.

Электронная книга на английском языке обойдется в 13 долларов, печатная версия в 25$. Купить тут. 

О том, что такое дата-журналистика из вступления книги:

«И «данные», и «журналистика» — ненадежные и неудобные термины. Кто-то считает, что данные – это любой набор цифр, чаще всего в таблице. 20 лет назад это был фактически единственный вид данных, с которыми имели дело журналисты. Но сейчас мы живем в цифровом мире, мире, в котором практически все можно описать при помощи цифр – и в котором практически все и описывается при помощи цифр.

Что же отличает журналистику данных от остальной журналистики? Возможно, это новые возможности, которые открываются, когда вы объединяете традиционный «нюх на новости», умение выведать все, что случилось, со способностью рассказать захватывающую и наглядную историю, с настоящим масштабом и разнообразием цифровой информации, которая ныне доступна.

… Данные могут служить источником журналистики данных, или же они могут быть тем инструментом, при помощи которого рассказывается история – или же они могут быть и тем, и другим одновременно. Как к любому источнику, к нему нужно относиться скептически, и как с любым инструментом, мы должны осознавать и понимать, как этот инструмент может придать форму или ограничить истории, которые создаются с его помощью.

Пол Брэдшоу, Бирмингемский городской университет»

Примеры готовых дата-журналистcких проектов из книги The Data Journalism Handbook:

  • Использование программирования и автоматизации процесса сбора информации, к примеру, от местных властей или полиции. Так сделал Эдриан Головатый (Adrian Holovaty) с ChicagoCrime и c EveryBlock.
  • Использование программного обеспечения для поиска связей между большим количеством документов. Пример The Telegraph с проектом «Расходы парламентариев».
  • Журналистика данных может помочь журналисту рассказать сложную историю за счет задействования инфографики. Образец: наглядные рассказы Ханса Рослинга о визуализации нищеты в мире при помощи Gapminder.
  • Работа Дэвида Маккендлесса по извлечению сущности из больших чисел (представление государственных расходов в контексте, исследование какое загрязнение окружающей среды было предотвращено во время извержения исландского вулкана) говорит о важности чистого дизайна. Смотреть на сайте Information is Beautiful.

Краткое содержание книги «Пособие по журналистике данных» поместили в одном постере:

Книга по дата-журналистике

О чем вы сможете узнать из пособия:

  1. Конкретные примеры. Взгляд на вдохновляющие примеры исследований.
  2. Журналисты-создатели кода/Журналисты-программисты. Найм программиста высшего класса.
  3. Получение данных. Открытые порталы данных. Обработка данных, удаление лишнего. Краудсорсинг.
  4. Грамотность в отношении данных.
  5. Понимание, осмысливание данных.
  6. Инструменты.
  7. Написание статей/создание сюжетов с данными.
  8. Визуализация данных.
  9. Вовлеченность сообществ в подготовку материалов с получением и обработкой данных.
The Data Journalism Handbook: принципы, методы, правила

Журналистика данных с Google Refine

Журналистика данных! Чаще всего споры с коллегами о ее значимости заканчиваются выводом: постсоветская журналистика от западной отличается отношением именно к этому направлению.

Для нас – “советских” – всегда было важнее слово – красиво, образно описать. Для западной важнее было найти и откопать эксклюзивную информацию.

Журналистика данных для них и есть журналистика, для нас же она в какой-то степени стала откровением (вдруг стало понятно, что резонанс могут вызвать не красивые воззвания, а таблица с отчислениями пенсионных налогов детей чиновников, опубликованная вообще без каких-либо слов) и мы чаще, чем кто-либо говорим о появлении нового направления,  в котором можно себя проявить.

Чтобы заниматься журналистикой данных – нужен приличный запас терпения. Она не любит суеты. Зарыться в статистику, таблицы, графики, базы данных, кипу документов. В итоге после упорных трудов, оказывается, что ваши данные имеют неупорядоченный вид и в них очень сложно разобраться.

В сети есть множество сервисов, помогающих журналистам упорядочить необходимые данные. Сегодня расскажу о самом доступном  — Google Refine. Сервис очень популярный у наших западных коллег, но все еще мало развитый в наших странах. Я считаю, что это происходит по двум причинам:

  1. Закрытый доступ ко многим базам данных в наших странах.
  2. Неумение журналистов работать с базами данных и неумение искать  их в разных источниках.

Это сервис позволит очистить данные перед тем, как начать с ними работу и делать какие-либо выводы. Для начала вам нужно загрузить Google Refine по указанной инструкции.

Плюсы Google Refine, по мнению vmethods.ru

  • могут использовать люди без навыков программирования и работы с базами данных;
  • бесплатен;
  • запускается на любом компьютере, работает в браузере и использует интерфейс, похожий на Google Docs;
  • несмотря на то, что инструмент придуман Google, он работает автономно и не требует отправки данных в интернет;
  • куча полезных функций, включая историю изменений и их отмены, визуализацию характеристик данных; фильтры, кластеризацию, самые разные преобразования и использование простого языка выражений Google Refine Expression Language (GREL).

Программа совместима с Windows, Mac и Linux.

Как пользоваться?

Видеопособие по использованию Google Refine

Помимо видеопособия стоит изучить несколько обучающих программ, которые помогут начать работу с приложением. Refine также включает образцы наборов данных, что позволяет потренироваться в работе с программой.

На ijnet.org предлагают такую инструкцию:

“Создав имя для своего проекта, нажмите кнопку «Создать проект» и Google Refine отобразит ваши данные. Теперь вы можете приступать к работе над вашим проектом. Прежде всего вам стоит обратить внимание на то, что существуют различные способы форматирования одинаковой информации. Например, существует множество способов записи дат: 6 октября 2011, 6.10.2011 и т.д. То же самое касается и числовых и текстовых полей (D.C. можно записать как DC, District of Columbia, и т.д.).

Если одинаковая информация будет иметь различный формат, то при поиске закономерностей среди вашего набора данных вы получите неполные и, следовательно, недостоверные результаты, которые не смогут быть использованы в вашей статье.

Исправить это вы сможете при помощи текстовой или числовой функции Google Refine, которая объединяет идентичные ячейки и показывает вам, как часто они повторяются. Например, эта функция покажет вам, сколько полей содержат вариант DC, а сколько – District of Columbia.

Данная функция поможет вам установить, есть ли среди вашего набора данных одинаковые поля, записанные с помощью различных названий. 

Еще одна похожая интересная функция – «кластеризация» – находит группы ячеек с различными значениями, которые могут нести одинаковую информацию. 

Google Refine также дает вам возможность удалить лишние пробелы для получения более однородных данных. Хотя вы можете и не заметить лишний пробел в слове, он может стать проблемой при анализе данных. Вы можете избавиться от лишних пробелов при помощи функции «убрать лишние пробелы перед и после слов». 

Если вы сделаете ошибку при редактировании данных, вы можете легко ее исправить, отменив выполненное действие. Google Refine запоминает все изменения, сделанные вами в ходе работы, чтобы при необходимости вы могли легко вернуться назад”.

Примеры использования Google Refine

Проект интернет-газеты ProPublica «Доллары для докторов. Как деньги фармацевтической промышленности попадают в карманы ваших врачей». Собранная с помощью приложения Refine, она принесла редакции Пулитцеровскую премию.

Мультимедийный журналист Тасним Раджа, работающий в The Bay Citizen, хорошо представляет, как большинство журналистов пользуются данными в своей работе. “Многие люди идут в журналистику, потому что они не сильны в математике”, – говорит Тасним, –Когда речь заходит о статистике, они обнаруживают, что они погрузились в цифры и сложное программное обеспечение”.

Сам он пользуется Goggle Refine ежедневно. Инструмент, созданный для работы с “беспорядочной массой данных”, Раджа называет “поразительным”. Редакция The Bay Citizen пользовалась им, чтобы разработать поисковик велосипедных аварий, в котором были интегрированы данные из разных источников. Поисковик был удостоен множества медийных наград.

Помимо Google Refine в интернете вы найдете много других сервисов, помогающих работать с данными. Мы, доверившись мнению Раджи, предлагаем вам изучить и попробовать применить в работе следующие инструменты:

Tablesorter

Мистер Конвертер Данных

Geocommons

Журналистика данных с Google Refine

Дата-журналистика. Необходимые навыки

Прежде чем начинать работу в дата-журналистике, прочтите о том, какие именно навыки вам понадобятся и какие испытания вас ожидают.

  • Журналистика данных требует знания основных тем, как правило, находящихся за пределами внимания традиционной журналистики. Вам нужно знать, как работает государственное управление, как интерпретировать законы, указы и постановления. Если журналист не знает принципов работы учреждений в своей собственной стране, его карьера в журналистике данных быстро зайдет в тупик.
  • Свободное владение английским языком. Большинство наиболее часто используемых инструментов дата-журналистики доступны только на английском языке. На данный момент разрыв между журналистами, которые благодаря своим языковым навыкам могут воспользоваться всеми ресурсами дата-журналистики, и журналистами, которые, в силу отсутствия этих навыков, не могут, огромен.
  • Навыки онлайн поиска. Недостаточно просто использовать обычный поиск в Google. Вам необходимо воспользоваться преимуществами расширенного поиска по формату, по теме и по дате. Кроме того, так как государства не спешат выкладывать данные в открытом доступе, нужно знать, какие официальные сайты хранят данные.
  • Навыки создания электронных таблиц. Журналисты должны знать, как обрабатывать числа в Excel или аналогичных программах.
  • Знания математики, а также описательной статистики и статистики вывода. Журналист, страдающий фобией чисел, обязательно столкнется с проблемами при анализе государственного бюджета, налогов или таких тем, как преступность и загрязнение окружающей среды.
  • Обучение навыкам дата-журналистики – это, в основном, самообучение. Ни одна мировая школа журналистики, за редким исключением, не преподает журналистику данных, так что вам придется учиться на практике.
  • Проекты могут быть трудоемкими и дорогостоящими. Вам придется иметь дело с десятками, если не сотнями или даже тысячами форм, текстов и графиков. Иногда вам даже придется стать на время программистом, чтобы разработать приложения, позволяющие собирать данные с вебстраниц.
  • Помните о трех основных частях, из которых состоят репортажи журналистики данных. В дополнение к сюжету, репортаж должен предоставить читателям справочные документы, объяснить методику сбора данных так, чтобы работа была оценена экспертами, а также адекватно иллюстрировать данные.
  • Помните, что вам далеко не всегда удастся найти то, что вы ищете. Вам придется прочитывать тонны записей, горы документов и делать звонки, на которые никто не отвечает, в попытке открыть двери, которые могут так и остаться закрытыми. Иногда из данных невозможно сделать историю, хотя это случается и нечасто.

Теперь, когда вы узнали о худших сторонах дата-журналистики, вам лучше подготовиться к испытаниям, которые ждут вас впереди. Удачная работа в дата-журналистике – это хороший показатель успеха, так как в этом виде журналистики добиваются высот не те, кто обладает хорошими связями, удачей и блестящим умом, но те, кто обладает упорством и настойчивостью. В этом разница между журналистикой данных и традиционной журналистикой.

Оригинал статьи опубликован на испанском языке в газете La Nación Data. Источник: IJNet.org, Публикуется с разрешения сайта IJNet.org.

Дата-журналистика. Необходимые навыки

Что такое информационное кураторство

С тех пор как информационное кураторство перестали называть воровством контента, а выделили – и вполне заслуженно – в отдельный жанр, появилась ниша – создание инструментов для более оперативного, более эффективного информационного кураторства (о том, что это такое много писали на сайте Новый репортер, читайте их материалы тут). Далее «Что такое информационное кураторство»

Что такое информационное кураторство

Data-журналистика: поиск историй в данных

LINE MAP

Далее «Data-журналистика: поиск историй в данных»

Data-журналистика: поиск историй в данных