Журналистика данных: 3 простых вопроса


Почему поступил на журналиста? Потому что математику не надо было сдавать. Старая добрая шутка, которая частенько оказывалась правдой, в скором времени будет совсем не актуальна.

Математика, с приходом эры журналистики данных, будет основным предметом, который медийщикам необходимо будет знать также хорошо, как уметь складно рассказывать и показывать истории.

Важно не только то, отличаете ли вы деепричастный оборот от причастного, но и знаете ли вы что такое доверительный интервал (пишу и плачу) и можете ли отличить среднее значение от медианы:).

Современным журналистам придется учиться этой новой грамоте — грамоте данных. Учиться их читать, понимать, анализировать, собирать. Придется полюбить цифры (ведь они составляют большую часть данных), подружиться с ними и освоить навык рассказывать истории цифрами.

И учиться этому придется также, как учатся письменной грамоте — писать без ошибок, связно, образно, логично. То же надо уметь делать с данными.

Из «Пособия по журналистике данных»

Грамотность в сфере данных включает в себя грамотность в сфере статистики, умение работать с большими наборами данных, понимание того, как данные были составлены, умение объединять разные наборы данных и способность толковать данные.

Проблема с нехваткой знаний у журналистов в сфере данных — проблема мировая. Как пишут в «Пособии по журналистике данных»  журналистам нужна помощь в тех разделах математики, которые школьники изучают в 5 классах.

Нехватка этих знаний мешает извлечь пользу из данных по различным темам. Но, как считает один из авторов «Пособия по журналистике данных», Николас Кайзер-Брил, не обязательно заканчивать магистратуру по математике, даже если у журналиста нет знаний в этой области, он может написать материал, основываясь на данных, задав 3 простых вопроса.

Далее цитаты из «Пособия по журналистике данных». Автор: Николас Кайзер-Брил, Journalism++

1. Как были собраны данные?

Удивительный рост ВВП

Самый простой способ продемонстрировать зрелищные данные — сфабриковать их. И этот способ применяется даже к таким привлекающим всеобщее внимание данным, как показатели ВВП. Бывший посол Великобритании Крейг Мюррей пишет в своей книге «Убийство в Самарканде», что показатели роста в Узбекистане являются объектом напряженных переговоров местных властей с международными организациями. Другими словами, они не имеют никакого отношения к местной экономике.

Преступность всегда растет

«Преступность в Испании выросла на 3 %», пишет El Pais. Брюссель стал жертвой роста преступности, вина за которую возлагается на незаконных иммигрантов и наркоманов, говорит RTL. Такой вид сообщений, основанных на собираемых полицией данных, является широко распространенным, однако они не содержат какой-то особой информации о насилии.

Мы можем верить в то, что в Европейском Союзе данные не подтасовываются. Однако на полицейских влияют побуждающие стимулы. Например, когда эффективность работы определяется уровнем раскрытия преступлений, у полицейских появляется стимул сообщать о как можно большем количестве происшествий, не требующих расследований. Одним из таких преступлений является курение травки. Этим объясняется тот факт, что за последние 15 лет количество преступлений, связанных с наркотиками, увеличилось во Франции в четыре раза, в то время как уровень потребления остается неизменным.

Что вы можете сделать

Если вы сомневаетесь в достоверности данных, проверяйте и перепроверяйте их, так, как вы делали бы это, если бы источником данных было высказывание политика. В примере с Узбекистаном будет достаточно позвонить кому-нибудь, кто прожил там какое-то время («Можете ли вы сказать, что страна стала в 3 раза богаче, чем она была в 1995 году, как говорят официальные данные?»).

В случае с данными полиции, социологи часто проводят исследования виктимизации, в ходе которых они спрашивают респондентов, становились ли они жертвами преступлений. Результаты этих исследований обычно менее изменчивы, чем данные полиции. Возможно, именно поэтому они и не попадают в заголовки.

2. Какую информацию из них можно извлечь?

Риск рассеянного склероза удваивается, если работать по ночам

Конечно, любая немка в здравом уме, прочитав подобный заголовок, перестанет работать в ночные смены. Однако в статье так и не сообщается, каков же реальный риск на самом деле.

В среднем 1 из 15 европейцев абсолютно безграмотен.

Такой заголовок пугает. Кроме того, это абсолютная правда. Из 500 миллионов европейцев 36 миллионов не умеют читать. А еще 36 миллионов находятся в возрасте до 7 лет (данные Евростата).

Когда вы собираетесь написать «в среднем», подумайте, «в среднем от чего»? Однородно ли описываемое население?

Что вы можете сделать

Всегда учитывайте распределение и базовые значения. Проверка среднего значения и медианы, а также моды (наиболее часто встречающееся значение в распределении) поможет вам в проникновении в суть данных. Знание порядка величины облегчает контекстуализацию, как видно в примере с рассеянным склерозом. И, наконец, применение в ваших материалах числовых значений (1 из 100) больше поможет читателям понять суть вопроса, чем применение процентов (1 %).

3. Насколько надежны данные?

Проблема объема выборки

«80 % граждан недовольны судебной системой», говорится в исследовании, о котором пишет газета из Сарагосы Diaro de Navarra. Но как можно экстраполировать ответы 800 респондентов на 46 миллионов испанцев? Конечно, эти данные нельзя воспринимать всерьез, подумаете вы.

При исследовании больших групп населения (больше нескольких тысяч) для достижения предела погрешности менее 3 % вам обычно потребуется не более одной тысячи респондентов. Т. е., если вы проведете то же исследование с другой выборкой, то в 9 случаях из 10 полученные ответы будут отличаться от ответов, полученных в первый раз, не более, чем на 3 %. Статистика — мощный инструмент, и объемы выборки редко бывают повинны в недостоверных результатах опросов.

Что вы можете сделать 

Математические выкладки, касающиеся взаимосвязей и погрешностей в исследованиях свойств чая, конечно правильны, по крайней мере, в большинстве случаев. Однако, если исследователи не обращают внимание на соотношения взаимосвязей (например, как употребление чая соотносится с занятиями спортом), то их результаты не имеют большой ценности.

Как журналисту вам не имеет смысла ставить под сомнение численные результаты исследования, например, объемы выборки, за исключением случаев, когда они вызывают серьезные сомнения. Однако, вы можете легко понять, не упустили ли исследователи в своих исследованиях какую-либо значимую информацию.

Журналистика данных: 3 простых вопроса