5 серпня 2014

За великим рахунком: проблема журналістики даних

Один з нових трендів у медіа – журналістика даних. Журналіст, як справжній майстер на всі руки, тепер не просто пише статті  він вишукує статистичні дані, аналізує їх та підраховує, а іноді ще й оформляє ці дані у вигляді інфографіки. Та робота з даними, окрім очевидних переваг, має безліч підводних каменів. Platfor.ma переклала статтю американської економічної журналістки Елісон Шрагер з Quartz про те, які ризики і небезпеки несе журналістика даних та як їх уникнути.


Фотографія: shutterstock.com
 

Сучасний бум на проекти в журналістиці даних вражає. Вона може покращити наші знання, оживити статистичні дані та навчити нас всіх краще розбиратись в числах. Та я схвильована тим, що дані наділяють текст помилковим відчуттям влади, оскільки аналіз даних за своєю природою схильний до упередженості. Переконання автора, в які він вірить або хоче, щоб вони були правдою, не звертаючи увагу на дані, часто псують результати, що могли би бути достовірними та науковими. Навіть підкріплена даними журналістика є журналістикою думки. Оскільки ми беремо участь у цій новій хвилі журналістики, ми повинні усвідомлювати, що ми отримуємо та у що повинні вірити.

 

Блогер-економіст Джеймс Шнайдер нещодавно висловився з приводу того, як журналісти проводять дослідження, що підтверджує їхню думку, навіть якщо це дослідження не заслуговує на довіру та ігнорує факти, що можуть поставити його під сумнів. Гарний приклад – нещодавно оприлюднені економічні дослідження витрат на підвищення мінімальної заробітної плати.

 

Але товариш Шнайдера, блогер Брайан Кеплен, відзначає, що ця упередженість притаманна не лише журналістам – навіть кваліфіковані соціологи добирають ті методи, які би підтвердили їхні упередження. Кожного разу, коли ви звертаєтесь до даних, існує ризик упередженості, а також ризик того, що даними можуть маніпулювати, щоб нав’язати певну  точку зору.

 

Коли я вперше почала писати не для академічної спільноти, більш досвідчений економіст і журналіст, Майкл Мендель, дав мені пораду: «В тебе є необхідні навички, щоб робити вражаючі речі з даними і це буде вирізняти тебе як журналістку».

 

Але Мендель також благав мене бути пильною того, як я використовую дані в своїй роботі. Тому що я, як і всі інші, схильна до тих самих упереджень. Аналіз даних – скоріше мистецтво, ніж наука. Нещодавно я запитала його, що він думає з приводу нової хвилі журналістики даних, де є зовсім небагато журналістів (якщо такі взагаліі є), що мають підготовку в сфері емпіричних методів дослідження.

 

Він відповів наступне: «Я вітаю те, що в журналістиці все частіше використовують дані. Та не можна просто найняти графічних дизайнерів, щоб ті зробили гарні картинки. Щоб знайти сенс у сирому матеріалі, необхідно більше аналітичних потужностей, а також сильнішого прагнення до незалежного дослідження, аніж такого, що зазвичай не виходить за межі комфорту журналіста. Робота з даними також вимагає й нових етичних норм відповідального їх використання. Мова про це досі не йде».

 

Тому ось перелік етичних правил, яких журналісти мають дотримуватись, аби уникнути поширених помилок:

 

В ідеальному світі дані говоритимуть самі за себе, але цього ніколи не буде.

 

В процесі презентації та інтерпретації даних ми робимо судження та, можливо, помилки. По-перше, вам необхідно обрати правильні дані, що змогли би відповісти на ваше запитання. Одного разу я працювала над проектом з однією людиною, що стежила за багатьма виробничими підприємствами, які наймали велику кількість низько кваліфікованих працівників. Ці підприємства відкривались в Європі (де робоча сила коштує дорого) і одразу закривалися після початку торгівлі. Ґрунтуючись на цьому, він дійшов висновку, що торгівля вбиває підприємництво.

 

Але насправді він лише довів Теорію порівняльних переваг, або те, що торгівельні потоки спрямовані в бік країн, багатих на певні ресурси для виробництва, в даному випадку це була дешева робоча сила. Для того, щоб отримати більш точний результат, йому потрібно було дослідити фірми з інших промислових галузей. Його обмежена вибірка стала причиною упередженого результату.

 

Тільки-но ви обрали дані, вам потрібно дослідити їх та відкринути зайве

 

Тоді ви, скоріш за все, відмовитесь від певних висновків. Щоб знати, що відкинути, потрібна розсудливість та досвід. Видалення даних може здатися сумнівною маніпуляцією, але якщо ви не будете фільтрувати й досліджувати ваші дані, матимете упереджену та ненадійну вибірку. Це просто неминуче. Одне з моїх улюблених джерел даних – дослідження Федеральним резервом споживчих фінансів, яке мало на меті проінформувати про фінансовий стан американських домогосподарств. Але це дослідження брало до уваги більше заможних домогосподарств, ніж ви зазвичай зустрічаєте в Штатах. Якщо ви це не врахуєте, то американці здаватимуться багатшими, ніж вони є насправді.

 

Будьте уважні до економічних значень у ваших даних.

 

Припустимо, ви хочете дізнатися, чи американці достатньо заощаджують. Ви можете звернутися до даних Бюро економічного аналізу (мабуть доволі суперечливе джерело даних) щодо щорічного потоку особистих коштів і вам буде здаватись, що він збільшується, або хоча б, якщо врахуєте інфляцію, не зменшувався з 80-х років.

 

 

Цей графік свідчить про те, що все добре й американці достатньо заощадливі. Проте важливо розглянути заощадження в контексті прибутків. Це більше розповість вам про заощадження, які повинні замінити собою прибутки в разі, якщо щось станеться. Саме тому необхідно дивитись на відсоткове співвідношення прибутків та заощаджень.

 

 

Виходячи з цього графіку, люди, навпаки, стали заощаджувати менше.

 

Коли я лише починала використовувати статистичні дані в своїй роботі, я зосереджувалась на простих розрахунках (і зазвичай брала лише найпростіші середні показники)

 

Все ускладнюється, коли автор починає використовувати дані для більш складних розрахунків, наприклад, розвитку регресії чи для складання прогнозів.

 

Минулого тижня я написала статтю про те, що робітники профспілок частіше змінюють місце роботи та не затримуються на своїх робочих місцях. Я вважаю, ця тенденція формувалася роками і відображає структурні зміни в економіці. Аби це довести, в ідеалі, я би взяла дані за перший рік – 1989 і порівняла би їх з останніми даними 2010 року. Та я хвилювалась, що у 2010 насправді відбулась рецессія. Я також помітила, що за цей час населення постарішало в середньому на дев'ять років. Я могла би врахувати ефект рецесії, а також врахувати вікові показники населення. Та це вже було б занадто. Що складніші ваші розрахунки, то більша ймовірність упередженого результату, який, я вважаю, був би не чесним по відношенню до читача. Натомість я використала дані 2007 року та вказала вікові показники у своїй таблиці. Можливо, цей результат не всеохопний, проте він є абсолютно прозорим, і я досі вважаю, що вчинила правильно.

 

Емпіричні дослідники витрачали роки на вивчення того, як правильно застосовувати статистичні дані, а потім витрачали незліченні години на їх аналіз. І навіть після цього найдосвідченіший дослідник з благими намірами міг отримати упереджений результат. Поєднання переконань та суджень людини – це комбінація, що призводить до упередження. Саме тому статистичні дані, що заслуговують на довіру, проходять процес рецензії або принаймні декілька раундів детальних обговорень. Ціла армія підготовлених людей повинна оцінити обґрунтованість роботи, перш ніж її результати стануть фактом. Але експертиза такого рівня здається мало реалістичною в мінливому світі журналістики, саме тому я побоююсь використовувати надто складні та суперечливі дані без чітких стандартів. Це може обмежити можливість застосування даних у журналістиці, та ризик введення людей в оману виправдовує це обмеження. Крім того, якщо ваша історія потребувала деяких маніпуляцій та вигаданих розрахунків – цілком очевидно, результат буде упередженим. Якщо факт, що його ви намагаєтесь довести, є надто складним, він повинен стати предметом науково-дослідної роботи, яка би підлягала експертній оцінці.

 

Майже всі дослідники та журналісти, що працюють з даними, ніколи не будуть навмисно вводити в оману свою аудиторію. Незважаючи на всі недоліки, дані є потужним інструментом, вони також є кращим способом зрозуміти економіку. Все ж я вважаю журналістку даних позитивною інновацією вебу. Та будь-яка інновація може розвиватись набагато швидше за вже існуючу інфраструктуру і цим заподіювати шкоду. Ми можемо мінімізувати ці ризики, якщо зрозуміємо межі застосування даних та те, як їх використовувати відповідально. Я переконана, що аналіз даних має бути простим, зрозумілим та прозорим. І навіть в цьому випадку ми повинні бути поміркованими та не приймати результати аж надто буквально.

 

Матеріали в рамках розділу Media Innovations Lab виготовлені за сприяння Фонду розвитку українських ЗМІ посольства США в Україні.

Підписатися на новини проекту у facebook можна тут.


comments powered by Disqus