Усунення плутанини між кореляцією та причинно-наслідковими зв’язками 

Ось історичний шматочок, про який ви можете не знати. У період між 1860 і 1940 роками, коли кількість міністрів-методистів, що жили в Новій Англії, зростала і кількість кубинського рому, ввезеного в Бостон - і вони обидва зростали надзвичайно схожим чином. Таким чином, методистські міністри, мабуть, скупили багато рому за той період часу!

Насправді ні, це дурний висновок. Що насправді відбувається, так це те, що обидві кількості - міністри -методисти та кубинський ром - були підняті вгору іншими факторами, такими як зростання населення.

Прийшовши до цього неправильного висновку, ми зробили занадто поширену помилку плутане співвідношення з причинно -наслідковим зв'язком.

Яка різниця?

Кажуть, дві величини корелює  якщо обидва збільшуються і зменшуються разом ("позитивно корелює"), або якщо один збільшується, коли інший зменшується, і навпаки ("негативно корелює").

Кореляція легко виявляється за допомогою статистичних вимірювань Коефіцієнт кореляції Пірсона, що вказує на те, наскільки щільно скріплені між собою дві величини, починаючи від -1 (ідеально негативно корельований) до 0 (взагалі не корелюючий) і до 1 (абсолютно позитивно корельований).


Innersele підписатися графіка


 причинно -наслідковий зв'язок1tylervigen.com

Але те, що дві величини співвідносяться, не обов'язково означає, що одна безпосередньо викликаючи інший змінити. Кореляція не означає причинного зв'язку, так само, як і похмура погода не передбачає опадів, навіть якщо все навпаки.

Якщо дві величини співвідносяться, то цілком може існувати справжній причинно-наслідковий зв'язок (наприклад, рівень опадів та продаж парасольок), але, можливо, інші змінні впливають на обидва (наприклад, чисельність піратів та глобальне потепління), або, можливо, це просто випадковість (наприклад Споживання американського сиру та задушення за простирадлом).

Навіть там, де є причинно -наслідковий зв'язок, ми повинні бути обережними, щоб не змішати причину з наслідком, інакше ми могли б зробити висновок, наприклад, що збільшення використання обігрівачів викликає холоднішу погоду.

Щоб встановити причинно-наслідковий зв’язок, нам потрібно вийти за межі статистики та шукати окремі докази (наукового чи історичного характеру) та логічні міркування. Співвідношення може спонукати нас у першу чергу шукати такі докази, але це аж ніяк не є самим собою доказом.

Тонкі питання

Хоча наведені вище приклади були очевидно безглуздими, кореляцію дуже часто помилково приймають за причинно -наслідкову зв’язок у способах, які не відразу очевидні в реальному світі. Читаючи та інтерпретуючи статистику, потрібно дуже ретельно зрозуміти, що саме мають на увазі дані та їх статистика - і, що важливіше, що це таке НЕ мається на увазі.

 причинно -наслідковий зв'язок2

Одним із недавніх прикладів необхідності обережності при тлумаченні даних є хвилювання на початку цього року навколо очевидної революції виявлення гравітаційних хвиль - оголошення, яке, здається, було зроблено передчасно, перш ніж були враховані всі змінні, які впливали на дані.

На жаль, аналіз статистичних даних, ймовірностей та ризиків - це не набір навичок, пов'язаних з нами людська інтуїція, і тому занадто легко ввести в оману. Цілі книги були написані про тонкі способи, за допомогою яких статистику можна неправильно інтерпретувати (або використати для введення в оману). Щоб тримати себе обережно, ось деякі поширені слизькі статистичні проблеми, про які слід знати:

1) Ефект здорового працівника, де іноді дві групи не можна порівнювати безпосередньо на рівних умовах.

Розглянемо гіпотетичне дослідження, яке порівнює здоров’я групи офісних працівників із здоров’ям групи космонавтів. Якщо дослідження не показує суттєвої різниці між ними-немає кореляції між здоров'ям та робочим середовищем-чи можна зробити висновок, що життя та робота в космосі не несуть довгострокових ризиків для здоров'я космонавтів?

Ні! Групи не на одній основі: корпус космонавтів перевіряє заявників, щоб знайти здорових кандидатів, які потім підтримують комплексний режим фізичної підготовки, щоб завчасно боротися з наслідками життя в “мікрогравітації”.

Тому ми очікували б, що вони в середньому будуть значно здоровішими за офісних працівників, і ми мали б справедливо хвилюватися, якби це не було.

2) Категоризація та Етап міграційної дії - перемішування людей між групами може мати драматичний вплив на статистичні результати.

Це також відоме як Уїлл Роджерс ефект, після того, як американський комік, який, як повідомляється, глузував:

Коли Okies покинули Оклахому і переїхали до Каліфорнії, вони підвищили середній рівень розвідки в обох штатах.

Для ілюстрації уявіть собі поділ великої групи друзів на “коротку” групу та “високу” групу (можливо, для того, щоб організувати їх для фотографування). Зробивши це, напрочуд легко підняти середній зріст обох груп одночасно.

Просто попросіть найнижчу людину з групи «високих» перейти до групи «низькі». Група "високих" втрачає свого найкоротшого учасника, таким чином збільшуючи свій середній зріст, але "низькоросла" група здобуває свого найвищого члена і тим самим також збільшує середній зріст.

Це має серйозні наслідки в медичних дослідженнях, де пацієнти часто під час випробування нового лікування розподіляються на «здорові» або «нездорові» групи. Якщо методи діагностики покращуються, деякі пацієнти з дуже слабким здоров'ям можуть бути перекатегоризовані, що призведе до поліпшення результатів для обох груп, незалежно від того, наскільки ефективним (чи ні) є лікування.

 причинно -наслідковий зв'язок3Вибір та вибір даних може призвести до неправильних висновків. Скептики бачать період охолодження (синій), коли дані дійсно показують тривале потепління (зелений). skepticalscience.com 

3) Видобуток даних-коли присутня велика кількість даних, фрагменти можна відбирати для підтвердження будь-якого бажаного висновку.

Це погана статистична практика, але якщо це зроблено навмисно його важко помітити без знання оригінального, повного набору даних.

Розглянемо наведений вище графік, що показує дві інтерпретації даних глобального потепління, наприклад. Або фтор - у невеликих кількостях це один з найефективніших профілактичних препаратів в історії, але позитивний ефект повністю зникає, якщо брати до уваги лише токсичні кількості фтору.

З подібних причин важливо, щоб процедури для даного статистичного експерименту були закріплені до початку експерименту, а потім залишалися незмінними до завершення експерименту.

4) Кластеризація - чого слід очікувати навіть у абсолютно випадкових даних.

Розгляньте медичне дослідження, яке вивчає, наскільки конкретне захворювання, таке як рак або розсіяний склероз, є географічно розподілені. Якщо хвороба вражає навмання (а навколишнє середовище не впливає), ми очікуємо, що ми побачимо численні групи пацієнтів як само собою зрозуміле. Якби пацієнти були розподілені абсолютно рівномірно, розподіл був би дійсно самим не випадковим!

Тож наявність одного кластеру або кількох невеликих кластерів справ є цілком нормальним явищем. Потрібні складні статистичні методи, щоб визначити, скільки кластеризації потрібно, щоб вивести, що щось у цій області може викликати хворобу.

На жаль, будь-який кластер взагалі-навіть незначний-робить легкий (і на перший погляд переконливий) заголовок новини.

 причинно -наслідковий зв'язок4

Статистичний аналіз, як і будь -який інший потужний інструмент, слід використовувати дуже обережно - і, зокрема, завжди слід бути обережним, роблячи висновки на основі того, що дві величини співвідносяться.

Натомість ми завжди повинні наполягати на окремих доказах, щоб аргументувати причинно-наслідкові зв’язки-і ці докази не будуть у формі єдиного статистичного числа.

Начебто переконливі кореляції, скажімо, між даними генами та шизофренія або між a дієта з високим вмістом жирів та серцеві захворювання, можуть виявитися заснованими на дуже сумнівній методології.

Ми, можливо, як вид, когнітивно погано готові вирішувати ці питання. Як канадський педагог Кіран Іган помістив це у свою книгу Помилка від початку:

Погана новина полягає в тому, що наша еволюція дозволила нам жити в невеликих, стабільних суспільствах мисливців-збирачів. Ми плейстоценові люди, але наш мовний мозок створив масивні, багатокультурні, технологічно складні та швидко мінливі суспільства, в яких ми можемо жити.

Як наслідок, ми повинні постійно протистояти спокусі побачити сенс випадково і плутати співвідношення та причинно -наслідковий зв'язок.Бесіда

Ця стаття була спочатку опублікована на Бесіда
Читати оригінал статті.


Про авторів

борвейн ДжонатанДжонатан Борвейн (Джон) - лауреат професора математики в Університеті Ньюкасла. Він є професором -лауреатом математики в Університеті Ньюкасла та директором Центру комп’ютерної математичної дослідницької математики та її додатків (CARMA). Він працював в університетах Карнегі-Мелону, Далхаузі, Саймона Фрейзера та Ватерлоо та провів дві науково-дослідницькі кафедри Канади з обчислювальної техніки.

троянда МайклМайкл Роуз, кандидат філософських наук, Школа математичних та фізичних наук Університету Ньюкасла, аспірант математики під керівництвом лауреата професора Джона Борвейна в Університеті Ньюкасла, Австралія. В даний час допомагає у дослідженнях із застосування фрактальної математики до моделювання розподілів синапсів мозку.

Заява про розголошення: Автори не працюють, не консультуються, не володіють акціями та не отримують фінансування від будь -якої компанії чи організації, яким вигідна ця стаття. Вони також не мають відповідної приналежності.


Рекомендована книга:

Гроші, секс, війна, карма: нотатки про буддистську революцію
Девід Р. Лой.

Гроші, секс, війна, карма: Нотатки до буддистської революції Девіда Р. Лоя.Девід Лой став одним із наймогутніших захисників буддистського світогляду, пояснюючи як ніхто свою здатність трансформувати соціально-політичний ландшафт сучасного світу. В Гроші, секс, війна, карма, він пропонує різкі та навіть шокуючі чіткі презентації часто нерозуміних буддійських основних елементів - дію карми, природу себе, причини неприємностей як на індивідуальному, так і на суспільному рівнях - і справжні причини нашого колективного відчуття "ніколи не вистачає" , "чи час, гроші, секс, безпека ... навіть війна. "Буддистська революція" Давида - це не що інше, як радикальна зміна способів підходу до нашого життя, нашої планети, колективних марень, що пронизують нашу мову, культуру і навіть нашу духовність.

Клацніть тут, щоб отримати більше інформації та / або замовити цю книгу на Amazon.