Почему - Саманта Клейнберг (2017)
-
Год:2017
-
Название:Почему
-
Автор:
-
Жанр:
-
Язык:Русский
-
Страниц:161
-
Рейтинг:
-
Ваша оценка:
Почему - Саманта Клейнберг читать онлайн бесплатно полную версию книги
Если мы, имея набор переменных, хотим найти между ними каузальные зависимости, то должны быть уверены, что уже измерили все общие причины этих переменных. Если истинно утверждение, что кофеин приводит к недосыпанию и повышает давление – и что это единственная взаимосвязь между сном и сердечным ритмом, – то, не измерив потребления кофеина, мы можем сделать некорректные выводы при выявлении отношений между его следствиями. Причины, отсутствующие в наборе данных, называются скрытыми или латентными переменными. Неизмеренные причины двух или более переменных, способных привести к ложным умозаключениям, именуются скрытыми общими причинами или латентными искажающими факторами, а возникающие вследствие этого проблемы называются искажением (что чаще встречается в информационных технологиях и философской литературе) и смещением из-за пропущенных переменных (что более присуще статистике и экономике). Это одно из ключевых ограничений исследований наблюдением, а также вводных данных в вычислительных методах, поскольку приводит как к выявлению ложных взаимосвязей, так и к переоценке силы причин.
Немного изменим этот пример. Кофе напрямую влияет на сон – а теперь он будет влиять на сон и через фактор частоты сердечных сокращений (ЧСС), как на рис. 6.1. Даже если ЧСС служит причиной недосыпа, мы видим, что этот фактор более/менее значим, чем если бы мы не измеряли потребление кофе. То есть, поскольку кофеин вызывает сердцебиение, высокий показатель последнего может дать нам некую информацию о статусе тонизирующего напитка (присутствие/отсутствие). В главе 7 мы увидим, как экспериментальными методами посредством рандомизации[230] можно решать эту проблему.
Рис. 6.1. Кофеин – общая причина учащения пульса и недосыпания, однако ЧСС также напрямую влияет на сон
Хотя практически любой метод, основанный на данных наблюдения, допускает, что нет никаких скрытых общих причин, на практике редко можно быть уверенным в этом. Заметим, однако: мы не обязаны допускать, что измерена каждая причина – только общие.
На рис. 6.2 (а) показано, что кофеин изменяет как качество сна, так и сердечный ритм; алкоголь вызывает аналогичный эффект. Не располагая данными по потреблению алкоголя, мы не сумеем выявить эту причину изменений сна, однако в результате не будут сделаны некорректные выводы об их взаимоотношениях. Аналогично, если кофе воздействует на сон посредством промежуточной переменной, отношения будут примерно такими: кофеин вызывает повышенное сердцебиение, а оно провоцирует недосып (рис. 6.2 (б)), и если при этом мы не измеряем сердцебиение, то просто найдем более неявную причину, а не некорректную структуру. Таким образом, необязательно наблюдать каждое индивидуальное звено в каузальной цепи.
Рис. 6.2. Если алкоголь (слева) и сердцебиение (справа) не измерены, это не ведет к искажению связи между кофеином и сном
Некоторые вычислительные методы исходят из допущения, что все общие причины измерены, и определяют, в каких случаях может существовать невыявленная причина, или иногда помогают обнаружить саму причину. Однако это, как правило, возможно только при очень жестких условиях и затруднительно при наличии комплексных временных рядов[231]. Но как быть, если мы не знаем, что все общие причины измерены, и не в состоянии применить эти методы для выяснения причин?
В методах графических моделей, о которых мы поговорим далее, доступно только одно: найти все возможные модели, соответствующие данным, включая те, которые имеют скрытые переменные.