Это утверждает Рон Кохави, ведущий специалист по контролируемым экспериментам (ex-AirBnB, ex-Microsoft, ex-Amazon).
В своей книге "Trustworthy Online Controlled Experiments" он подчеркивает важность различия между этими понятиями. И демонстрирует это на двух примерах – один из мира подписочных сервисов, аналогичных Netflix, и другой, связанный с Microsoft Office 365.
Предположим, вы работаете в компании, подобной Netflix, где каждый месяц X% пользователей прекращают подписку. Внедрив новую функцию интерфейса, вы обнаруживаете, что коэффициент оттока пользователей, использующих эту функцию, составляет 0,5X. Соблазн заявить о причинной связи может быть сильным, но Кохави предостерегает – на основе имеющихся данных нельзя сделать однозначных выводов об влиянии этой функции на отток пользователей. На деле причины и выводы могут быть самыми разными.
Или другой вариант – пример из Microsoft Office 365. Пользователи, сталкивающиеся с сообщениями об ошибках и сбоями, демонстрируют более низкий коэффициент оттока. Парадокс? Может нужно увеличивать количество сообщений об ошибках? Отнюдь. Кохави объясняет, что эти якобы частые поломки связаны с одним специфическим фактором - активностью использования продукта. То есть более вовлечённые пользователи совершенно закономерно получают больше сообщений об ошибках.
Оба эти примера подчеркивают главную мысль Кохави: корреляция не обязательно указывает на причинно-следственную связь. Ошибочное толкование данных может привести к неверным решениям.
Больше о работе с данными в продукте и маркетинге есть в Телеграм-канале "Модель атрибуции”
