RSS на пути к науке о данных - Medium

Создание эффективных метрик для описания пользователей

Создание цифрового профиля клиента является общей проблемой в цифровых продуктах и предполагает преобразование числовых метрик пользователя в персонализированную оценку того, является ли поведение типичным или нетипичным для пользователя. Эти метрики, такие как «3 посещения за последнюю неделю», не учитывают историю пользователя или динамику метрики, что делает неясным, что они означают для бизнеса. Чтобы решить эту проблему, аналитикам необходимо нормализовать метрики, чтобы сравнивать их между пользователями и понимать их значимость в контексте жизненного цикла пользователя. Одним из подходов является анализ распределения метрики и определение вероятности наблюдения текущего результата, или p-значения. Однако это может быть сложно из-за не-нормальных распределений. Решением является преобразование функции плотности вероятности в функцию накопленного распределения (CDF) и расчет p-значения из нее. Это можно сделать эффективно с помощью сплайнов, и предоставлен простой пример, чтобы проиллюстрировать процесс. Пример показывает, как создать CDF из данных пользователя, сгладить его с помощью интерполяции сплайном и рассчитать p-значение для текущего наблюдения. p-значение можно затем использовать, чтобы определить, является ли поведение необычным для пользователя и принимать бизнес-решения, такие как отправка персонализированных предложений. Используя статистические методы, такие как CDF и интерполяция сплайном, аналитики могут лучше понять контекст, стоящий за действиями пользователя, и принимать более эффективные, обоснованные на данных бизнес-решения.
towardsdatascience.com
Building Effective Metrics to Describe Users
Create attached notes ...