Interpult Studio

Готовы научиться быстрому и простому способу прогнозирования трафика на любое время в будущем?

Серьезно.

Эта статья покажет вам, как вы можете:

  • Прогнозируйте изменения трафика и, возможно, даже сообщайте своему начальнику, когда следует ожидать периоды стагнации или отрицательного роста.
  • Чего ожидать во время увеличения или уменьшения трафика, чтобы вы могли сказать, соответствуют ли ваши отклонения прогнозам или что-то может пойти не так, и трафик снижается больше, чем должен.
  • Включите график с обновленной информацией для вашего босса или клиента о том, что произойдет заранее, чтобы они знали, что вы не просто оправдываетесь постфактум.

Хотите пропустить информацию и просто нажать несколько кнопок?

Пока мы будем запускать код для прогнозирования вашего веб-трафика и того, что делает каждый из разделов, вы можете пропустить это и прыгайте прямо в Colab здесь если вам не интересно знать, что происходит и как внести коррективы.

Для тех, кто хочет запускать код локально и иметь возможность редактировать гиперпараметры (причудливое название для некоторых переменных, которые выполняют важные функции и обычно имеют одно значение для полного запуска модели), поехали!

Важное примечание перед началом: Чем дальше вы просите ее предсказать, тем больше становится разрыв между низкими и высокими оценками, поскольку модель становится «менее уверенной в себе».

Как прогнозировать трафик Google Analytics

Мы будем использовать две системы для достижения нашей цели:

  1. Обозреватель запросов UA: в этом примере мы собираемся использовать Universal Analytics для нашего прогнозирования. Я адаптирую код в Colab примерно через год к GA4, но, поскольку для действительной работы нужны данные за год или более, использование UA на данный момент имеет наибольший смысл, и мало у кого есть данные GA4, относящиеся к более ранним периодам. чем год. UA Explorer — это инструмент, который быстро и легко генерирует URL-адрес API, который будет извлекать для нас нашу аналитику.
  2. Пророк Фейсбука: Prophet — это модель прогнозирования, созданная Facebook с открытым исходным кодом. Он включает в себя множество замечательных встроенных функций, таких как возможность импорта праздников. Это то, что превратит наши аналитические данные в прогноз.

Для тех, кто хочет работать локально, вы, очевидно, можете это сделать, и предоставленный код выполнит свою работу.

READ  Google принимает меры в связи с недавними случаями мошенничества с отзывами и угрозами шантажа

Итак, давайте погрузимся и научим вас прогнозировать ваш будущий трафик!

1. Подключите свой экземпляр

Это означает, что вы «включаете» Google Colab, чтобы запускать из него сценарии.

2. Импортируйте необходимые библиотеки

Следующее, что нам нужно сделать, это импортировать библиотеки, которые нам нужны, чтобы все это заработало.

Они есть:

  • pandas — библиотека Python для обработки данных (чтобы помочь нам работать со структурами данных временных рядов).
  • numpy — нужен для работы с массивами (такими как наши данные и массив сессий).
  • matplotlib — мы будем использовать его для создания некоторых визуализаций.
  • json — используется для работы с данными JSON.
  • запросы — используются для выполнения HTTP-запросов (например, получения данных аналитики).
  • fbprophet — используется для прогнозирования временных рядов.
  • pystan — используется для обновления вероятностей. Например, вероятность трафика X на дату в будущем.

Все, что вам нужно сделать, чтобы запустить, это нажать кнопку воспроизведения.

Вы увидите, как начнется куча загрузок, и кнопка воспроизведения превратится во вращающийся значок, указывающий на то, что он работает, а когда они закончат загрузку и установку, кнопка воспроизведения снова появится.

Вам необходимо войти в систему, используя учетную запись Google, привязанную к аналитике, к которой вы хотите получить доступ.

4. Настройте аналитику, которую вы извлекаете

Затем вам нужно выбрать учетную запись, ресурс и представление, из которых вы хотите получить данные о трафике.

Там, где указано выбрать показатель, вы можете выбрать один из многих показателей трафика в зависимости от того, что вы хотите знать. Примеры могут быть:

  • Сеансы (тот, который я использую чаще всего)
  • Посетители
  • Уникальные посетители
  • Просмотры страниц

Кроме того, если щелкнуть поле «сегменты», отобразится список всех сегментов ресурса (включая пользовательские сегменты), чтобы вы могли выбрать, какой трафик вы хотите просмотреть.

После выполнения запроса просто скопируйте URL-адрес запроса API:

5. Импортируйте аналитику в колаб

Нажмите кнопку воспроизведения в следующей ячейке:

Вам будет предложено ввести только что скопированный API-запрос:

Вставьте его и нажмите «Enter».

Вам должен быть представлен график трафика по выбранному вами диапазону данных:

6. Форматирование

Следующая ячейка просто меняет заголовки столбцов на то, что ожидает Facebook Prophet.

7. (Необязательно) Сохранить

Этот шаг совершенно не нужен, если вы не планируете обращаться к данным о трафике или прогнозируемым показателям. Лично мне это удобно, а кому-то нет.

Первое, что вы будете отслеживать, это просто количество трафика (так же, как вы могли бы экспортировать).

READ  Google Maps добавляет новую функцию определения местоположения магазина, Locator Plus, интеграцию с резервированием Google, новую аналитику и многое другое.

Обещаю, дальше будет еще интереснее.

8. Добавление праздников

Следующим шагом является добавление праздников и определение того, как учитывается сезонность. Есть несколько вариантов и способов, которыми вы можете настроить вещи, или вы можете запустить его как есть.

Решения, которые вы необходимость сделать:

  • На какие годы вы хотите тянуть каникулы?
  • Для какой страны вы хотите провести праздники?

Кроме того, вы заметите строку:

m = Prophet(interval_width=0.95, yearly_seasonality=True, weekly_seasonality=True, daily_seasonality=False, seasonality_mode = "additive", changepoint_range = 0.85)

Вы можете изменить любой из параметров в соответствии с вашими потребностями, хотя эти настройки должны нормально работать в большинстве сценариев:

  • интервал_ширина: Вот насколько неуверенной мы хотим позволить модели быть. Значение 0,95 означает, что при обучении 95% всех точек должны соответствовать модели. Установите его слишком низко, и он будет следовать общим тенденциям, но не будет слишком точным. Установите слишком высокое значение, и оно будет преследовать слишком много выбросов и станет неточным в этом направлении.
  • yearly_seasonality: Отслеживает и реагирует на ежегодные тенденции.
  • еженедельно_сезонность: Отслеживает еженедельные тенденции и реагирует на них.
  • daily_seasonality: Отслеживает и реагирует на ежедневные тенденции.
  • сезонность_режим: Установите либо «аддитивный», либо «мультипликативный». Аддитивность (по умолчанию) приводит к тому, что величина изменения остается постоянной. В большинстве случаев вы использовали бы это, чтобы справиться с такими вещами, как всплески трафика в праздничные дни, когда процентное увеличение по сравнению с до Черной пятницы более или менее стабильно. Мультипликативный используется в сценарии, где есть растущие всплески. Например, в растущем городе, в котором каждый год наблюдается дополнительный рост. Не только есть рост, но этот рост становится больше с каждым интервалом.
  • диапазон_зон_изменения: Точки изменения — это точки, в которых трафик значительно меняется. По умолчанию точка изменения

Это сценарий верхушки айсберга. Есть и другие параметры, которые вы можете просмотреть и применить по мере вдохновения. Подробная информация о них доступна здесь.

Я установил здесь то, что кажется мне хорошо работающим в большинстве (но не во всех случаях).

Годовая и месячная сезонность влияет на большинство предприятий. Ежедневно, не очень.

9. Считайте цифры

К счастью, вам не нужно этого делать.

Просто нажмите кнопку запуска.

И вы скоро увидите:

Не все строки или столбцы отображаются. Если бы они были, вы бы увидели следующее:

  • Максимальное вероятное число, которое модель предсказывает (yhat_upper).
  • Самый низкий (yhat_lower).
  • Прогнозируемое значение (yhat).

Важно отметить, что в приведенном выше коде вы увидите «periods=90». Это количество дней, на которое я собираюсь получить прогнозы.

Я нашел 90 работ прилично. После этого диапазон становится довольно большим между максимумом и минимумом, но на него может быть интересно посмотреть.

READ  Редизайн Google Новостей запускается на рабочем столе

10. (Необязательно) Сохранить прогнозы

Это необязательный шаг для тех, кто хотел бы сохранить свои предсказанные значения или использовать их для проверки различных значений параметров (которые обсуждались на восьмом шаге выше).

После запуска вы просто нажмете ссылку:

Что приведет вас к:

Каждый раз, когда вы запускаете его, ваши числа и результаты будут сохраняться, и к ним можно будет легко получить доступ в будущем для сравнения с другими запусками.

Это также даст вам числа, на которые можно ссылаться, если вас когда-нибудь попросят указать прогнозируемое значение для определенного дня.

11. Магия

Дотроньтесь до дна, и вы получите то, за чем, вероятно, пришли сюда.

По желанию

Я добавил дополнительный раздел Insights. Он просто отображает влияние некоторых областей, которые мы обсуждали выше.

Вы можете видеть на верхней диаграмме, где находятся различные точки изменения. Далее вы получите представление о том, как различные сезонные тенденции влияют на прогнозы и т. д.

Закрытие

Я всегда искал способы предсказать заранее, что мне предстоит.

Всегда лучше показать вашему боссу или клиенту, что замедление ожидается за неделю до того, как оно произойдет, чем пытаться объяснить это постфактум.

Кроме того, это понимание также может помочь вам спланировать свою стратегию.

Ваша работа может отличаться, когда вы находитесь в пиковых точках трафика, и когда вы находитесь в затишье. Вы можете ежемесячно, год за годом анализировать свои аналитические тенденции и пытаться собрать их воедино — или просто позволить машинам делать то, что машины делают лучше всего.

Напоминаю, если вы докопались до сути и хотите добраться до Colab, чтобы запустить это самостоятельно, вы найдете это. здесь.


Мнения, выраженные в этой статье, принадлежат приглашенному автору, а не обязательно поисковой системе. Штатные авторы перечислены здесь.


Новое в поисковой системе

Об авторе

Дэйв Дэвис — ведущий SEO-специалист компании Weights & Biases, занимающейся машинным обучением. Он начал заниматься SEO в начале 2000-х, а в 2004 году вместе со своей женой Мэри стал соучредителем Beanstalk Internet Marketing, которая до сих пор руководит его повседневными операциями. Он ведет еженедельный подкаст, регулярно выступает на ведущих отраслевых конференциях и гордится тем, что является постоянным участником сайта Search Engine Land.

Forecasting web traffic using Google Analytics and Facebook Prophet

от admin

EnglishFrançaisDeutschРусский