Как работает Google Analytics. Сбор данных и их обработка.

Генеральный спонсор: ГлавМед: быстрый старт. Кратко, доступно, понятно


Как работает Google Analytics

Понимание архитектуры системы Google Analytics – как она собирает данные, идентифицирует посетителя и создает отчеты – это ключ к пониманию множества более сложных вещей, которые будут обсуждаться позже. Перед тем, как мы начнем обсуждать фильтры, цели, и более сложные варианты применения системы, рассмотрим фундаментальные основы ее работы.

Сбор данных и их обработка

Я буду объяснять, как Google Analytics собирает, обрабатывает и отображает данные, используя рис.1. Процесс сбора данных начинается в момент, когда посетитель запрашивает страницу с веб сервера. Сервер отвечает, посылая запрошенную страницу в браузер посетителя (шаг №1). По мере того, как браузер обрабатывает данные, он запрашивает другие серверы, которые могут содержать части запрошенной страницы. В том числе и код счетчика Google Analytics (Google Analytics Tracking Code, GATC).

Рис.1

Браузер посетителя запрашивает код с сервера Google Analytics (шаг №2), и сервер отвечает, посылая обратно код. Весь код содержится в одном файле под именем urchin.js. Как только браузер получает код, GATC начинает выполняться, пока загружается остальная часть страницы.

Во время выполнения код идентифицирует свойства(атрибуты) посетителя и его браузера – сколько раз он был на вашем сайте, откуда он пришел и т.п.

ПОсле того, как будут собраны все соответствующие данные, GATC устанавливает (или обновляет, в зависимости от ситуации), некоторое количество файлов cookie (шаг №3), которые будут рассмотрены позже. Файлы cookie используются для хранения информации о посетителе. После записи файлов cookie, код счетчика посылает данные обратно на сервер Google Analytics. Данные передаются на сервер с помощью запроса невидимого GIF-файла (шаг №4).

Когда сервер Google Analytics получает этот запрос, он сохраняет данные в большом текстовом файле, называемом лог-файлом (шаг №5). Для каждого просмотра страницы в лог-файле создается отдельная строчка.

Каждая строка в лог-файле содержит многочисленные атрибуты просмотра страницы. Например:

- когда произошел просмотр (дата и время)
- откуда пришел посетитель (ссылающийся веб-сайт, поисковик и т.п.)
- сколько раз посетитель был на сайте (количество посещений)
- где находится посетитель (географическое местоположение)
- кем является посетитель (IP адрес)

После того, как просмотр страницы сохранен в лог-файле, процесс сбора данных завершен. Следующий шаг – это обработка данных.

С некоторым регулярным интервалом, обычно каждые несколько часов, Google Analytics обрабатывает данные в лог-файле. Во время обработки, каждая строка разбивается на фрагменты, по одному для каждого атрибута просмотра страницы. Вот пример строки лог файла (учтите, что это не настоящая строчка лог-файла Google Analytics. Это ее демонстрационное представление.)

65.57.245.11 www.epikone.com – [21/Nov/2006:19:05:06 -0600] «GET/__utm.gif?utmwv=1&utmn=323703347&utmcs=utf-8&utmsr=1600×1200&utmsc=32-bit&utmul=en-us&utmje=1&utmfl=8.0&utmcn=1&utmdt=EpikOne%20-%20Google%20Analytics%20Support%2C%20Training%20-%20Urchin%205%20Software%2C%20Analytics%20Consulting&utmhn=www.epikone.com&utmr=-&utmp=/ HTTP/1.1″ 200 35 «http://www.epikone.com/» «Mozilla/4.0 (compatible; MSIE 6.0;Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)»"__utma=100957269.323703347.1164157501.1164157501.1164157501.1; __utmb=100957269;__utmc=100957269;__utmz=100957269.1164157501.1.1.utmccn=(direct)|utmcsr=(direct)|utmcmd=(none)»

Хотя большинство этих данных трудно понять на первый взгляд, некоторые вещи все же выделяются. Дату и время (Nov 21, 2006 в 19:05:06), а также IP-адрес посетителя (65.57.245.11) легко идентифицировать.

Google Analytics превращает каждый фрагмент данных из строки лог-файла в элемент данных под названием «поле» (field). Например, IP-адрес становится полем «IP посетителя» (Visitor IP). Важно понимать, что каждый просмотр страницы содержит много атрибутов, и что каждый из этих атрибутов хранится в соответствующем поле.

После того, как каждая строчка разбита на поля (шаг №6), к данным применяются фильтры (шаг №7). Фильтры – это бизнес-правила, которые вы добавляете в Google Analytics. Они отвечают за то, какие данные отображаются в ваших отчетах, и каким образом они там отображаются.

Наконец, после применения фильтров, создаются отчеты (шаг №8), и сохраняются в базе данных (шаг №9). Каждый отчет в Google Analytics создается посредством сравнения поля (например, Город (Visitor City)) с фрагментом целочисленных данных (посещения, просмотры страниц, показатель отказов, показатель достигнутой конверсии и т.п.).

После того, как данные попадают в базу, процесс закончен. Когда вы, или любой другой пользователь, запрашиваете отчет, из базы извлекаются соответствующие данные и посылаются в браузер.

Внимание.

Как только Google Analytics обработал данные, и они попали в базу, они уже не могут быть изменены. Это означает, что архивные данные никогда не могут быть изменены или заново обработаны. Любые ошибки, сделанные в ходе установки или настройки, могут затем постоянно влиять на качество данных. Это также означает, что любые изменения, сделанные в настройках Google Analytics, не отразятся на архивных данных.

P.S. Рекламный постовой. Англия – это круто. Прилетел в аэропорт Хитроу – надо парковаться, для этого есть heathrow parking. А если самолет захватил арабский террорист и приказал сесть в Гатвике – не вопрос, будет вам meet and greet parking gatwick. Вопрос только в том, как попасть в Англию. Для девушек это будет несложно – выскочить замуж за англичанина, и все дела. А чтобы не выглядеть на свадьбе как лохушка – пусть смотрят заранее в гугле по запросу свадебные платья фото.


Что дальше?
Добавь этот пост в закладки:



Вы можете оставить комментарий, или поставить трэкбек со своего сайта.

Написать комментарий

XHTML: Вы можете использовать эти теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>