четверг, 24 июня 2010 г.

Средства для веб-анализа. Javascript-тэги


Появление систем веб-аналитики, использующих для сбора данных javascript-тэги, значительно продвинуло интернет-бизнес  в плане получения действительно полезной информации о поведении пользователей на сайте.  Не будет преувеличением сказать, что от палки-копалки веб-аналитики перешли к экскаватору.
В отличие от серверных логов,  в которых содержится описание параметров http-запросов, javascript-тэги дали возможность получать информацию о событиях, происходящих на веб-страницах.  Таким образом, базовые метрики вроде количества уникальных посетителей и количества просмотров страниц  дополнились данными о поведении пользователей на каждой отдельно взятой странице.
Благодаря тому, что язык javascript позволяет фиксировать события на странице, стало возможно понимать, например, на каком из полей сложной веб-формы, пользователь отказался от завершения задачи. Или понимать, как часто пользователи вызывают события (например, просмотр увеличенной иллюстрации), которые не связаны с отдельным http-запросом.
Более того, разработчики javascript-решений для веб-аналитики научились фиксировать загрузки файлов (раньше фиксация таких событий считалась одним из ключевых преимуществ систем анализа серверных логов).
В  отличие от серверных логов решения на javascript-тэгах фиксируют и перемещение пользователя по сайту с использованием кнопок «вперёд» и «назад».
В сухом остатке крайне сложно представить себе мотивацию, по которой веб-аналитик для работы предпочтёт решению на javascript-тэгах анализ серверных логов.  Опасения, связанные с тем, что часть аудитории не может быть обсчитана из-за отключения в браузере javascript, сейчас не заслуживают внимания.  Уже в 2007 году доля пользователей с отключенным javascript была на уровне 3 %.

Однако и у такого хорошего решения как javascript-тэги есть несколько недостатков.  Существует вероятность того, что при установке тэгов на сайт, часть страниц будет пропущена, либо тэги будут установлены не корректно. В этих случаях собираемые данные будут не полными, а при наиболее печальном раскладе (например, тэг с ошибкой будет вставлен в неправильное место) есть риск и вовсе создать проблемы при загрузке страницы пользователем.
Для проверки правильности установки тэгов есть программные решения. Например, создатели Google Analytics в своём Conversion University рекомендуют использовать инструмент SiteScan.

четверг, 17 июня 2010 г.

Средства для веб-анализа. Серверные логи

Для сбора данных об аудитории сайта и её поведении на сайте существует несколько методов: серверные логи, javascript-тэги, т.н. beacons и сниффинг (обработка пакетов данных). Я не буду пытаться описать все указанные методы с их достоинствами и недостатками в одном посте – текста может получиться слишком много, и воспринять его за один раз может оказаться непросто.

Поэтому начну со сбора и анализа серверных логов.

Этот метод появился первым. Вообще, сбор и хранение серверных логов ведется в первую очередь для мониторинга корректной работы сайта, точнее, сервера на котором сайт живёт. Использование логов для учёта количества и качества аудитории сайта стало побочным продуктом.
Вкратце процесс сбора серверных логов выглядит так:
Пользователь вписывает URL сайта в адресную строку либо кликает по ссылке на сайт → Запрос на показ запрошенной страницы приходит на сервер →
Сервер принимает запрос, готовит запрошенную страницу для показа пользователю и записывает в лог параметры запроса пользователя (название страницы, IP-адрес, браузер и операционная система пользователя, дату и время запроса).

Для разбора и систематизации информации из серверных логов существует множество как платных, так и бесплатных программных продуктов. Первый такой коммерческий продукт появился ещё в 1994 году.

Всё, что нужно для начала работы в этом случае – это установить на сервер дополнительное ПО. Хорошему системному администратору для этого понадобится не более часа. Можно воспользоваться, например, Webalizer, AWstats или Analog– все три продукта бесплатны.

Удобство упомянутых продуктов в том, что они сортируют и показывают те данные, которые нужны для оценки аудитории, а не технические подробности работы сервера.

К преимуществам серверных логов, как инструмента веб-аналитики, можно отнести:
• возможность отслеживания визитов поисковых роботов. Эта возможность особенно полезна для новых только что запущенных сайтов. Людям, ответственным за поисковый трафик не надо ежедневно беспокоить системного администратора с вопросами: «Что у нас там с визитами роботов?»
• возможность хранить все анализируемые данные столько времени, сколько нужно. Все остальные продукты имеют ограничение на срок хранения данных. Плюс при миграции с одного продукта на другой сравнивать новые и старые данные становится совсем неудобно.
Минусы серверных логов:
• логи и их анализаторы не позволяют отслеживать просмотры кэшированных страниц. Если пользователь вернулся на главную страницу сайта, воспользовавшись браузерной кнопкой «Назад», повторный просмотр страницы засчитан не будет.
• через анализаторы логов крайне затруднительно получать какую-то информацию, выходящую за рамки базовых технических параметров (визиты, уникальные посетители, просмотры страниц , география, тип браузера и операционной системы). При огромном желании к анализатору можно «прикрутить» какие-то дополнительные надстройки. Но тогда уж лучше воспользоваться бесплатным решением с использованием javascript-тэгов.
• Через анализаторы логов невозможно отследить активность на сайте, не связанную с http-запросами (взаимодействие пользователя с объектами flash, ajax-формами и т.п.)

В сухом остатке, анализировать серверные логи при условии наличия продвинутых систем на базе javascript-тэгов, мне представляется делом сомнительным. За исключением отслеживания визитов поисковых роботов на начальном этапе существования сайта других потребностей я в этом инструменте не вижу.