Как работают инструменты аналитики


Пред­ла­гаем вашему вни­ма­нию ста­тью Лид­ма­шины на вечно акту­аль­ную тему веб-ана­ли­тики.

Мы напи­сали уже много постов по ана­ли­тике сай­тов, но нико­гда не затра­ги­вали тему того, как рабо­тает ана­ли­тика. Думаю, пора вос­пол­нить этот про­бел, поэтому сего­дня мы пред­ла­гаем пере­вод ста­тьи веду­щего экс­перта в обла­сти циф­ро­вой ана­ли­тики Джа­стина Кутрони о том, как рабо­тают инстру­менты ана­ли­тики. Эта ста­тья мно­гое рас­став­ляет по полоч­кам и делает понят­ным.

how-analytics-works-shapka

Хиты, сессии, пользователи: понимание аналитики

Мы гово­рим о дан­ных каж­дый день: сес­сии, визиты, кон­вер­сии, стра­ницы, хиты и мно­гое-мно­гое дру­гое, — но зача­стую мы не можем понять, как все эти мет­рики соот­но­сятся друг с дру­гом и откуда они берутся. Давайте посмот­рим на то, как инстру­менты ана­ли­тики орга­ни­зуют дан­ные.

Все дан­ные в ана­ли­тике орга­ни­зо­ваны в иерар­хию: хиты, сес­сии, поль­зо­ва­тели. Не имеет зна­че­ния, откуда взя­лись дан­ные — это может быть веб-сайт, мобиль­ное при­ло­же­ние или тер­ми­нал. Эта модель рабо­тает и для веба, и для чего угодно.

how-analytics-works-hierarchy

Все дан­ные в ана­ли­тике орга­ни­зо­ваны в иерар­хию: хиты, сес­сии, поль­зо­ва­тели. Не имеет зна­че­ния, откуда взя­лись дан­ные — это может быть веб-сайт, мобиль­ное при­ло­же­ние или тер­ми­нал. Эта модель рабо­тает и для веба, и для чего угодно.

Важно пони­мать каж­дую часть иерар­хии и как они соот­но­сятся друг с дру­гом. Давайте нач­нём снизу — с хитов и затем про­ло­жим путь к поль­зо­ва­те­лям.

Хиты (Hits)

Хит — эле­мен­тар­ная еди­ница инфор­ма­ции для ана­ли­тики. С помо­щью них инстру­мент ана­ли­тики посы­лает инфор­ма­цию на сер­вер. В дей­стви­тель­но­сти хит — это запрос малень­кого файла с изоб­ра­же­нием. Этот запрос файла — то, каким спо­со­бом веб-сайт или при­ло­же­ние пере­даёт инфор­ма­цию на сер­вер.

how-analytics-works-hits-to-server

Суще­ствует много раз­но­вид­но­стей хитов в зави­си­мо­сти от инстру­мента ана­ли­тики.

Про­смотры страниц/экранов. Дан­ные о про­смотре стра­ниц (или экрана, если речь идёт о мобиль­ном при­ло­же­нии) обычно гене­ри­ру­ются авто­ма­ти­че­ски. Про­смотр стра­ницы — одна из фун­да­мен­таль­ных мет­рик в ана­ли­тике. Она исполь­зу­ется также для вычис­ле­ния мно­гих дру­гих мет­рик, напри­мер, «коли­че­ство про­смот­рен­ных стра­ниц за посе­ще­ние» или «сред­нее время, про­ве­дён­ное на стра­нице».

Собы­тия. Собы­тия — как счёт­чик. Они исполь­зу­ются, чтобы изме­рять, как часто поль­зо­ва­тель вза­и­мо­дей­ствует с неко­то­рой частью вашего кон­тента. В отли­чие от про­смотра стра­ниц, дан­ные о кото­рых гене­ри­ру­ются авто­ма­ти­че­ски, собы­тия надо настра­и­вать вруч­ную. Обычно вы отме­ча­ете как собы­тие какое-то дей­ствие поль­зо­ва­теля на сайте. Это может быть клик по кнопке, по ссылке, про­крутка экрана и др., то есть поль­зо­ва­тель вза­и­мо­дей­ствует с кон­тен­том, кото­рый нахо­дится на стра­нице или экране при­ло­же­ния.

Тран­зак­ция. Инфор­ма­ция о тран­зак­ции посы­ла­ется на сер­вер, когда поль­зо­ва­тель завер­шил тран­зак­цию элек­трон­ной ком­мер­ции. Вы должны вруч­ную настра­и­вать сбор дан­ных о тран­зак­циях в ecommerce. Вы можете посы­лать любые све­де­ния о тран­зак­циях, вклю­чая инфор­ма­цию о товаре (ID, цвет) и инфор­ма­цию о самой тран­зак­ции (доставка, налоги, спо­соб оплаты и т.д.)

Соци­аль­ный хит. Соци­аль­ный хит озна­чает, что поль­зо­ва­тель клик­нул по кнопке «твит­нуть», «+1» или «Like». Если хотите знать, кли­кали ли посе­ти­тели по этим кноп­кам, исполь­зуйте эту функ­цию, она также настра­и­ва­ется вруч­ную.

Настра­и­ва­е­мое время поль­зо­ва­теля. Время поль­зо­ва­теля — про­стой спо­соб изме­рить время между двумя вза­и­мо­дей­стви­ями поль­зо­ва­теля с сай­том. Напри­мер, вы можете изме­рить время от загрузки стра­ницы до клика по кнопке. Для этого нужно исполь­зо­вать допол­ни­тель­ный код.

Хиты любого типа посы­ла­ются в Google Analytics с помо­щью кода отсле­жи­ва­ния. То, какой код исполь­зу­ется, зави­сит от того, что вы ана­ли­зи­ру­ете. Если вы ана­ли­зи­ру­ете веб-сайт, то исполь­зу­ется javascript код analytics.js. Если вы ана­ли­зи­ру­ете мобиль­ное при­ло­же­ние (не важно, на iOS или на Android), то хиты гене­ри­рует SDK.

Все хиты по сути своей оди­на­ковы, вне зави­си­мо­сти от типа. Это запрос неви­ди­мого изоб­ра­же­ния, содер­жа­щий опре­де­лён­ный пара­метр (напри­мер, utm метки — прим. редак­тора)

Для особо любо­зна­тель­ных. Дан­ные о хите могут посы­латься через GET запрос или POST запрос. Это важно знать, потому что коли­че­ство инфор­ма­ции может быть раз­ным. Через GET запрос можно послать только 2048 сим­во­лов. POST запрос тех­ни­че­ски может быть любой длины (так на боль­шин­стве сер­ве­ров), но только около 8000 сим­во­лов посы­ла­ется в GA.

Инфор­ма­ция о хите транс­фор­ми­ру­ется в пара­метры. Каж­дый отчёт — это пара­метр с соот­вет­ству­ю­щими мет­ри­ками, их вы посто­янно про­смат­ри­ва­ете в своём акка­унте.

how-analytics-works-dimensions

Неболь­шая заметка о мобиль­ных

Код SDK для ана­ли­тики мобиль­ных при­ло­же­ний не посы­лает дан­ные в режиме реаль­ного вре­мени. Сна­чала он накап­ли­вает дан­ные, а потом отправ­ляет их разом. Это назы­ва­ется отправ­кой и дела­ется по двум при­чи­нам. Во-пер­вых, мобиль­ные устрой­ства не посто­янно нахо­дятся в сети, поэтому система ана­ли­тики накап­ли­вает и хра­нит дан­ные до тех пор, пока устрой­ство не полу­чит доступ к интер­нету. Во-вто­рых, отправка боль­шого коли­че­ства дан­ных за раз умень­шает рас­ход энер­гии. Можно не вол­но­ваться — это никак не вли­яет на под­счёт дан­ных

Сессия (Session)

Сес­сия — группа хитов, отно­ся­щихся к одному юзеру. По умол­ча­нию боль­шин­ство инстру­мен­тов ана­ли­тики, вклю­чая GA, груп­пи­руют хиты по при­знаку актив­но­сти. Когда инстру­мент ана­ли­тики опре­де­ляет, что посе­ти­тель больше не акти­вен, он счи­тает сес­сию закон­чен­ной и, когда поль­зо­ва­тель вновь про­яв­ляет актив­ность, начи­нает новую.

Боль­шин­ство инстру­мен­тов ана­ли­тики опре­де­ляют сес­сию как закон­чен­ную после 30 минут без­дей­ствия. Этот 30-минут­ный период назы­ва­ется тай­маут.

GA, как и боль­шин­ство дру­гих инстру­мен­тов ана­ли­тики, исполь­зуют время между пер­вым и послед­ним хитами, чтобы вычис­лить общее время, про­ве­дён­ное на сайте. Время между двумя хитами также исполь­зу­ется для вычис­ле­ния дру­гих мет­рик, напри­мер, время, про­ве­дён­ное на стра­нице.

Мно­гие инстру­менты ана­ли­тики поз­во­ляют вам сме­нить время тай­маута на более под­хо­дя­щее для вас. Напри­мер, вы можете захо­теть это сде­лать, если на вашем сайте много видео, осо­бенно если они длятся больше 30 минут.
Пред­ставьте, что поль­зо­ва­тель про­смат­ри­вает 60-минут­ное видео. Это зна­чит, что в тече­ние этого вре­мени хиты на посы­ла­ются на сер­вер. Зна­чит, его сес­сия будет закон­чена через 30 минут после пер­вого хита, хотя на самом деле поль­зо­ва­тель акти­вен (смот­рит видео). Чтобы пра­вильно засчи­тать сес­сию, вы можете изме­нить тай­маут.

Однако лучше про­длить сес­сию, послав допол­ни­тель­ный хит во время про­смотра видео. Чем больше хитов, тем больше дан­ных о вре­мени, про­ве­дён­ном поль­зо­ва­те­лем на сайте.

Теперь, когда мы знаем, что хиты груп­пи­ру­ются в сес­сии, давайте посмот­рим, как сес­сии объ­еди­ня­ются друг с дру­гом в соот­вет­ствии с поль­зо­ва­те­лями, к кото­рым они отно­сятся.

Пользователи (Users)

Здесь начи­на­ется самое инте­рес­ное. Поль­зо­ва­тель — это уга­дан­ный инстру­мен­том ана­ли­тики ано­ним. Поль­зо­ва­тели иден­ти­фи­ци­ру­ются с помо­щью при­сво­ен­ного им ано­ним­ного номера или строчки зна­ков. Обычно инстру­менты ана­ли­тики при­сва­и­вают ано­ним­ный номер-иден­ти­фи­ка­тор (ID) поль­зо­ва­телю при пер­вом его обна­ру­же­нии. Этот иден­ти­фи­ка­тор сохра­ня­ется до тех пор, пока не исте­чёт срок его хра­не­ния или его не уда­лят.

Иден­ти­фи­ка­тор посы­ла­ется в систему ана­ли­тики вме­сте c хитами. Бла­го­даря этому инстру­мент ана­ли­тики может ком­би­ни­ро­вать хиты и сес­сии, относя их к кон­крет­ному поль­зо­ва­телю.

Как же инстру­менты ана­ли­тики иден­ти­фи­ци­руют поль­зо­ва­те­лей?

Чтобы отли­чить посе­ти­теля сайта, боль­шин­ство инстру­мен­тов ана­ли­тики исполь­зуют cookie. Cookie — это малень­кий тек­сто­вый файл, содер­жа­щий ано­ним­ный иден­ти­фи­ка­тор. Вся­кий раз, когда хит посы­ла­ется из бра­у­зера на сер­вер ана­ли­тики, вме­сте с ним посы­ла­ется иден­ти­фи­ка­тор поль­зо­ва­теля, сохра­нён­ный в cookie.

how-analytics-works-cookie-with-ID

Давайте немного пого­во­рим о cookie

GA исполь­зует основ­ные cookie (first party cookie). Основ­ные cookie свя­заны с доме­ном, кото­рый их сге­не­ри­ро­вал. Они могут исполь­зо­ваться только тем доме­ном, кото­рый их создал.

Cookie системы Universal Analytics назы­ва­ются _ga и хра­нятся около двух лет. В преды­ду­щих вер­сиях Google Analytics cookie назы­ва­лись _utma.

Плюс основ­ных cookie в том, что почти все бра­у­зеры раз­ре­шают их исполь­зо­вать, отчего они явля­ются надёж­ной тех­но­ло­гией.

Основ­ные cookie трудны в исполь­зо­ва­нии, если ваш сайт раз­ме­щён на несколь­ких доме­нах. Когда поль­зо­ва­тель поки­дает ваш сайт и пере­хо­дит на дру­гой ваш сайт, соот­вет­ственно, он «теряет». В боль­шин­стве слу­чаев, если ана­ли­тика настро­ена некор­ректно, этому же поль­зо­ва­телю будут при­сва­и­ваться новые cookie.
Полу­ча­ется, что одному поль­зо­ва­телю при­сва­и­ва­ются двое раз­ных cookie. Из-за этого система ана­ли­тики может посчи­тать одного поль­зо­ва­теля два­жды. Полу­ча­ется, что мы не знаем точ­ное коли­че­ство поль­зо­ва­те­лей, и зна­чит, не можем пра­вильно выстро­ить ана­ли­тику.

Дру­гой тип cookie, сто­рон­ние cookie (cookie сто­рон­них сай­тов, third party cookie) могут быть исполь­зо­ваны доме­ном, отлич­ным от того, кото­рый их создал. Неко­то­рые инстру­менты ана­ли­тики поз­во­ляют исполь­зо­вать сто­рон­ние cookie.
Цен­ность сто­рон­них cookie заклю­ча­ется в том, что система ана­ли­тики иден­ти­фи­ци­рует поль­зо­ва­теля, несмотря на его пере­ме­ще­ние по раз­ным доме­нам. Однако боль­шин­ство бра­у­зе­ров не под­дер­жи­вают сто­рон­ние cookie, а зна­чит, не пере­да­дут инфор­ма­цию.

GA не исполь­зует сто­рон­ние cookie. Вы можете про­чи­тать об этом в доку­мен­та­ции для раз­ра­бот­чи­ков. Тогда как решить эту про­блему? Как пра­вильно иден­ти­фи­ци­ро­вать поль­зо­ва­теля, если ваш сайт рас­по­ло­жен на несколь­ких доме­нах? В GA мы исполь­зуем Меж­до­мен­ное отсле­жи­ва­ние (Cross Domain Tracking). Я не буду об этом рас­ска­зы­вать, вы можете про­чи­тать это в доумен­та­ции службы под­держки Google.

Пожа­луй, тут можно закон­чить. Это довольно пол­ный обзор того, как рабо­тает веб-ана­ли­тика.

Источ­ник

Поделитесь материалом с друзьями


[share-buttons]