Szubjektíven Lacyc3 szerint: Első féléves látogatói statisztika

Lacyc3.eu logo
Hogy rohan az idő, az újraindulásunk óta már több mint egy félév eltelt, ezért úgy gondoltam, hogy éppen itt az idő egy kis látogatói statisztika megosztására, no meg megosztok némi tapasztalatot arról, hogy a látszattal ellentétben, mégsem olyan egyszerű rendes és jól használható statisztikát gyűjteni.

Így mérünk mi

A legtöbb oldallal ellentétben, mi (már) nem alapozzuk a mérési megoldásunkat a Google Analytics alkalmazására. Az indok amilyen egyszerű, olyan összetett: szeretnénk segíteni a digitális magánéletetek védelmében. Bár csak egy csepp vagyunk a tengerben, de végül is micsoda a tenger? Sok kis cseppek összessége! :)

De mégis jogos igény, hogy tudjuk, miket olvastok, honnan jöttök és meddig maradtok nálunk. Ezzel nemcsak a tartalmaink jobb célzásához szükséges információkra teszünk szert, hanem olyan járulékos dolgokat is megtudunk, mint a használt operációs rendszer, vagy böngésző neve és verziószáma.

Az AdBlock, Ghostery, Disconnect és LightBeam másik oldalán

Mikor elkezdtük a saját méréseinket használni a Google Analytics mellett, érdekes jelenségre lettünk figyelmesek: bár nem jelentősen, de hibahatáron túlmenően különböztek egymástól és még csak nem is konstans távolságban, vagy módon. Hol az egyik, hol a másik mutatott többet, hol pedig csontra megegyeztek. A másik pedig, hogy olykor minket sem látott a statisztika. Bár alapértelmezett viselkedése az, hogy ha be vagyunk jelentkezve, minket ne mérjen, olykor-olykor előfordul, hogy olyan böngészőből látogatjuk meg az oldalt, amivel nem vagyunk bejelentkezve, azaz nekünk is szerepelnünk kellene a mérésekben. De nem voltunk benne.

Sikerült megállapítanunk, hogy az elsődleges „bűnös” az AdBlock, ami esetünkben nem a nem létező reklámokat szűri, hanem Piwik statisztikázó scriptet blokkolja mint követő script, és lényegében igaza is van. A következő bökkenő a Disconnect és hasonszőrű, követéseket tiltó böngésző kiegészítők működése. Ők nyilván ugyanúgy kiszúrják a Piwiket és persze tiltják is.

Mint mindenki, aki az online magánéletére egy kicsit is ügyelő felhasználó, mi is előszeretettel használjuk eme programokat, hiszen egyrészt egy-egy oldal betöltése nem tart a szükségesnél kétszer, háromszor tovább, másrészt nem profiloz olyan könnyen a különböző „közösségi” oldal, végül pedig némi sávszélességet is spórolunk így. Igen: mindenkinek melegen ajánljuk eme beépülők használatát, az internet nem tűnik majd olyan mocskos helynek, mint amilyen valójában.

Szóval fura helyzet állt elő, a kedvenc beépülőinknek hála, nem kapunk releváns statisztikát.

Elégséges megoldás

Ahhoz, hogy valóságot megközelítő mérési eredményeket kapjunk, olyan adatokra van szükségünk, melyeket kedvenc böngészőnk nem tud nem megadni. A legegyszerűbb és pont ezért a legkevésbé rugalmas a webszerver hozzáférési naplózása. Ez a szöveges állomány tartalmazza az összes meglátogatott oldalt, a böngésző nevét és verzióját, illetve jó esetben azt is, hogy honnan érkezett a látogató. Ugyanakkor a minden, az minden, tehát azt is tartalmazza, ha egy keresőrobot látogatta meg az oldalt vagy épp egy keleti barátainktól érkező robot próbált regisztrálni az oldalra.

A végleges megoldás az lett, hogy duplán mérünk, robot szűréssel. Ez azt jelenti, hogy az oldal továbbra is tartalmazza a Piwik mérő scriptjét. Ez a „biztos minimum”, azaz az itt olvasott adatok csak olyan böngészőtől jöhettek, melyek képesek az ECMascript végrehajtására és nem tartalmazzák a fentebb említett bővítmények egyikét sem.

A második mérési eredmény a hozzáférési naplóból keletkezik, robotszűréssel. A robotszűrés a Google, Bingbot, MJBot és a többiekre vonatkozik. Persze nem tökéletes megoldás ez sem, de elfogadható hibaaránnyal dolgozik. Így ha összevetjük a két mért eredményt, akkor az igazság valahol félúton lesz, mivel nem tudunk minden nem valós személy által tett látogatást kiszűrni. Üdvözletemet küldöm Közel- és Távol-Keletre!

Statisztika: 2015-01-01 – 2015-06-30

Ezalatt a fél év alatt, biztosan 3606 látogatónk volt, akik összesen 6365 oldalt tekintettek meg, ebből 5021 egyedi kattintás volt. A bizonytalan statisztika szerint, egy nagyságrenddel többen voltak akik „elbújtak” előlünk. 46143 látogatást regisztráltunk, melyből 4667306 oldalmegtekintés keletkezett, ebből 228241 egyedi. Mint említettem, ez már az ismert keresőrobotoktól megszabadított statisztika. Ha az igazság csupán fél úton jár ehhez képest, akkor is határozottan örülünk, hogy hasznosak lehetünk!

Az operációs rendszerek érdekes képet mutatnak. Míg a biztos találatok esetén Windows (XP) a domináns, a bizonytalanokat magasan vezeti a Linux. Itt mindenképp meg kell említenünk, hogy Charmeddel így vagy úgy, de mindenképp valamilyen Linux alól piszkálgatjuk az oldalt, más szóval részben hozzájárulunk a Linux népszerűségéhez. Persze ezt az előnyt ketten nem tudtuk volna összeszedni, így részben igazolódni látszik az a sejtésünk is, miszerint az alternatív operációs rendszer használók tudatosabban ügyelnek a digitális magánéletükre.

Biztos OS statisztikaBizonytalan OS statisztika

Böngészők között a TOP 10 nem csak meglepetést, de megelégedést is okozott: továbbra is vezet a Firefox, a „biztosak” esetében a nyomában liheg a Chrome, a bizonytalanoknál viszont magasan kiemelkedik a mezőnyből. Nagy meglepetés viszont az Internet Explorer harmadik helyezése a bizonytalanok versenyében, és negyedik helye a biztosak közt. Köztünk szólva, annyira mégsem nagy meglepetés: a legtöbb kétes eredetű látogatásunk fertőzött Windows XP és Internet Explorer [6-8] kombinációjáról talál be. Szívem szerint olyan, még robusztusabb SSL beállításokat alkalmaznék, melyekkel eme matuzsálemi korba lépett rendszer már nem tud mit kezdeni, de – mint azt fentebb láttad – a dolgok nem ilyen egyszerűek.

Biztos böngésző statisztikaBizonytalan böngésző statisztika