Modernes Tracking

aus www.iwiki.de, der freien Wissensdatenbank

Tracking (von engl. to track - verfolgen) im Bezug auf das Web, ist das Verfolgen von Bewegungen der Internet-Nutzer auf der Webseite. Wichtige Fragestellungen dabei sind z.B.: Welche Seiten einer Domain werden besucht, wann und woher kam ein Besucher auf die Website oder wie erfolgreich waren bestimmte Werbekampagnen. ¹

Keiner ist heute im Netz mehr sicher vor den Tracking Systemen, die z.B. mit Flash-Cookies arbeiten, außer vielleicht Juschi :)

Inhaltsverzeichnis

Logging als Vorstufe zum Tracking

Mit Awstats die Aufenthaltsdauer der Webuser messen
vergrößern
Mit Awstats die Aufenthaltsdauer der Webuser messen

Das Thema "Logging" (oder auch "internetbasierte Beobachtung" genannt), also im Allgemeinen das Protokollieren von Zugriffen auf Webinhalte, ist im Web bereits sehr verbreitet. Die so gesammelten Daten lassen sich im Rahmen des Data Minings für vielfällige Analysen nutzen; so lassen sich beispielsweise interessante Rückschlüsse auf Navigationswege über die Seite, bevorzugte Artikelgruppen oder die Verweildauer auf einzelnen Seiten ziehen, um nur einige wenige Anwendungsmöglichkeiten zu nennen.²

Für die meisten Webseiten im Web reicht eine Logfile-Analyse um die Zugriffszahlen zu protokollieren völlig aus. Erfolgreiche Webseiten auf dem Portal können identifiziert werden, um die Navigation anzupassen. Die technischen Eigenschaften der Benutzerrechner können analysiert werden.

Software für die Logfile-Analyse gibts meist Open Source, z.B. Webalizer oder AWStats.

Bei der Logfile-Analyse gibt es allerdings mehrere Probleme. Logfiles enthalten keine verlässliche Information über den zugreifenden Benutzer, sondern nur über dessen IP-Adresse, die in vielen Fällen dynamisch vergeben wird. Außerdem werden IP-Adressen in Firmennetzwerken oft durch die Firewall vergeben, somit erhält jeder Mitarbeiter die gleiche IP Adresse. Eine eindeutige Benutzeridentifikation ist, mit einigen Einschränkungen, nur durch eine Registrierung mit Benutzernamen und Passwort möglich. Das Navigationsverhalten von Benutzern ist ebenso aus den Protokolldateien nur eingeschränkt ableitbar. Zahlreiche Zugriffe des Benutzers werden nicht protokolliert, da sie aus einem zwischengelagerten Cache (beispielsweise bei Verwendung eines Proxy-Servers) beantwortet werden können. Die Navigation eines Benutzers ist bei Zugriff über ein Lesezeichen oder die direkte Eingabe einer URL aus der Protokolldatei nicht nachvollziehbar, es werden unzusammenhängende Sprünge zwischen einzelnen Web Seiten ausgewiesen. ⁴

Eine Studie hat ergeben, dass bei einer Logfile Analyse beispielsweise die gemessene Anzahl der Besuche einer Webseite um mehr als 30 Prozent vom tatsächlichen Wert abweicht. ⁶

Modernes Tracking kann mehr

Betreiber komplexer Websites und Online-Plattformen möchten nicht nur wissen, wann wie viele Besucher kommen, sie wünschen sich auch detaillierte Fakten über das Nutzungsverhalten. Welche Nutzergruppen ergeben sich? Welche Inhalte werden frequentiert? Wonach suchen Nutzer und welche Wege gehen sie auf der Website? Die genannten Fragen können gewöhnliche statistische Erhebungen nicht mehr beantworten. Es muss also eine gezielte Auswertung der Nutzer und des Nutzungsverhaltens geschaffen werden.

Bei Webshops sind Funktionen wie Warenkorb oder Merkliste ohne den Einsatz von Sessions oder Cookies technisch ohne Qualitätsverluste nicht möglich. Somit setzen seriöse Webshop-Betreiber bereits Techniken ein, die für ein modernes Tracking notwendig sind. Einem Benutzer können somit beispielsweise anhand des aktuell gewählten Artikels Verknüpfungen auf weitere verwandte oder ähnliche Artikel angezeigt werden. Dies geschieht oft auf der Datenbasis anderer Nutzer.

Ein konkretes Beispiel: Wenn Benutzer Arthur eine Bestellung mit einem HiFi - Verstärker Marke "Pioneer A 109" und dazu die Lautsprecher der Marke "JBL Balboa 10" getätigt hat, und Benutzer Dark sich nun die Lautsprecher "JBL Balboa 10" anzeigen lässt, bekommt er automatisch den HiFi - Verstärker "Pioneer A 109" als mögliches Zubehörteil angezeigt. Dieses Verfahren nennt man Recommendation, Amazon setzt beispielsweise Recommendations ein, um auf Basis vom Kundenverhalten anderen Besuchern einen Mehrwert zu bieten:

Amazon setzt Recommendations ein, auf Basis vom Kundenverhalten um anderen einen Mehrwert zu bieten

Durch die Recommendations (zu deutsch: Emfehlungen) kann bei den Shopbetreibern der Nettoumsatz nachweislich gesteigert werden, bei einigen sogar bis zu 10%. Es können Kundengruppen bestimmt werden und ihre Aktivquoten, um speziell auf sie zugeschnittene Marketingmaßnahmen durchzuführen. Die Laufwege der Kunden können durch Anpassung des Contents optimiert werden (mit 3 Klicks zum Kauf). Es können Konversionsraten für einzelne Bestellschritte ermittelt werden, um evtl. die Usability oder Klickpfade auf einzelnen Seiten zu optimieren.

Die Marketingmaßnahmen werden ergebnisorientiert gesteuert, je nach Conversionsrate bei bestimmten Produkten. Mehr zu den Kennzahlen wie Conversionsrate, siehe Kennzahlen.

Speziell für das Marketing ist es wichtig, dass nicht nur das Benutzerverhalten auf der Webseite getrackt wird, sondern auch Werbemittel wie Emails, alle Formen von Banner, AdWords Anzeigen (mit Position), PDF-Dokumente, Videos (mit Flash Cookies) und andere.

Voraussetzungen

Wie oben kurz erwähnt, müssen für solche Rückschlüsse auch die technischen Voraussetzungen bei den Web-Analytics Systemen gegeben sein.

Sessions

Mit Sessions (zu deutsch: Sitzungen) lassen sich schon viele der oben beschriebenen Anforderungen erfüllen. Anhand einer Session-ID können leicht die Anfragen eines Benutzers während einer Sitzung als zusammenhängend erkannt werden, anhand einer Benutzer-ID kann ein Benutzer (genauer gesagt, dessen Web-Browser) wieder erkannt werden, ohne dass sich der Benutzer bei der Website registriert hat. Die Verwendung der Sitzungs-ID geschieht oft in Kombination mit Cookies. Das ist sicherer als die Sitzungs-ID in der URL mitzuschleifen. Durch Ausspähen könnte ein anderer Kenntnis über die Sitzungs-ID erlangen und hätte somit Zugang zu allen in der Session hinterlegten Daten (Z.B. Benutzername und Passwort). Dieses Verfahren wird Session Hijacking genannt.

Cookies

Die kleinen Textdateien Cookies werden ursprünglich vom Webserver vergeben und vom Web-Browser auf der Festplatte des Benutzerrechners gespeichert. Bei späteren Anfragen werden die Cookies automatisch vom Browser wiederum an den Server übertragen, der diese dann auswerten (und gegebenenfalls protokollieren) kann. Cookies werden von ca. 90% aller Benutzer akzeptiert. Hier ein Beispiel von einem Google Analytics Cookie:

Ein Cookie der erzeugt wird, falls man eine Seite, mit Google Analytics im Einsatz, besucht

PageTags

Die sog. PageTag Methode wird oft in Konbination mit Cookies verwendet. In die Webseiten wird dabei beispielsweise JavaScipt Code des Web-Analytics Systems implementiert, welcher bei Aufruf der Seite ausgeführt wird. Der JavaScript Code greift auf die Information, z.B. technische Ausstattung, des Clients zu und protokolliert diese. Außerdem generiert dieser einen Cookie auf dem Client-Rechner, damit er bei einem wiederholten Seitenaufruf "wiedererkannt" wird. So sieht ein PageTag JavaScript Code aus, welcher in das HTML Dokument implementiert wird, um das Besucherverhalten auf der Webseite zu tracken:

Google Analytics Tracking Code

Zählpixel

Eine kleine Bilddatei wird in den HTML Code einer Seite integriert, welche auf eine externe Quelle zugreift. Auf einem fremden Server wird dann, ähnlich wie oben, ein Script ausgeführt, welches Information über den Client sammelt und die Bilddatei zurückgibt. Diese ist meist sehr klein (1x1 Pixel) und für einen Besucher nicht zu erkennen.

Fingerprint

Diese Methode zur Identifikation von Benutzern über die Rechnerspezifikation (Browser-Konfiguration, Betriebssystem Version, Grafik Auflösung, IP Adresse,...) ist sehr ungenau. Deshalb wird sie von Tracking Systemen nicht verwendet. Vielmehr setzen manche Affiliate Netzwerke dieses Verfahren zur Partner Vergütung ein.

Flash-Cookie

Alle Cookie-Löscher oder private Daten löschen - Funktion im Browser versagen beim Einsatz sogenannter Flash-Cookies. Diese sind als Script in Flash-Anwendungen wie auch in Videos auf YouTube versteckt und werden nicht in Temporären Files gespeichert, sondern in einem versteckten Macromedia Ordner. Somit stellen die Flash-Cookies die sicherste Methode dar, das Besucherverhalten auf Webseiten zu tracken.


Anbieter

Im folgenden werden professionelle Anbieter von modernen Tracking Methoden vorgestellt. Sie alle tracken das Besucherverhalten nicht durch Log Files (wg. den oben genannten Nachteilen), sondern durch eine Kombination aus PageTags, Cookies und Sessions.

TraceWorks

StatLynx (oder HeadLight) ist eine Tracking Software von TraceWorks. Kunde von TraceWorks ist u.a. Intershop, ein Webshopanbieter, welcher Shops von Otto, Tchibo, Quelle, T-Com und andere realisiert hat. StatLynx misst speziell die Wirkung der Marketinginvestitionen. Für jede Marketingkampagne werden die für die Auswirkungen der Marketingaktivitäten entscheidenden Zahlen - Key Performance Indicators (KPI) - wie Besucherzahlen, Umrechnungskurse, Kosten und Verkaufszahlen berechnet und analysiert. Auf der Grundlage dieser Informationen können die Kampagnen optimiert werden, um den Gewinn zu steigern.

Mehr Information unter Traceworks

Omniture

Laut eigenen Angaben ist Omniture der Branchenführer im Bereich Online-Analyse, dieses Tracking System wird z.B. von Ebay, Microsoft und Oracle eingesetzt. Besonders gut ist Omniture durch ihre Besuchersegmentierung und Pfaderkennung, um das Verhalten der einzelnen Segmente besser zu verstehen. Weitere Funktionen von Omniture sind

  • Erfolgsmessung für eCommerce
  • Echtzeitanalyse und Data Warehousing
  • Customizing für individuelle Bedürfnisse
  • Umfangreiches Berechtigungskonzept für Berichte
  • Externe Datenintegration

Omniture ist zuletzt durch einige Übernahmen in die Schlagzeilen gekommen. So kaufte Omniture die Tracking Anbieter wie Visual Sciences (auch unter WebSideStory bekannt) und Instadia. Instadia ist v.a. dafür bekannt, dass Sie für Webseiten multivariate Tests (und A/B Tests) von Landing Pages anbieten.

So sieht die Benutzeroberfläche von Omniture aus:

Omniture Benutzeroberfläche

Doubleklick und RevenueScience

Doubleclick bietet seit 2002 ihr Tracking System als Produkt nicht mehr an. Trotzdem werden bei Doubleclick weiterhin moderne Tracking Technologien verwendet. Das Surfverhalten wird Webseiten übergreifend über Partnerseiten wie z.B. Amazon, Ford, Nasdaq gesammelt und zur Realisierung von sog. Behavioral Targeting Diensten eingesetzt. Das gleiche Verfahren wird von RevenueScience eingesetzt. Mehr zu Behavioral Targeting...

eTracker

Die Navigation von eTracker ist übersichtlich und lässt sogar Marketing Ziele definieren
vergrößern
Die Navigation von eTracker ist übersichtlich und lässt sogar Marketing Ziele definieren

Die Web-Controlling Lösung von eTracker ist sehr umfangreich. Nicht nur eine Analyse von Kennzahlen ist möglich, es ist vielmehr eine Methode zur Erfolgskontrolle und -steuerung von Web-Auftritten durch die systematische Sammlung und Auswertung von Kunden- und Nutzungsdaten. Mit eTracker lassen sich z.B.

  • Online Werbemittel wie Banner hinsichtlich der erzielten Umsätze bewerten
  • über den Referrer die Suchworte extrahieren und deren Erfolg hinsichtlich bestellter Ware analysieren
  • Herkunft des Besuchers bis auf Städteebene genau bestimmen
  • Ermittlung der Klickpfade der Besucher
  • Interessensschwerpunkte des Besuchers analysieren
  • bei Webshops die Abbruchquoten und Konversionsraten zwischen den einzelnen Bestellschritten

Die Nachteile von eTracker sind die Kosten und Performance. Je nach Version muss man mit einigen hundert EUR im Monat für die Software rechnen. Außerdem leidet die Antwortzeit einer Webseite darunter. Das ist wichtig, denn nicht einmal die Hälfte der Internetnutzer hat einen Breitbandanschluss.⁸ Anhand von Web Page Analyzer wurde ein Performance Test durchgeführt. Danach wurden bei Einsatz von eTracker 6 kB mehr Code pro Seitenaufruf übertragen. Die Ladezeit verlängert sich somit bei einem Seitenaufruf über eine 128k ISDN Leitung um mehr als eine halbe Sekunde. Allerdings muss man bei zunehmenden Softwareeinsatz immer mit Performance Problemen rechnen. Zu erwähnen ist auch, dass der Tracking Code meist am Ende einer Seite geladen wird, sodass der Besucher den Seiteninhalt bereits sieht, bevor der Tracking Code geladen wurde.

Google Analytics

Mit Google Analytics lässt sich der Standort der Besucher erkennen.
vergrößern
Mit Google Analytics lässt sich der Standort der Besucher erkennen.

Ähnlich wie eTracker bietet Google Analytics sehr umfassende Funktionen. Neben Herkunft der Besucher, ihre Verweildauer auf einzelnen Seiten, und Suchbegriffe in Suchmaschinen erlaubt Google Analytics eine Integration in die Benutzerobefläche von Google AdWords. Somit ist eine bessere Erfolgskontrolle von AdWords Kampagnen möglich. Eine Besonderheit ist das Website-Overlay. Hier lässt sich für Links auf jeder Seite die Zugriffszahlen und Conversion einsehen. Die lukrativsten Märkte lassen sich mit Analytics grafisch darstellen:

Schön ist natürlich, dass Google Analytcs kostenlos angeboten wird. Das ist aber mit vielen Nachteilen verbunden: Laut Google müssen die Besucher der Webseiten, die Google Analytics einsetzen darauf aufmerksam gemacht werden, dass Ihre Daten (wie IP Adresse) an andere weitergegeben werden und evtl. verwendet werden könnten. Die deutsche Rechtssprechung geht noch weiter. Demnach muss ein Hinweis direkt auf der Startseite erfolgen, dem der Besucher zustimmen muss. ⁹ Laut einer Xamit Studie weisen aber nur 1% der Webseitenbetreiber Ihre User auf den Einsatz von Google Analytics hin. Weiterhin ist auch unklar, in wieweit Google die Daten aus Analytics für die Platzierung der Webseite in den Suchergebnissen verwendet.

Nachteilig ist besonders bei Analytics die Ladezeit. Nach einem Performance Test durch Web Page Analyzer wurden bei Einsatz von Google Analytics 21 kB mehr Code pro Seitenaufruf übertragen. Die Ladezeit verlängert sich somit bei einem Seitenaufruf über eine 128k ISDN Leitung um mehr als eineinhalb Sekunden.

Aktuelles zu Analytics von Google Mitarbeitern.

User Centered Design geht noch weiter

Anhand von modernen Tracking Methoden kann das Nutzerverhalten gesammelt und analysiert werden. Es werden Problemfelder definiert, z.B. schlechte Responsequoten. Um User Centered Design realisieren zu können, müssen nach einer Usachenanalyse, Lösungsvarianten erzeugt werden (Inhalt und Grafik). Danach werden multivariate Tests durchgeführt (auch A/B Test genannt). Hier lässt man Content gegeneinander laufen. Der User entscheidet, was ihm einen höheren Mehrwert bietet. Die bessere Variante wird realisiert und bleibt somit bestehen. ⁵ Der Vorteil von User Centered Design für den Webseiten Betreiber ist eine höhere Besucherzufriedenheit und eine höhere Umsatzgenerierung.

Technologien und Ihre Probleme

Moderne Technologien wie AJAX, RSS, Flash usw. machen es für alle Tracking Systeme nicht gerade leicht oder sogar unmöglich das Besucherverhalten zu erfassen, dadurch dass z.B. wie bei AJAX nur Teile der Webseite nachgeladen werden und der Tracking Code nicht mit aktualisiert wird.

Rechtliche Aspekte

Das Speichern von Daten über Besucher, Kunden etc. ist mit Vorsicht zu genießen. Es gibt Bestimmungen über das Verhältnis von Speicherung der Daten und Zweck der Benutzung derselben. Bei Systemen mit echten Kundendaten sollte sichergestellt werden, dass die Daten nicht in falsche Hände geraten und sich nicht zur Identifizierung einzelner Personen heranziehen lassen. Das TDDSG (Teledienstdatenschtzgesetz) - insbesondere §§ 5 und 6 sagt z.B. aus, dass Log-Daten niemals direkt mit dem Namen verbunden werden dürfen, also immer anonym gespeichert werden müssen. ³

Statistische Erhebungen

Laut einer Xamit Studie nutzen nur acht Prozent aller Webseiten moderne Tracking Systeme. Die anderen geben sich mit Logging zufrieden oder analysieren nicht das Webnutzerverhalten. Dabei ist die Werbebranche verständlicher Weise Vorreiter bei der Nutzung von modernen Web Analyse Tools. Erschreckend ist, dass von diesen acht Prozent fast alle (99 Prozent) beim Datenschutz versagen. Sie speichern personenbezogene Daten oder solche die dem Datenschutz unterliegen, wie z.B. IP Adresse, ohne den Besucher darauf aufmerksam zu machen. 87,5 Prozent der Webseiten, die moderne Tracking Systeme verwenden, nutzen hierfür Google Analytics.

Affiliate Netzwerke

Tracking Systeme geben vor, ziemlich genau zu sein. Das kann bei der Analyse oft zu falschen Aussagen verleiten, denn viele Dinge können entweder garnicht oder nicht genau gemessen werden. Bestes Beispiel sind die CPO oder CPL Vergütungsmodelle bei Affiliate Partnerschaften. Geht man solch eine Partnerschaft ein, wird man nur an den Einnahmen beteiligt, wenn der durch das Tracking System des Partners identifizierte User beispielsweise innerhalb der Lebenszeit eines Cookies auf dem Shop eingekauft hat. Im umgekehrten Fall heißt das: Wollte sich der User nur informieren und kauft zu einem anderen Zeitpunkt ein, an einem anderen Rechner, oder über einen anderen Browser wird man als "Vermittlungspartner" an den Einnahmen nicht beteiligt.

Zukünftige Trends

Die Tracking Systeme müssen zunehmend mit Technologien wie AJAX oder Flash fertig werden. Hierfür sind besondere Tracking Methoden notwendig, da bsp. bei AJAX nur Teile der Webseite nachgeladen werden. In JavaScript Ereignissen muss eine Funktion implementiert werden, welche dem Tracking System mitteilt, dass Code Fragmente nachgeladen wurden.

Um die Usability der Webseite zu testen, werden im Labor Augenbewegungen gemessen. Daraus lässt sich ableiten, welche Inhalte gut aufgebaut und platziert sind und welche nicht. Produkte gibt es bereits auf dem Markt: eye square.

Diese Methode wird bereits seit längerem für echte Shops eingesetzt, um z.B. die Wirkungen der Werbeformen auf den Konsumenten zu analysieren.

Seit längerem werden auch Systeme zur Aufzeichnung von Mausbewegungen auf der Webseite angeboten. Dies wird als Mouse Tracking bezeichnet. Ein Vorreiter auf diesem Gebiet ist die Firma seto GmbH, mit Ihrem Produkt m-pathy. Auch dieses System eignet sich heute noch (Anfang 2008) eher für Usability Analysen. Das Hauptproblem bei mouse tracking ist, dass eine große Menge an Daten anfällt, welche ausgewertet werden müssen. Seit Frühjahr 2008 werden von seto auch aggregierte Daten in Form von Heatmaps (Clickmaps und Movementmaps) angeboten. Zudem können in Formularstreckenanalyse verschiedene Kennzahlen ausgegeben werden:

  • Abbrüche auf Formularseite
  • Abbrüche im Formularfeld
  • Interaktionszeit pro Formularfeld
  • Zeit bis zur Interaktion mit Formularfeld
  • Editier-Rate pro Formularfeld

Fußnoten

¹ Success Design Fachbegriffe, siehe Quellen

² Reimers 2006, S. 460

³ Reimers 2006, S. 462

⁴ Hansen 2005, S. 715

⁵ Vortrag Herr Lauber von BAUR Versand am 13.06.2007 an der FH Würzburg

⁶ Studie von Carsten Pohle von der Humboldt Universität in Berlin

⁷ Anwenderhandbuch eTracker Web-Controlling, April 2007

⁸ Fischer 2007, WebUsability S. 10

http://www.website-boosting.de/blog/2006-08-17/google_analytics_fur_jedermann_aber_obacht.html

Quellen