AWStats
von Laurent Destailleur
AKA
eldy ist ein Open Source
Projekt zur Auswertung von Webserver-Logfiles. Ich selbst nutze dieses Programm
seit geraumer Zeit, um einen Überblick über die Zugriffe auf
verschiedene von mir betreute Webauftritte zu erhalten.
Ein großer
Vorteil von AWStats ist, dass dieses Paket Open Source ist - so können
jederzeit Modifikationen an der Software nach eigenen Bedürfnissen
vorgenommen werden. Außerdem ist AWStats kostenlos erhältlich.
Da ich, unter anderem im Suchmaschinen-Infos-Forum, AWStats immer wieder empfehle, wurde ich schon häufiger nach einer Installationsanleitung für dieses Programm gefragt. Denn die Installation von AWStats ist nicht ganz trivial. Oft möchten Webmaster die Logfiles ihrer Webpräsenz am heimischen Windows-Rechner auswerten, aus diesem Grund ist diese Installationsanleitung genau auf diesen Anwendungsfall zugeschnitten. Eine Anleitung zur Installation von AWStats auf dem Webserver des Providers gibt es z. B. hier.
Diese Installationsanleitung geht davon aus, dass ein Apache-Logfile ausgewertet werden soll. AWStats kann auch Logfiles anderer Webserver auswerten, dies muss jedoch explizit konfiguriert werden und wird in dieser Installationsanleitung nicht behandelt.
Zunächst jedoch ein paar Worte zur Philosophie
von AWStats.
Während andere Logfile-Analyzer wie z. B.
Webalizer bei der Analyse der Logfiles
direkt statische HTML-Dateien und Grafiken mit der Auswertung erstellen,
generiert AWStats zunächst eine Textdatei, die alle für die Statistik
notwendigen Informationen enthält. Erst zum Zeitpunkt, zu dem die
Statistik abgerufen wird, erzeugt AWStats aus diesen Daten eine Webseite, die
die Statistiken in einer übersichtlichen Form darstellt.
Aus diesem
Grund ist es notwendig, einen Webserver auf dem heimischen Rechner zu
installieren, sofern man AWStats zur Logfileauswertung einsetzen will. AWStats
ist zwar auch in der Lage, statische Webseiten mit den Statistiken zu
erstellen, jedoch ist diese Vorgehensweise wenig flexibel und umständlich,
so dass ich darauf nicht näher eingehen möchte.
Um Logfiles mit AWStats auswerten zu können, sind einige Voraussetzungen nötig:
Nachdem alle notwendigen Pakete (Webserver und Perl) heruntergeladen und
installiert sind, können wir uns daran machen, AWStats zu installieren.
Dazu wird erst mal das AWStats-Archiv in ein temporäres Verzeichnis
entpackt, inklusive Unterverzeichnissen!
Nun werfen wir einen Blick in die
Konfigurationsdatei von Apache. Diese heißt httpd.conf und liegt
normalerweise in einem Unterverzeichnis der Apache-Installation. Folgende
Einträge sind von Bedeutung:
#!C:\Perl\bin\perl.exe
Im Prinzip ist jetzt alles installiert
und konfiguriert, wir brauchen jetzt noch das Logfile sowie eine Batchdatei,
die das Logfile auswertet. Diese Batchdatei legen wir am besten im
cgi-bin Verzeichnis an und nennen sie updatestats.cmd. In diese
Datei schreiben wir eine Zeile, die folgendermaßen aussieht:
perl awstats.pl -config=www.example.com -update
Anstatt
www.example.com kommt natürlich der Domainname der auszuwertenden
Domain rein.
Um die Statistik zu aktualisieren, wird jetzt einfach die Datei
updatestats.cmd aufgerufen, entweder über den Explorer oder eine
Verknüpfung, die jeder nach seinen eigenen Wünschen anlegen kann.
AWStats braucht das
Logfile in einem Stück, die meisten Provider stellen die Log-Dateien
jedoch einzeln zur Verfügung; entweder täglich, wöchentlich oder
monatlich.
Zunächst müssen natürlich alle auszuwertenden
Log-Dateien vom Server des Providers heruntergeladen werden. Meistens liegen
diese mit gzip komprimiert vor, das ist an der Dateiendung .gz zu
erkennen.
Um nun alle einzelnen Log-Dateien in ein einziges Logfile
hineinzukopieren, benutzen wir gunzip aus dem vorher genannten Paket
GNU utilities for Win32. Wir legen dazu eine weitere Batchdatei an, die
im selben Verzeichnis wie die Logfiles liegt. Die Batchdatei könnte z. B
make_logfile.cmd heissen. Wir schreiben die Befehlszeile gunzip -c
access.log.*.gz >access.log hinein, für den Fall, dass die Logfiles
von 1&1 stammen. Für andere Provider muss natürlich der Dateiname
für die Log-Dateien angepasst werden. Für all-incl.com wäre dies
z. B. gunzip -c access_log_*.gz >access.log
Wichtig:
Diese Art des Zusammenkopierens funktioniert nur, wenn das Dateisystem des
verwendeten Betriebssystems die Dateien alphabetisch sortiert, denn die
einzelnen Log-Dateien müssen in der richtigen Reihenfolge
zusammengefügt werden. Gewährleistet ist dies mit NTFS unter Windows
NT 4, 2000 oder XP.
Ansonsten liegt dem AWStats-Paket das Tool
logresolvemerge.pl bei, das auch unsortierte Logfiles in der richtigen
Reihenfolge zusammenkopieren kann.
Falls der Provider 1&1 ist, ist ein
weiterer Schritt nötig. AWStats geht von einem combined logfile
aus, 1&1 jedoch benutzt ein Format, das ein Feld mehr enthält. Dies liegt
daran, dass dieses Feld den Domainnamen enthält, da 1&1 nur ein Logfile
erzeugt, auch wenn man dort mehr als eine Domain registriert hat. Sowohl bei
1&1 im Downloadbereich als auch hier gibt es einen
Logfile-Splitter, der ein 1&1-Logfile in mehrere combined
logfiles aufteilt; für jede Domain eines. Dieser Schritt ist auch
notwendig, wenn man bei 1&1 nur eine Domain registriert hat.
Eigentlich ist jetzt alles fertig. Der
Webserver und Perl sind installiert, AWStats ist installiert und konfiguriert,
das Logfile ist erzeugt. Nun kann die Batchdatei updatestats.cmd
gestartet werden, diese erzeugt die Auswertung. Dies kann je nach
Geschwindigkeit des Rechners bzw. Größe des Logfiles ziemlich lange
dauern, deshalb nicht die Geduld verlieren!
Nachdem AWStats die Auswertung
erstellt hat, kann diese im Webbrowser abgerufen werden. Dies erfolgt mit der
Eingabe folgender URL:
http://127.0.0.1/cgi-bin/awstats.pl?config=www.example.com
Statt example.com muss natürlich der Domainname der auszuwertenden
Site eingegeben werden.
Dann stehen in den Foren von Suchmaschinen-Infos oder ABAKUS Internet Marketing Experten bereit, die gerne bei der Lösung des Problems behilflich sind.