Tag 8: Domain-Alter über archive.org hinzugefügt
Der Spider lief über das Wochenende sehr stabil. Knapp 30.000 Domains wurden inzwischen gefunden. Kleinere Anpassungen wurden vorgenommen. Auch der Pinger läuft stabil. Bis heute Nacht. Da haben beide Programme ein „Freez“ erfahren. Warum ist mir noch nicht klar. Ein Neustart der Applikationen hat das Problem erst einmal behoben. Aussitzen ist erst mal die Devise. Vielleicht tritt das Problem ja nicht mehr auf. Doch meistens ist dies nicht der Fall.
Heute wurde der Ping-App ein Zugriff auf archive.org hinzugefügt. Da der Tante bekanntermaßen „alte“ Domains wichtig sind, kann das Datum aus Archive.org wichtig sein. Denn es gibt nirgendwo eine Möglichkeit, das genau „Domainalter“ zu ermitteln. Das Vorhandensein einer Seite bei archive.org ist immerhin ein „Näherungswert“. Diesen Wert prüft der Pinger nun und fügt, sofern vorhanden, der nicht erreichbaren Domain hinzu.
Kleiner Ausflug in die Vorgehensweise von archive.org: Dieser Dienst existiert im Internet schon lange. Es handelt sich bei der „Wayback Machine“ selbst um einen Spider, der Seiten im Internet besucht und den Inhalt der Seiten speichert. Nach deutschem Recht vielleicht gar nicht so legal. Wie auch immer. Findet der Spider beim nächsten Besuch eine geänderte Seite vor, speichert er die Seite erneut. Der Vorteil von archive.org ist, dass alle Stände im Nachhinein ersichtlich sind. So kann sich beispielsweise prüfen lassen, welchen Content eine Seite im Februar 2000 hatte. Wer sich mit der Seite beschäftigt wird feststellen, dass nicht jede Domain und auch nicht jeder Stand dort vorhanden ist. Wann die Seite und nach welchen Kriterien die Inhalte speichert, das ist das Geheimnis dieses Spiders. Der gemeine SEO geht einfach davon aus, dass wenn eine Seite dort gespeichert wurde, also die Seite für das Archiv interessant war oder ist, dann gilt dies auch für die Tante. Nach diesem Gedanken ist eine Domain, die dort seit Jahren auftaucht, also durchaus interessanter, als eine ohne diese Verewigung.
Heute Abend werde ich mich weiter mit den Alexa-Daten beschäftigen. Darüber hoffentlich morgen mehr. Hier zeigt sich auf jeden Fall, dass das setzen auf C# durchaus nicht falsch war. Denn wieder einmal sind Codebeispiele in PHP und C# erhältlich. Nicht, dass man das nicht auf VB6 hätte umschreiben können, doch es erspart enorm viel Zeit, wenn der Zugriff bereits als Code vorliegt.
Tag 9: Alexa Ranking – oder mein Tag mit Alexa
Erst einmal einiges Vorweg zur Alexa: Bei alexa.com handelt es sich um ein Portal, das einige Informationen über eine Domain zur Verfügung stellt. Unter anderem gibt es den „Alexa-Rank“, einen Wert, der Domains miteinander wertet. Je kleiner der Wert, umso besser. Hat eine Domain keinen Wert, ist dies eher schlecht. Wirklich? Nun, Alexa versucht den Traffic einer Webseite zu ermitteln. Und dies hauptsächlich über die eigene Toolbar. Heisst also, ein User muss die Toolbar installiert haben, damit Alexa den Zugriff auf eine Seite messen kann. Ein Zugriff von einem Rechner ohne die Toolbar fließt dann nicht in das Ranking ein. Diese bedeutet, dass das Alexa-Ranking mit Vorsicht zu genießen ist. Ein hohes Ranking kann positiv sein. Wird eine Domain mit hohem Alexa-Ranking beispielsweise verkauft, würde ich mich nie alleine auf diesen Wert stützen. Denn das Ranking ist relativ leicht zu manipulieren. Doch in die Gesamtbewertung einer Domain kann das Ranking durchaus einfließen.