MAMA wacht über Webstandards
16.10.2008 von André BräklingOperas Metadata Analysis and Mining Application, kurz MAMA, ist ein Crawler, der Webseiten erfasst und analysiert. Jedoch liegt das Augenmerk hier weniger auf inhaltlichen Aspekten. Vielmehr untersucht MAMA die Struktur einer Webseite. So lassen sich Fragen beantworten wie “Wieviele Webseiten halten die W3C Standards ein?”, “Welche Technologien werden eingesetzt?” oder “Was sind die meistverwendeten HTML-Tags?”. Momentan ist es zwar noch nicht möglich, eigene Anfragen an das System zu senden (was aber anscheinend in den nächsten Monaten geplant ist), aber Opera hat erste Ergebnisse der Analysen veröffentlicht.
Erschreckend ist auf den ersten Blick, dass nur 4,13% der rund 3,5 Millionen untersuchten Webseiten den Ansprüchen des W3C Validators genügen, d.h. mehr als 95% aller Webseiten halten sich nicht an die vorgegebenen Standards. Die Begründung ist recht einfach: Zum einen wird die Zahl der nicht über die Standards informierten Webmaster riesig sein, zum anderen achten Webmaster zunächst darauf, dass möglichst viele Besucher mit verschiedenen Browsern die Seite so sehen, wie es der Webmaster wünscht. Denn im Kampf um größere Benutzerzahlen waren Browserentwicklern lange Zeit eigene Funktionen wichtiger als gültige Standards. Trotzdem ist die Zahl nicht so erschreckend, wie es den Anschein hat. Im Vergleich zu früheren Studien steigt die Zahl der standardkonformen Webseiten langsam, aber sicher (Saarsoo 2006: 2,58% und Parnas 2001: 0,71%). Übrigens fällt Braekling.de derzeit nicht unter die 4,13%, aber eine Bereinigung der Webseite steht ganz oben auf meiner ToDo-Liste.
Auch interessant: Deutschland, als Nr. 2 in der Liste der “Top-20-Countries” (407638 erfasste URLs, Platz 1: USA mit 1477436 URLs, Platz 3: Großbritannien mit lediglich 244554 URLs), weist mit exakt 25% die niedrigste Flash-Quote auf. Spitzenreiter sind hier (zumindest in der Top 20) die Chinesen mit stolzen 67,03%… anscheinend mag man es dort, wenn alles blinkt und quietscht.
In Sachen AJAX liegen die Norweger mit 10,18% klar vorne, gefolgt von unseren niederländischen Nachbarn mit 5,15%. Bei uns in Deutschland haben nur 2,24% die Vorteile asynchroner Datenübertragung erkannt.
Nun mag man sich die Frage stellen, wozu solche Statistiken gut sein sollen. Dies ist ganz leicht zu beantworten:
- Browserentwickler können die Nutzungsquote diverses Standards ablesen und ihre Weiterentwicklungen entsprechend priorisieren. Eben dafür erhebt Opera diese Daten.
- Webmaster können Trends erkennen und frühzeitig reagieren.
Aber Vorsicht – man muss die Zahlen über längere Zeiträume beobachten und Schlüsse aus der Entwicklung ziehen, also tatsächlich Trends beobachten. Würde man beispielsweise sagen “Okay, Flash 25%, AJAX 2,24% – ich setze auf Flash, denn das scheint die Technik der Zukunft zu sein.” kann dies ein Trugschluß sein. 2006 kam AJAX lediglich auf 1,90% (Saarsoo), der globale Durchschnittswert der MAMA-Untersuchungen liegt bereits bei 3,2%. Flash stieg in der gleichen Zeit von 10% (Saarsoo) auf 33.5%. Weiterer Vorteil für Flash. Aber was wäre jetzt, wenn aktuell der “Flasheinsatz” stagniert oder rückläufig ist, während AJAX rasant wächst? Dann müsste die Folgerung natürlich eine andere sein. Genau das sind Informationen, die man aus MAMA ziehen kann. Ich bin gespannt und freue mich schonmal auf den hoffentlich nicht mehr allzufernen öffentlichen Zugang. Bis dahin wird Opera immerhin noch einige weitere Ergebnisse der bisherigen Untersuchungen veröffentlichen.
Weitere Artikel zum Thema:
