Seit einigen Tagen arbeite ich wie vorgestern schon beschrieben an einer kleinen Fallstudie zu den ca. fünfzig Beispielen an Web-Diensten, die ich unter Hut des Kategorie “automatisches Ranking-System” bringen möchte. Mein Ansatz ist ziemlich aufwendig. Ich möchte über offizielle Webseiten, offizielle Quellen oder auch wissenschaftliche Beiträge rausfinden:
a) welche Grundgesamtheit von Elementen von einem Dienste gerankt wird
b) welche Daten als Signale fürs Ranking beigezogen werden
c) welche Requests an das Ranking-System gestellt werden
d) Welche Algorithmen und Data-Mining Techniken das Ranking-System anwendet
e) Wie die Technologie vom Anbieter oder auch von dritten Quellen offiziell genannt wird
f) Wie der Output (das Ranking) des Dienstes aussieht
Diese Fallstudien ziehen sich zünftig in die Länge. Nicht nur weil viele der Informationen nicht öffentlich zugänglich sind. Manchmal schaffe ich in zwei Stunden nur gerade drei oder vier Dienste. Daneben ist diese Arbeit aber sehr fruchtbar, da sie mich auf Kategorisierungen, Vokabular und Abläufe bringt, die mir vorher höchstens implizit bekannt waren. Ich denke, ich bin nun schon bald bereit, ein zusammenhängendes, konsistentes Argument zu führen, das es mir ermöglicht, diese unterschiedlichen Dienste zu einer Kategorie zusammenzufassen. Ein Ziel, das ich am liebsten noch diese Woche erreichen würde.
Da ich gestern versucht habe, einem Kollegen mein Projekt im Zug zwischen Wipkingen und Zürich HB (ca. 2.5 Minuten) vorzustellen und dabei kläglich gescheitert bin, habe ich daneben noch damit begonnen, ein “Pitch” zu erstellen. Langfristiges Ziel davon muss sein. In einer Liftfahrt im Institut, mein Projekt vorstellen zu könne (ca 30 Sekunden).
Analog zu obigen Fragen der Fallstudie, habe ich ein kleines Framework ausgedacht, nach welchen man die Dümpel (aktuell Ranking-Systeme) kategorisieren kann und nach welchen man sie vergleichen kann.
Ranking-Systeme…
1. …haben eine Grundgesamtheit an Elementen, die sie ranken.
2. … nutzen ein Set an statistischen Daten für das Ranking, ich nenn sie Signale
3. …liegt ein Request (Informationsbedürfnis, Fragestellung) zu Grunde.
4. …haben ein Set an verschiedene Algorithmen, die die Signale mittels Data-Mining analysieren
5. …produzieren als Output eine nach Relevanz bezüglich des Requests sortierten Liste
So, das wärs für heute.