Die vom Algorithmus zu rankenden Elemente in der Grundgesamtheit sind oft auch Signale. In der Sprache der Recommender Systeme handelt es sich dann um “item-basierte” Daten. Signale werden häufig der Grundgesamtheit entzogen, mittels Mining-Techniken.
Ein Beispiel: bei der Google Suche sind die Elemente der Grundgesamtheit alle Webdokumente im Netz. Die Webdokumente sind aber gleichzeitig auch die wichtigste Quelle für Signale, die im Ranking-Algorithmus verarbeitet werden. Signale wären Verlinkungsstruktur (PageRank), Keyword-Dichte, Keyword-Häufigkeit, etc. Signale, die nicht aus der Grundgesamtheit gewonnen werden sind beispielsweise alle Nutzer-abhängigen Daten, die für die Personalisierung genutzt werden.
Die hier beschriebene Unterscheidung wird bestimmt helfen bei der Entwicklung von Signal-Kategorien. Zwei Kategorien können nun bereits operationalisiert werden.
1. Item-basierte-Signale
2. Nutzungsbasierte Signale, wobei sich Nutzungsbasierte Daten nochmals aufteilen lassen in 1. Daten anderer Nutzer (Social Recommendations) und 2. persönliche Nutzungsdaten (personalized Recommendations).
Im Artikel “A Guide to Recommender Systems” erklärt Richard MacManus auf ReadWriteWeb diese Unterscheidungen am Beispiel von Recommender Systemen. Ich glaube aber, dass Sie sich durchaus auch auf andere Systeme wie News-Aggregatoren, Suchmaschinen, Reputations-Systeme, Citation Indexing und sogar Media-Vermarktung a l Adwords anwenden lassen.
Weitere Hinweise finden sich bei:
Linden, Greg / Smith, Brent / York, Jeremy (2003). Amazon.com recommendations: item-to-item collaborative filtering. In Internet Computing, IEEE , vol.7, no.1, pp. 76-80, Jan/Feb 2003