Welche Rolle spielen Trusted Rating Services in der Semantic Web Debatte?

Vertrauen ist ein wichtiges Element im Semantic Web. Wenn wir beispielsweise einen Semantic Web Agents losschicken, um uns gewisse Informationen zu besorgen, muss dieser die Vertrauenswürdigkeit der einzelnen Anbieter von semantischen Daten abschätzen können. Diese Vertrauen könnte von “Trusted Rating Services” hergestellt werden.

Ich greife diese Thematik hier auf, um festzustellen, ob sich im Semantic Web schon Trusted Rating Services entwickelt haben und ob diese sich auch als Dienstleistung beschreiben lässt, die intelligente Algorithmen einsetzt – oder um meinen Nonsense-Begriff zu verwenden – ob diese sich auch als “Dümpel” verstehen lassen.

Im Artikel “The Semantic Web” von Tim Berners-Lee, James Hendler und Ora Lassila (2001) wird das Thema Vertrauen in vier Passagen angesprochen. Sie verwenden dazu die Begriffe “trusted rating service”, “complete trust”, “trusted source” oder “trusted service”.

“At the doctor’s office, Lucy instructed her Semantic Web agent through her handheld Web browser. The agent promptly retrieved information about Mom’s prescribed treatment from the doctor’s agent, looked up several lists of providers, and checked for the ones in-plan for Mom’s insurance within a 20-mile radius of her home and with a rating of excellent or very good on trusted rating services.”

“Lucy’s agent, having complete trust in Pete’s agent in the context of the present task”

“Another vital feature will be digital signatures, which are encrypted blocks of data that computers and agents can use to verify that the attached information has been provided by a specific trusted source.”

“For example, they could have used a trusted service to take a list of providers and determine which of them are in-plan for a specified insurance plan and course of treatment.”

Im Artikel “The Semantic Web Revisited (pdf)” von Shadbolt, Hall und Berners-Lee (2006) stellen die Autoren die Frage wie man Vertrauen sicher stellen kann und die Herkunft (Provenance) von Daten bestimmt:

“How do we establish trust and provenance of the content? Provenance—that is, the when, where, and conditions under which data originated—has become a key requirement in a range of applications. We might well need the help of researchers in areas as diverse as social network analysis and epidemiology to understand how information and concepts spread on the Web and how to establish their provenance and trustworthiness.”

Shirkys Kritik an der Idee von Top-Down-Ontologien im Semantic Web (“Ontologies Are Overrated“) spricht nur an einer Stelle das Thema Vertrauen an. Er sagt, dass die Vertrauenswürdigkeit von Linkinfrastrukturen erhöht wird durch Suche anstatt das Browsing durch von Bibliothekaren gemachte top-down-Kategorien:

Leuf (2006) erläutert in seinem Buch zum Semantic Web das Thema Vertrauen in einem kurzen und einseitigen Kapitelchen “Trusting the Resources” (90f) an. Ohne zu beschreiben, wie sich das Problem automatisch lösen lässt, führt er Begriffe ein, mit welchen sich die verschiedenen Ressourcen kategorisieren lassen. Für ihn ist ebenfalls die Herkunft (Provenance) der Daten bedeutend. Das Spektrum reicht von “strong” (hohe Gewissheit und Vertrauen) nach “weak” (niedrige Gewissheit). Die “strongest” Kategorie sind seiner Ansicht nach statische Daten (“static”) darunter versteht er Propositionen und Daten, die sich nicht verändern über die Zeit. Schwächere Herkunft ergibt sich dort, wo man Daten nicht validieren kann. Die niedrigste Stufe ist die Kontext-abhängige, die auf subjektiven Einschätzung basiert, beispielsweise rechtliches Wissen.

Für die Abschätzung der Herkunft und Richtigkeit von Information schlägt Leuf einen eher allgemeinen, noch nicht besonders ausgereiften Algorithmus vor, der die folgenden drei Fragen beantwortet:

“-What is the truth value of any given proposition? (True, false, or uncertain.)
-Who asserted the proposition? (Person or organization.)
-Should we believe the person or organization that asserted the proposition?”

Goldbeck (2008) teilt in ihrem Beitrag “Trust on the World Wide Web: A Survey” Vertrauen in drei Entitäten auf: 1. Vertrauen in den Inhalt, 2. Vertrauen in Services, 3. Vertrauen in die Menschen. Für meine Analyse wäre vor allen Dingen wichtig, wie Vertrauen in die Inhalte hergestellt wird. Der Beitrag ist leider online nicht zugänglich und sollte bei Gelegenheit bestellt werden. Einige Seiten des Buchs sind bei Google Books lesbar.

Auf einer Mailingliste findet sich ein lustiger Kommentar von einem Jonathan Borden zum Thema “Trusted Rating Service” im Berners-Lee-Beispiel des Doktor-Web-Agents:

“There’s a _huge_ whole in the above called “trusted rating service” which hasn’t been designed yet… except that you can just *ask* your family doc, and you’ll likely get a better answer than your browser can give.”

Rob McCool von Yahoo spricht in seinem Artikel “Rethinking the Semantic Web, Part I (pdf)” ebenfalls die “Trusted Rating Services” an, wie sie Berners-Lee et al. im Doktor-Beispiel beschrieben wurden. Seiner Meinung nach funktionieren solche Ratings nicht, beziehungsweise geht er davon aus, dass solche Ratings fast immer schlechter sind als der informierte Rat eines Freundes, weil Komplexitäten nicht zu Simplizitäten reduziert werden sollte.

Braucht es nicht Trusted Rating Services für Dienste im semantischen Web? Analog wie Investment-Banker von Moodys oder Standard & Poor etwas über die Vertrauenswürdigkeit einer Investition erfahren, oder wie Konsumenten in Deutschland von der Stiftung Warentest vertraunswürdige Konsuminformationen kriegen, müsste ein intelligenter Web Agent auch auf einen Rating-Dienst zugreifen können, der die Vertrauenswürdigkeit von Informationsanbietern abschätzen kann.

Google Scholar kennt noch einige weitere Artkel, die Trusted Rating Services beschreiben.

Sarvapali et. al. (2004) beziehen sich im Artikel “Trust in Multi-Agent Systems (pdf)” auf das Medizin-Beispiel Berners-Lee et al. und vertiefen die Idee des “Trusted Rating Services”

“trusted rating services could be based on reputation mechanisms (see section 3.b). These reputation mechanisms could publish the ratings of health care providers and reward agents which return ratings with discounts on treatment costs to be paid to the advertised providers.”

Liechti und Tadao (1999) beschreiben in ihrem schon etwas älteren Artikel “Metadata, XML and Automation on the WWW (pdf)” eine technische Lösung namen Platform for Internet Content Selection (PICS) (links: W3C, Wikipedia). PICS ist eine W3C Spezifikation, die Metadaten verwendet um Webseiten zu raten. Aufgrund der ganz eigenen Problematik mit solchen offenen verteilten Systemen, hat das Projekt etwas an Schwung verloren.

“Metadata can be used to specify the quality of resources according to some particular evaluation scheme. Information filtering based on this rating is then possible. The Platform for Internet Content Selection (PICS) [5] is a standard architecture for content rating. Historically developed to prevent censorship on the WWW, PICS makes it possible to forbid access to pornographic material by children without requiring the intervention of a central authority. PICS is based on rating services, which qualify resources according to particular rating systems (evaluation scheme). Web browsers can be configured to only give access to documents that have been judged appropriate by trusted rating services.”

Fazit

Nach dieser vorläufigen Analyse von Trusted Rating Services im Semantic Web, scheint der Begriff noch ziemlich diffus zu sein. Dies mag wahrscheinlich auch daran liegen, dass er ursprünglich nicht als zentraler Baustein des Semantic Web eingeführt wurde, sondern lediglich als Element in einem Beispiel.

Literatur

Berners-Lee, Tim, James Hendler & Ora Lassila (2001). The Semantic Web. A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. in Scientific American. May 17, 2001.

Golbeck, Jennifer (2008). Trust on the World Wide Web: A Survey. In: Foundations and Trends® in Web Science: Vol. 1: No 2, pp 131-197.

Leuf, Bo (2006). The Semantic Web. Crafting Infrastructure for Agency. Wiley: West Sussex.

Liechti, Olivier & Ichikawa, Tadao (1999). Metadata, XML and Automation on the WWW. Journal of the Swiss Information Processing Societies, S. 30-32.

McCool, Rob (2005). Rethinking the Semantic Web, Part 1. In: IEEE Internet Computing. November/December 2005, S 88-90.

Sarvapali D. Ramchurn, Dong Huynh and Nicholas R. Jennings (2004). Trust in multi-agent systems. The Knowledge Engineering Review, 19 , pp 1-25

1 Comment

Filed under AI, deutsch, dissertation

One Response to Welche Rolle spielen Trusted Rating Services in der Semantic Web Debatte?

  1. Pingback: Dis-Tagebuch: Status Dissertation « Large Neuron Collider

Leave a Reply

Fill in your details below or click an icon to log in:

Gravatar
WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Connecting to %s