November 25, 2009

Die fachliche Autorität von Algorithmen

Daran habe ich auch schon rumgeknabbert, aber natürlich konnte ichs nicht so schön auf den Punkt bringen wie Herr Shirky in seinem Blog-Post von letzter Woche (auch wenn er sagt, dass es noch ein bisschen ein “ramble” sei).

Er definiert algorithmische Autorität als die Fähigkeit von Algorithmen, aus einer Menge an nicht grundsätzlich glaubwürdigen Quellen ein Informationsprodukt zu generieren, das glaubwürdig ist, ohne dass es eine glaubwürdige menschliche Quelle bedarf, die das Resultat verifiziert:

“Algorithmic authority is the decision to regard as authoritative an unmanaged process of extracting value from diverse, untrustworthy sources, without any human standing beside the result saying “Trust this because you trust me.”

Diese fachliche Autorität hat drei charkteristische Eigenschaften: Erstens verarbeitet sie Informationen aus vielen Quellen, die nicht auf ihre Glaubwürdigkeit überprüft wurden. Zweiten produziert sie gute Resultate, die die Bedürfnisse der Menschen befriedigen. Drittens sind sich die Nutzer bewusst, dass auch andere Nutzer diese Tools nutzen. Damit werden die Algorithmen zur fachlichen Autorität.
Natürlich gibt es intelligente Menschen, die eine solche algorithmischen Fachautorität kritisieren würden (aktuelle zum Beispiel Herr Schirrmacher mit seinem Buch). Dies ändert aber nichts an der Tatsache, das Autorität in erster Linie eine soziale Abmachung ist und nicht unbedingt eine kulturell unabhängige Variabel. Oder in den Worten von Herrn Shirky:

“An authoritative source isn’t just a source you trust; it’s a source you and other members of your reference group trust together. This is the non-lawyer’s version of “due diligence””

November 23, 2009

Nicht Informationsüberfluss, sondern Filter-Versagen

Shirky’s Rede an der letztjährigen Web 2.0 Expo: Informations-Überfluss ist eine Mär. Es gibt ihn schon seit Gutenberg mehr Bücher druckte als ein Mensch in seinem ganzen Leben lesen konnte. Die ware Problematik ist das Versagen der Filter.

November 13, 2009

Bitte nicht Google Street View verbieten

Der Eidgenössische Datenschutz- und Öffentlichkeitsbeauftrag­te Hanspeter Thür hat heute erklärt, Google vors Verwaltungsgericht zu bringen, weil Google die im September geforderterten Massnahmen zum Schutz von Persönlichkeitsdaten nicht so umgesetzt hat, wie das vom EDÖB gefordert wurde.

Es geht um folgende Forderungen:

  • Vollständige Unkenntlichmachung von Gesichtern und Autokennzeichen. Insbesondere Personen in der Umgebung vor Spitälern, Gefängnissen oder Schulen sollen nicht erkennbar sein.
  • Keine Aufnahmen von Privatstrassen, wenn keine Einwilligung vorliegt
  • Die Kameras auf den Google-Autos müssen niedriger montiert werden, so dass man damit nicht über die ansonsten blickdichten Zäune und Mauern spannern kann.
  • Die Vollständigkeit der Bilder: Entgegen angeblicher Beteuerungen von Google wurde viele Städte flächendeckend ins Internet gestellt

Ich finde ja einige der Punkte durchaus begrüssenswert: Dass Gesichter oder andere Erkennungsmerkmale anonymisiert werden, scheint mir sinnvoll. Dass Google nicht in Privatstrassen über blickdichte Mauern fotografiert (wie es im Fall des Hauses meiner Eltern geschehen ist) sollte selbstverständlich sein.

Wichtig scheint mir aber, dass es sich dabei um eine kleine Zahl von Ausnahmefällen handelt. Auf den allermeisten Bildern von Google Street View sind perfekt anonymisierte Menschen und Fahrzeuge zu sehen, fotografiert von für alle zugänglichem öffentlichem Grund, was meines erachtens keine Datenschutz-Probleme aufwerfen sollte. Als begeisterter Nutzer würde es mich persönlich betreffen, wenn diese paar Ausnahmefälle dazu führen würden, dass Google Stree View in der Schweiz eingestellt werden müsste.

Ein Beispiel: Ich suche  seit ca. 10 Monaten (ohne Scheiss!) eine neue Wohnung in der Stadt Zürich (übrigens: mind. 4-Zimmer, schön, bezahlbar, wer einen Hinweis hat wird fürstlich belohnt!). Es kommt fast nur Mist auf den Markt: Bei den meisten Wohnungen weiss man schon, wenn man vor dem Gebäude steht, dass man darin sicher nicht wohnen möchte.

In der Ära vor Google Street View bin ich noch sechs bis zehnmal pro Woche in irgendwelche Aussenquartiere zu Besichtigungen von Wohnungen gefahren, nur um vor der Türe schon zu merken, dass diese sowieso nicht in Frage kommen.

Heute kann ich mir das dank Google Street View ersparen. Ich kann mir schon ein ziemlich gutes Bild des Hauses machen, in welchem die Wohnung liegt, kann durch die Nachbarschaft spazieren, kann abschätzen, ob die Lage viel Verkehrslärm abkriegt, und kann abklären wo der nächste Migros liegt – und das alles von zu Hause aus. Zusammen mit Informationen zu Preis, Quadratmeterzahl und anderen Angaben aus dem Inserat sortiere ich die besonders üblen Wohnung schon aus, bevor ich zur Besichtigung gefahren bin. Eine unheimlich Effiziensteigerung der Wohnungssuche, die mir bestimmt schon zahlreiche Stunden meiner Lebenszeit geschenkt hat.

Diese und viele weitere positive Anwendungen von Street View stehen den offensichtlichen Datenschutzproblemen gegenüber. Hier sollte unbedingt eine Güterabwägung stattfinden. Gerade für Forderungen, die länger dauern könnten, wie beispielsweise das erneute Abfotografieren der Strassen mit niedrigeren Kameras, sollte der Datenschutzbeauftragte ein wenig mehr Kullanz einräumen.

Zudem scheint mir auch die Aussage von Thür etwas absurd, dass Google im Vornherein angeblich behauptet hätte, nur Stadtzentren zu fotografieren und an Aussenquartieren nicht interessiert zu sein. Erstens macht das für die Datenschutzproblematik keinen Unterschied und zweitens kommt bei mir  der Verdacht auf, dass er damit vom Versäumnis ablenken will, dass er sich erst eingeschaltet hat, als der Street View schon live war.

Mehr dazu:
NZZ
inside-it.ch
Klageschrift (pdf)

Update [16 Uhr]: Im Datenschutz FAQ von Street View ist übrigens erklärt, wie Menschen, deren Privatsphäre verletzt wurde, Bilder entfernen können.

November 4, 2009

Der Daumen als Video-Codec

Als Geburtsanzeige wollten wir ein Filmchen unseres Sohnes in Form eines Daumenkinos versenden. Zur Erinnerung: Daumenkinos sind diese kleinen Büchlein, die beim schnellen durchblättern in unserem Hirn die Illusion erzeugen, dass es sich bei den Einzelbildern in Wirklichkeit um einen Film handelt.

In der Primarschule habe ich sowas noch selber gebastelt. Mit den Sinalco-Bestellblöcken meiner Mutter und einem blauen Big-Kugelschreiber habe ich die tödlichsten Sequenzen der Roadrunner-und-Coyote-Trickfilme neu inszeniert. Heutzutage sind wir aber zu faul für sowas und Sinalco-Bestellblöckchen kriegt man schliesslich auch nicht mehr an jeder Ecke.

Eine kurze Google-Suche hat uns dann auf die Seite meindaumenkino.ch des Walliseller Unternehmens Allerlei Medien gebracht.

Das Angebot von Meindaumenkino verspricht minimalen Aufwand auf Kundenseite, der zusammengefasst aus folgenden beiden Arbeitsschritten besteht:

  1. Film hochladen,
  2. Daumenkino aus Briefkasten nehmen.

Und so einfach wie versprochen wars auch. Den mit der digitalen Fotokamera inszenierten und in iMovie zusammengesetzten Film haben wir hochgeladen. Dann noch ein Umschlag gestaltet mit dem Online-Editor. Fertig. Am Freitag bestellt, schon am Montag hat uns der Geschäftsführer die Büchlein persönlich vorbei gebracht. Super Angebot und definitv besser in der Qualität als die Sinalco-Bestellblöcke. Zwei Daumen hoch.

October 20, 2009

18 Thesen, die ich mit NZZ-Chefredakteur Markus Spillmann diskutieren würde…,

…wenn ich heute Abend mit ihm beim NZZ Mediatalk über die Zukunft der Leitmedien spräche. Thema ist “Druck auf die Tageszeitungen und mögliche Auswege aus der Krise”.

  1. Das Inhaltebündel ist tot: Grund Wegfall der Quersubventionierung der teuren Auslandberichterstattung durch Rubrikinserate.
  2. Micropayments für Inhalte: Problem bei der Entbündelung
  3. Link Ökonomie: Do what you do best, link to the rest.
  4. Pay-Content als Gefangenen-Dillemma. @rupert. Paycontent funktioniert nur wenn alle mitmachen. Derjenige, der die Mauer durchbricht hat einen kompetitiven Vorteil, weil er plötzlich den ganzen Traffic der Kostenlos-Nutzer gewinnt.
  5. Forderung: Zugänglichkeit, Offenheit, offene Archive mit Permalinks, Verzicht auf den angekündigten Paywall
  6. Falls Paywall, dann nach Modell Financial Times, allerdings mit mehr freien Artikeln pro Tag und Person, ansonsten werden Zufalls-Surfer vertrieben
  7. Falls Paywall, dann einen unkomplizierte Branchenweite Lösung mit offenen Standards. Google bietet übrigens eine mögliche Lösung
  8. Google ist nicht nur der wichtigste Zulieferer von Traffic, sondern auch der wichtigste Zulieferer von Inhalten, wie viele wissenschaftliche Studien zeigen. Journalisten lieben die Suchmaschine, ersetzt sie doch den mühsamen Griff zum Telefon
  9. Zeitung produzieren immer mehr vom selben, anstatt Vielfalt. Das führt auch zu Skurrilem
  10. Wir haben nie für Inhalte bezahlt. Wir haben immer lediglich für Produktionskosten und Distribution des Trägermediums Geld in die Hand genommen
  11. Die Werbequalität pro Franken hat sich mit Internet-Werbeangeboten (insbesondere AdWords) deutlich verbessert
  12. Journalismus ist nich tot, nur das alte Geschäftsmodell. Grund: Der Wegfall des quasi-monopolistischen Zugangs zu Werbezielgruppen
  13. Guter Journalismus braucht kein Papier
  14. Stärkung der Online-Strategie, damit der Traffic Trafficverlust aufgefangen werden kann
  15. Inhalte in allen möglichen Formaten zugänglich machen (APIs, RSS, ATOM, JSON), so dass andere Anbieter ihre Innovationen darauf aufbauen können.
  16. Aggregatoren umwerben und nicht bekämpfen. Sie bringen Traffic
  17. Lokale (Hyperlokale) Angebote verbessern. Sie sind dank Mashup-Technologie kostengünstig zu realisieren und bringen gut vermarktbare Zielgruppen. (die Anderen könnens schliesslich auch)
  18. “The New New York Times”: Ach, Wie könnte die New York Times rentieren, wenn man ihr das Geschäftsmodell von Techcrunch überstülpen würde (nur Online, kein overhead)

October 4, 2009

Wie Google Suchqualität misst – oder das Verschwinden der Meritorik?

Bei Business Week findet sich heute ein Interview mit Scott Huffmann, seinerseits Vorsteher des Google Evaluation Teams. Die Aufgabe dieses Teams ist es, mittels Experimenten die Auswirkungen von Änderungen in den Algorithmen zu messen. Das Team nutzt vor allem Testgruppen und Kontrollgruppen und versucht anschliessend statistische Zusammenhänge zwischen dem Nutzerverhalten vor und nach der Änderung im Algorithmus zu finden. Daneben stehen aber auch rund hundert “human evaluators” im Einsatz.

Schwierigkeiten entstehen natürlich bei der Messung der Qualität von Personalisierung:

“We obviously can’t use human evaluators in quite the same way, because we don’t know what they like and we can’t invade their privacy. We tend to use more click-based evaluation for personalization. You can look in aggregate where for all the folks who are logged-in users whom this kind of personalization is applying to, we take some small percentage and we’re going to apply some new kind of personalization—what happens to them vs. the control group?”

Interessant ist dass den Human Evaluators im stark automatisierten Umfeld von Google ein trotzdem eine wichtige Rolle zugesprochen wird:

“The human evaluators are pretty important for us today. The more automated or user behavior/click-based things really give you complementary kinds of data. Both have noise in them: Human evaluators make mistakes. Clicks are hard to interpret; people click or don’t click for all kinds of reasons.”

Bemerkenswert ist das Qualitätsverständnis von Google: Qualität ist, was der Nutzer klickt. Die konsequente Ausrichtung auf den Nutzer und seine Bedürfnisse widerspiegelt sich in vielen Produkten von Google und nicht zuletzt auch in diesem QA-Prozess (Quality Assurance). (Das nutzerzentrierte Qualitätsverständnis liegt auch allen anderen Suchmaschinen zu Grunde, wie dies Elizabeth von Couvering in ihrer Paper “New Media? The Political Economy of Internet Search Engines” bereits 2004 feststellte).

Wenn Qualität das ist, was der Nutzer klickt, dann wird freilich ein Aspekt ausgeblendet, der die Kommunikationswissenschaft umtreibt: Die Meritorik. Haben Informationen und Inhalte mit meritorischer Qualität überhaupt eine Chance in die Top-Positionen der Suchmaschinen zu gelangen? Oder sind es vielmehr die seichten Inhalte, mit demokratiepolitisch und gesellschaftlich demeritorischem Wert? Internet-Meme mit grossem Unterhaltungs- und kleinem Informationswert haben wahrscheinlich die bessere Chance geklickt zu werden als furztrockene, seriöse Analysen. Bedeutet dies eine Verlust der Medien als meritorische Güter? Vielleicht. Dies muss aber aber meiner Meinung nach nicht umbedingt schlecht sein.

Übrigens: Das Interview mit Scott Huffmann ist Teil einer vierteiligen Serie. Das erste Interview war mit Udi Manber (Vice-president Technology for Core Search), das zweite mit Amit Singhal (steht dem Core Ranking Team vor) und das dritte mit Matt Cutts (Chef des Anti-Spam Teams). (via Google Operating System).

September 26, 2009

Der Tod der US-Zeitungsbranche?

Eine schön gemachte Infografik zur serbelnden US-Zeitungsbranche findet sich im Blog von Mint.com. Mint.com, Anbieter einer Online Geld- und Budget-Management-Software ist zwar nicht unbedingt die Referenz für medienökonomische Analysen schlechthin, dennoch ist die Zusammenstellung sehr erhellend (Wahrscheinlich dient sie als SEO-Linkbait, deren Zweck ich mit diesem Link bereits zum zweiten Mal erfülle).

Von den 25 meistgelesenen US-Zeitungen konnte von 2008 bis 2009 nur das Wall Street Journal seine Auflage erhöhen. Alle anderen verlieren. Was Ol’ Rupert mit dem WSJ richtig macht, scheint er bei der NY Post merhfach zu verlieren. Die NY Post hat den grössten Auflagenverlust mit fast 20 Prozent. Ebenfalls sind die Aktienpreise der Zeitungsverlage markant eingebrochen (Allerdings fehlen News Corp. und andere grosse) in der Darstellung.

Symptomatisch für den Medienwandel ist, dass trotz einem 7.5 prozentigen Umsatzinbruch bei herkömmlichen Werbeformen, die Online-Werbung um über 25 Prozent zugenommen hat. Sie macht nun ca. 7 Prozent des Gesamtumsatzes der Branche aus (Wobei nicht klar ist, welche Unternehmen hier alle berücksichtigt wurden).

Als Quelle für die Zahlen gibt Mint Bloomberg, sowie die Newspaper Association of America an.

MINT-DEATH-OF-NEWS-R2

Via IA

September 25, 2009

Was ist eigentlich? Heute: Computational Advertising

Mit dem Begriff Computational Advertising beschreibt Yahoo! Research das automatische Zusammenführen von Werbezielgruppen mit Werbebotschaften im Internet. Dazu gehört natürlich Search Engine Marketing (Keyword Marketing), aber auch Content Targetting. Computational Advertising ist eine wissenschaftliche Disziplin zwischen Information Retrieval, Machine Learning und Mikroökonomie. Das Ziel ist es Nutzern, zum Kontext oder Situation passende Werbebotschaften zu präsentieren. Die Situationen reichen vom Betrachten von Webseiten, zum Schauen von Filmen, bis hin zur Nutzung einer Suchmaschine.

Zwei Yahoo-Forscher (Andrei Broder und Vanja Josifovski) bieten in Stanford einen Kurs dazu an. Yahoo Research widmet dem Computational Advertising einen eigenen Forschungs-Bereich.

September 20, 2009

Soso, die NZZ macht wieder einen Paywall

NZZ-Chefredakteur Markus Spillmann zum Online-Geschäft der NZZ:

Das Ganze wird sich in Zukunft zumindest teilweise in Richtung Bezahlung entwickeln. Irgendwie müssen wir ja Einnahmen generieren. Aber nicht ganzheitlich. Wir streben eine unterschiedliche Behandlung an. Es wird dann ein freies, reichweitenorientiertes Angebot sowie zusätzlich Angebote mit einer gewissen Exklusivität und Tiefe geben, die nur gegen Entgelt einzusehen sind. Die Exklusivität muss eine gewisse Wertschöpfung generieren. Ob das über Abo und Werbung oder nur über Abo läuft, das muss man im Detail betrachten.

Das ganze Interview bei Persönlich.com

September 20, 2009

Haben wir jemals für Inhalte bezahlt?

In Jeff Jarvis’ Buzzmachine fand ich heute einen interessanten Link zu Blog von Paul Graham. Er wirft die Frage, ob es so etwas wie Paid Content (Bezahlinhalte) jemals gegeben hat.

“Almost every form of publishing has been organized as if the medium was what they were selling, and the content was irrelevant. Book publishers, for example, set prices based on the cost of producing and distributing books. They treat the words printed in the book the same way a textile manufacturer treats the patterns printed on its fabrics.”

Natürlich handelt es sich dabei um eine rhetorische Frage. Wir haben immer deshalb für Zeitungen, Zeitschriften, Pay-TV, Bücher, Musik-CDs, DVDs oder Videos bezahlt, weil diese Medien uns den Inhalt gebracht haben, den wir unbedingt wollten. Dennoch stimmt natürlich die Analyse, dass der bezahlte Preis jeweils nur zum kleinsten Teil für den Content verwendet wird. Aufgrund der hohen Fixkostendegression wurden damit vor allem die physischen Trägermedien und die Distribution finanziert, die in prä-digitalten Zeiten ein Markt mit Monopolisierungpotenzial waren.

Und deshalb lohnt es sich auch, vor dem Hintergrund der neuen Errichtung von Paywalls im Internet, diese Fragen zu stellen. Wird der Nutzer je für Content bezahlen, handelt es sich bei Content doch meist entweder um ein Erfahrungs- oder Vertrauensgut, dessen Qualität vom Nutzer gar nicht überprüft werden kann.