Künstliche Intelligenz

Forschen war noch nie so einfach

Foto: Christoph Schmidt / dpa

Sie wissen auch nicht, was die Zukunft bringt? Hervorragend. Das ist der erste Schritt. Der zweite heißt nicht abwarten, und auch nicht vermuten – sondern: Forschen. Denn was die Zukunft bringt, das weiß ja auch von den anderen niemand, egal, wie gravitätisch oder verständlich oder von teuren Marketing-Kampagnen untermauert sie ihre Vermutungen auch immer vorbringen mögen. Forschen Sie!

Vielleicht ist so ein Appell gar nicht nötig, wenn Sie diesen Blog lesen – aber vielleicht findet sich ja in ihrem Bekanntenkreis eine Medienmanagerin, die glaubt, ihr Budget sei zu schade für sowas, oder einen Journalisten, der meint, dafür sei keine Zeit, und Forschen und Entwicklung sei etwas für Universitäten oder öffentliche Einrichtungen. Der meint, Weiterentwicklung des eigenen Berufes könne man auch dem Google-Konzern Alphabet, Amazon und Apple überlassen.

Das wäre strategisch etwas kurz gedacht – und dazu auch noch taktisch eine großartige Gelegenheit verspielt. Es war noch nie so einfach, Technologie zu erforschen. Der schwierigste Teil ist ein wenig Konzentration auf eine langfristig interessante Frage, und das Eingeständnis, etwas nicht zu wissen.

Nach dieser Schwelle ist der Rest zum Greifen nah: Maschinen, für deren Kauf man sechsstellige Summen investieren müsste, lassen sich für wenige Euros mieten. Algorithmen, in denen die jahrzehntelange Arbeit tausender Informatiker steckt, können für Centbeträge mit neuen Aufgaben betraut werden.

Aus dieser Perspektive betrachtet ist das, was wir und andere Medienunternehmen tun können und sollten, ein Forschen zweiter Ordnung. Den Verheißungen und Fallstricken der Algorithmen sind wir nicht ausgeliefert wie einer Naturgewalt, es ist möglich, mit ihnen zu experimentieren, sie zu erproben, zu kritisieren, ihre Ergebnisse zu verbessern und sie sich zu eigen zu machen.

Was es dazu braucht, ist den Mut zu haben, sich von einer Forschungsfrage leiten zu lassen. Auf den Schultern dieser Riesen stehend, hängen dann mit einem Mal viele Früchte erstaunlich niedrig (und einige davon erweisen sich aus der Nähe betrachtet dann doch als wurmstichig).

Natürlich machen viele neue Möglichkeiten den Start nicht unbedingt einfacher. Auch die Auswahl ist Arbeit. Zum Werkzeugkasten des Firmenforschers gehören deswegen betreute Abschlussarbeiten (vielleicht sogar mit Forschungsfragen, auf die Sie selber nie gekommen wären), niederschwellige Veranstaltungen wie Hackathons (Tipp: “Gewinnen” ist egal, interessante Gespräche und Erkenntnisgewinn nicht) und handfeste Forschungsprojekte, die ganz klassisch zum Start einen Start, ein Ende, ein Budget und eine Forschungsfrage mit auf den Weg bekommen.

Bei den Finanzen können Förderprogramme helfen. Fast noch wichtiger als der finanzielle Aspekt ist dabei der Zwang, seinen Blick über den Tellerrand zu erheben. Andere Standpunkte einnehmen ist Pflicht, und das gelingt besonders gut durch den Kontakt mit Partnern, die an ähnlichen Erkenntnissen interessiert sind, aber anders denken und anders arbeiten

Ein Beispiel dafür ist das Projekt News-Stream, das uns in den vergangenen drei Jahren einen Freiraum gegeben hat, um uns in der Welt der Big-Data und KI-Technologien umzuschauen und zu fragen: wie lassen sich diese Maschinen und Verfahren nutzen, um Nachrichtenströme zu analysieren und für Redaktionen nutzbar zu machen?

Auf der einen Seite standen mit dem dpa-newslab und der Deutschen Welle Innovation zwei Teams, die Technologien für den redaktionellen Alltag erproben und bereitstellen wollten. Auf der anderen Seite zwei Forschungsteams, die ihre Werkzeuge weiterentwickeln wollten – Neofonie aus Berlin (Textanalyse) und das Fraunhofer IAIS (Audioanalyse). Viele Prototypen, die während des Projektes entstanden sind, haben mit Workshops begonnen, bei denen die eine Seite aus ihrer Welt erzählt und die andere gelauscht und sich Notizen gemacht und nachgefragt hat.

Herausgekommen sind dabei eine ganze Reihe von Erkenntnissen darüber, welche Technologien noch ungeeignet sind für unsere Journalistenwelt, in der hunderte von Menschen täglich mit der Präzision von Formulierungen ringen und belegbare Fakten das Maß aller Dinge sind. Aber auch Prototypen, die nützlich genug sind für die tägliche Arbeit und für die Weiterentwicklung, auch, wenn das prototypische noch durchschimmert.

Beispiel 1 ist eine Live-Grafik, die in Berlin im Herzen des dpa-Newsrooms auf einem großen Monitor ebenso zu sehen ist wie auf den Arbeitsplätzen der Redaktion. Ein automatisiert erstelltes Feedback für die Redaktion, das Auskunft darüber gibt, auf welchen Websites dpa-Meldungen oder Bruchstücke daraus zu finden sind – im Redaktionsjargon “das Bällebad” genannt.

Tausende von Nachrichtenquellen werden dafür ausgewertet, Textfragmente verglichen, automatisch veröffentlichte Inhalte aussortiert. Ohne die Big-Data-Expertise unserer Forschungspartner hätte diese Auswertung nie gebaut werden können – aber ohne die Fragen, die wir ihnen gestellt haben, wäre die Idee, sie zu bauen, niemals geboren worden.

 

Das zweite Beispiel ist der Roboter-Branchendienst – den wir Sie zu testen einladen (siehe dazu das Ende diese Beitrags). Für diesen Prototypen haben die Algorithmen der Redaktion von dpa-AFX über die Schulter geschaut. Der dpa-Wirtschaftsdienst sortiert seine Meldungen nach Branchen – Konsumgüter, Versorger, Banken, Einzelhandel und knapp zwei Dutzend mehr.

Für Kunden des Dienstes ist die Sortierung nur ein Feature unter vielen – bei KI-Forschern löst sie sofort den Jagdinstinkt aus: Frische Daten, von menschlicher Intelligenz zusammengetragen. Genau der Stoff, aus dem Maschinen gut lernen können. Im News-Stream-Projekt haben wir damit einen Roboter trainiert, der nun brav seine Arbeit tut und aktuelle Meldungen aus dem Internet vorsortiert.

 

 

Die Forschungsfrage “Kann man Verfahren der Künstlichen Intelligenz für Aufgaben in einer Redaktion verwenden?” ist damit beantwortet. Die Innovationsfrage “Kann diese Fähigkeit die Arbeit der Redaktion verbessern, oder lässt sie sich in ein Produkt ummünzen?” stellt sich naturgemäß gleich im Anschluss.

In der letzten Frage sind wir an einem Wechsel der Perspektive interessiert – wir sind besonders gespannt auf Fragen von Leserinnen und Lesern dieses Blogs. Bitte schreiben Sie uns, wenn Sie den Branchendienst-Roboter testen möchten – wir vergeben gerne Zugänge, und wollen unbedingt wissen, was Ihnen dazu einfällt.

Aber natürlich ist es erst der Anfang, die Verfahren der Künstlichen Intelligenz selbst zu beherrschen. Um in einem zweiten Schritt den Markt zu beobachten und zu beurteilen, wie gut die Spezialanbieter auf diesem Gebiet sind.  Auch dies ist Forschung. Im Rahmen von News-Stream haben wir zum Beispiel untersucht, wie gut Personen, Organisationen und Ortsnamen in dpa-Meldungen von den verschiedenen kommerziell verfügbaren Automaten erkannt und zum Beispiel mit Wikipedia-Einträgen verlinkt werden können. (Daraus ist eine Abschluss-Arbeit geworden. Zusammenfassung auf medium.com: 8 lessons learned about NER)

 

 

Wir forschen weiter. Die Arbeitshypothese ist: für eine Nachrichtenagentur der Zukunft wird es darauf ankommen, die Arbeit von Menschen und Maschinen gut miteinander zu verzahnen, um die Nachrichten besser zu filtern und nützlicher zu machen. Hier gilt es, neue Produkte zu entwickeln – zusammen mit unseren Kunden.

Notizblock

Internet:

NewsStreamProject:
https://newsstreamproject.org/

Bällebad (Demo, historische Daten, anonymisiert):
http://dpa-newslab.github.io/newsstream-baellebad-demo/

Kontext-Maschine:
https://dpa-newslab.github.io/kontextmaschine/

Homepage:
dpa-newslab

Kontakt:
Twitter: Martin Virtel
Twitter: dpa-newslab

Leave a Comment

Your email address will not be published.