Künstliche Intelligenz entschlüsselt Bilder und Texte

Künstliche Intelligenz entschlüsselt Bilder und Texte

Zu den faszinierenden Möglichkeiten der Künstlichen Intelligenz (KI) gehört, Skizzen und Grafiken hochzuladen. Die Maschine schaut sich das Werk an, erstellt eine Beschreibung und löst sogar Matheaufgaben. Meistens jedenfalls.

Hochwasserangepasste Brücken

Da hat etwa eine Gruppe von Wissenschaftlerinnen und Wissenschaftlern eine 55-seitige Broschüre zusammengestellt. Sie gibt Empfehlungen für hochwasserangepasste Bauten nach der Flutkatastrophe im Ahrtal. In dem Dokument findet sich eine Grafik mit mehreren Brücken.

Leider erklärt die Grafik nicht, was es mit den Brückentypen auf sich hat und warum sie besseren Schutz bei Hochwasser bieten. Die KI kann das. Über meinen bevorzugten Dienst TypingMind mit Anschlüssen an KIs wie GPT-4 Vision erstellt die Maschine eine ausführliche Beschreibung:

Das Bild zeigt ein Schema für hochwasserangepasste Brückenbauweisen, wie es in der Quelle "Burghardt et al, 2022" dargestellt wird. Es illustriert verschiedene Konstruktions- und Designansätze, um Brücken widerstandsfähiger gegen Hochwasserereignisse zu machen.

Im oberen Teil des Schemas sind verschiedene Überbauarten dargestellt:

Abflussquerschnitt: Links sehen wir eine Brücke mit einem vergrößerten Abflussquerschnitt, was den Wasserfluss unter der Brücke erleichtert.

Angepasster Fließquerschnitt: Die zweite Brücke zeigt eine Anpassung des Fließquerschnitts, um den Wasserfluss zu optimieren.

Mehr Raum für den Fluss: Die dritte Brücke hat größere Öffnungen, um mehr Raum für den Fluss zu schaffen.

Darunter sind spezielle Brückentypen zu sehen:

Hubbrücke: Eine Brücke, die sich für den Schiffsverkehr anheben lässt.

Klappbrücke: Eine Brücke mit einem beweglichen Teil, der sich aufklappen lässt.

Strömungsgünstiger Überbau: Eine Brücke, die so gestaltet ist, dass sie den Wasserfluss minimiert und die Strömung optimiert.

Im mittleren Teil werden Pfeilerformen und deren Einfluss auf den Wasserfluss thematisiert:

Pfeiler: Es werden zwei Pfeilerformen gezeigt, die den Wasserwiderstand minimieren sollen, mit Strömungswiderstandskoeffizienten von 0,6-0,8 bzw. 0,65-0,76.

Im unteren Teil des Schemas geht es um die Bemessung und den Schutz der Brücken:

Zusätzliche Bemessungslasten: Hier wird gezeigt, wie zusätzliche Lasten in die Bemessung einfließen können, um die Struktur zu stärken.

Tiefengründung und Erosionsschutz: Es wird dargestellt, wie eine Tiefengründung und Maßnahmen zum Erosionsschutz implementiert werden können.

Verzicht auf Brücken: Als letzte Option wird der vollständige Verzicht auf eine Brücke gezeigt, was den Wasserfluss natürlich nicht behindert.

Verzicht auf Stabbogenbrücken: Hier wird empfohlen, auf Stabbogenbrücken zu verzichten, da diese möglicherweise den Wasserfluss stärker behindern.

Diese Darstellung könnte in einem Newsletter oder Artikel verwendet werden, um über moderne und hochwasserresistente Brückenbauweisen zu informieren und zu diskutieren, wie Infrastruktur angesichts zunehmender Hochwasserereignisse durch den Klimawandel angepasst werden kann.

Das ist doch schon wesentlich besser erklärt. Wenngleich ich zum Strömungswiderstandskoeffizienten mehr Expertise bräuchte.

KI analysiert Schreibstil

Das funktioniert oft auch mit Screenshots von Social-Media-Beiträgen. Da schreibt ein Blogger fast täglich auf Facebook kritische Anmerkungen zu Weltgeschehen und persönlichen Beobachtungen. Ich mache mir gelegentlich das Vergnügen, das Wohl und Wehe dieses Geweses von einer KI analysieren zu lassen. Drei Screenshots und eine Anfrage bei Claude 3 Opus später steht das Urteil der Maschine fest:

„Der Autor verwendet definitiv keine Sprezzatura in seinem Schreibstil. Im Gegenteil. Statt Leichtigkeit und Eleganz pflegt er einen aggressiven, polemischen Ton. Seine Meinungen und Wertungen trägt er unverhohlen zur Schau. Er scheut sich nicht, seine vermeintlichen Gegner direkt und unverblümt zu attackieren und lässt keinerlei Zurückhaltung oder Nonchalance erkennen. Insgesamt wirkt sein Schreibstil eher bemüht und forciert als lässig und natürlich. Es entsteht der Eindruck, dass er sich sehr anstrengt, Eindruck zu machen. Der Autor setzt also auf das genaue Gegenteil von Sprezzatura: auf demonstrative Meinungsstärke, Angriffslust und Zuspitzung statt auf betonte Leichtigkeit und vornehme Zurückhaltung. Sein Stil ist das Gegenteil von ,lässiger Eleganz‘.“

Das ist starker Tobak und ein interessantes Fremdwort Sprezzatura, das ich sogleich in meinen Wortschaft aufnehmen. Die meinungsstarke Bewertung der KI lädt dazu ein, sie zur Erwiderung zu nutzen – zumal, wenn die Maschine in anderen Beiträgen Ungenauigkeiten, weitere Polemik und Fehler entdeckt. Doch die KI zum Diskutieren auf Facebook zu nutzen wäre, wie Kipling sagt, eine andere Geschichte.

Mathematische Rätsel

Weniger kritisch ist die KI bei mathematischen Aufgaben. Da lädt man dieses Rätsel hoch, die Maschine vertut sich zunächst bei einer Farbe und findet nach einer Korrektur die richtige Antwort: Gelb = 3, Rot = 6, Blau = 9.

Etwas anspruchsvoller ist dieses Kreuzworträtsel. Da vertut sich die Maschine gelegentlich bei der Zahl der zu füllenden Quadrate und kommt dann zu inhaltlich zutreffenden, aber nicht ins Raster passenden Antworten. Selbst nach dem Scan des ausgefüllten Kreuzworträtsels mit ungefähr 60 Prozent gefüllten Quadraten kann die Maschine das Rätsel nicht abschließend lösen.

Geometrische Knobelaufgabe

Ähnliches erlebte ich kürzlich mit folgendem grafischem Rätsel. Eine Bekannte auf Facebook, Mathelehrerin, stellte diese Knobelaufgabe. Ein Brett liegt schräg in der Schublade. Sie ist 20,5 cm tief (in der Grafik Wert s). Wie lang ist die Strecke x rechts außen?

Sei es GPT-4 Vision, Claude 3 Opus oder Gemini Pro Vision: Alle drei KIs trafen zutreffende Aussagen über die gezeigten Dreiecke und Winkel. Alle waren stets bemüht. Doch beim Ausrechnen von x kam keine Maschine auf die richtige Lösung. Dabei sind alle nötigen Angaben in der Grafik enthalten.

Wer schafft es, einer KI die passenden Fragen zu stellen, um sie das richtige Ergebnis ausrechnen zu lassen? Hinweise bitte in die Kommentare.

Die Bekannte hat mir die Lösung direkt zukommen lassen. Alle drei Maschinen antworteten darauf sinngemäß: Sie ist richtig. Wie schön!

Der Mensch bleibt noch überlegen

Ein Zeitlang noch, so scheint es zumindest, bleibt der Mensch der Maschine in manchen Belangen überlegen. Nehmen wir das für die verbleibende Zeit mit Sprezzatura.

Marcus Schwarze

Marcus Schwarze

Journalist und Berater Digitales. Angelernt, nie ausgelernt bei Behörden, F.A.Z., Reporterfabrik, EA RLP, StoryMachine, Morgenpost, Rhein-Zeitung, HAZ
Koblenz, Germany