2. Sep. 2023 4 min read

Neue Maschinen unter der KI-Motorhaube

Illustration: KI-generiert/Midjourney/Schwarze. Prompt: siehe Alt-Text.

Zum Beispiel Dante AI: Neben GPT-4 von OpenAI und dem Vorgängermodell GPT-3.5-Turbo können neuerdings auch das Open-Source-Modell Falcon LLM und das Modell LlaMA 2 von Facebook-Anbieter Meta hinterlegt werden.

Zum Beispiel Perplexity AI: Hier kann statt GPT-4 von OpenAI wahlweise auch das Modell Claude 2 oder ein eigenes Modell von Perplexity eingerichtet werden.

Hinzu kommt, dass GPT-4 nach Beobachtung von Fachleuten zuletzt an Qualität eingebüßt hat. So konnten Anwaltskanzleien vor vier, fünf Monaten der Maschine durchaus brauchbare Vorlagen fürs rechtskonforme Internet-Impressum oder eine Datenschutzerklärung entlocken. Mittlerweile produziert GPT-4 häufiger Müll.

Auch mir erging es zuletzt häufiger so: Einst gut funktionierende Prompts fürs Zusammenfassen von Sachverhalten in meinem, der Maschine antrainierten Duktus lassen nun häufiger Anforderungen offen. Es half, auf GPT-3.5 statt 4 zu wechseln.

GPT-4 mit nachlassender Qualität

Die nachlassende Qualität von GPT-4 bestätigt in Teilen eine Studie der Universitäten Stanford und Berkeley: In drei von vier getesteten Feldern nahm die Leistung zwischen März und Juni ab. Konnte die Maschine im März noch 97,6 Prozent an Primzahlen erkennen, waren es im Juni nur noch 2,4 Prozent.

Die KI-Welt wird somit komplizierter.

Nun könnte man schlussfolgern, dass die Vielzahl aus Gagafragen aus aller Welt bei GPT-4 in den vergangenen Monaten für Verwirrung und Durcheinander sorgt. Doch hat Open AI stets betont, dass die Chatverläufe aus Datenschutzgründen nicht in das Modell einfließen. Wahrscheinlicher ist, dass die Macher ihr Modell weiterentwickeln und vor allem Rechenzeit pro Anfrage einsparen – nicht immer zum Besten.

Wie einst in der Schrauberszene für Autos tunen heute Enthusiasten ihre zusammengeklickten KI-Maschinen, bauen etwa ein anderes Sprachmodell als GPT-4 als neuen Motor ein. Wie sich die Motoren unterscheiden, erschließt sich bei den merkwürdigen Namen wie LlaMA und Falcon allerdings nur Spezialisten. Schrauben dann zusätzlich die Macher von GPT-4 im Hintergrund an den Parametern, ist guter Rat teuer: Warum schwankt die Qualität der Antworten?

Die Ingenieure bei OpenAI halten sich mit Antworten dazu eher zurück. Doch scheint der Markt sich neu zu orientieren: Der Traffic auf der Webseite openai.com ging laut Similarweb von Mai (1,9 Milliarden Visits) bis Juli (1,5 Milliarden) deutlich zurück.

Wer will, baut sich vielleicht lieber auf dem eigenen Rechner eine eigene KI nach, dafür gibt es die Anwendung GPT4All. Auch hier können GPT-4 und 3.5, aber auch LlaMA 2 und andere Modelle hinterlegt werden.

Wer sind Sie und was wollen Sie?

Hinzu kommen bei den kommerziellen Diensten Perplexity und Dante AI vorzugebende Randumstände, an denen sich die jeweiligen KIs orientieren sollen. Beim herkömmlichen GPT-4 füllt man dafür zwei Felder aus, in denen man zunächst die eigene Rolle („Ich bin CEO und brauche klare, pointierte Antworten, auch Hinweise auf mögliche fehlerhafte Entscheidungen“) und dann die Wünsche an die Antworten formuliert („Genaue Antworten, erfinde nichts“).

Bei Perplexity AI wird das ausführlicher. Die Maschine möchte Infos über den eigenen Standort, in welcher Sprache zu antworten ist, eigene Hobbys und Interessen, den Beruf und künftige Ziele.

Perplexity gibt dadurch genauere Antworten, die auf den Fragenden besser abgestimmt sind. Hinzuschaltbar ist außerdem ein „Copilot“: Dann antwortet Perplexity nicht einfach drauflos, sondern stellt durchaus intelligente Verständnisfragen. Oder schaut im Internet nach.

Das Nutzerinterface ist dabei gewöhnungsbedürftig. So wird fürs Zusammenfassen eines längeren Textes zurückgefragt, welchen thematischen Schwerpunkt die Zusammenfassung haben soll – und macht auch gleich kommaseparierte Vorschläge. Will man dann zwei, drei Schwerpunkte auswählen, verschwinden sie beim Anklicken und müssen manuell eingetippt werden – lästig.

Die Maschine schaut selbst im Internet nach

Interessant ist Perplexity aber auch deshalb, weil es von Haus aus Internetrecherchen zum Beantworten anstellen kann. Die Quellen werden angegeben. Auch ist es möglich, eine Datei hochzuladen und gezielt Fragen dazu zu beantworten. „Worum geht es in dem Video?“ – die Frage samt benannter YouTube-Adresse bringt die Maschine zu einer ordentlichen Zusammenfassung; wenngleich sie auch Dinge aus anderen Quellen hineinmengt, dies aber meist transparent macht.

Perplexity kostet wie GPT-4 20 Dollar im Monat. Voreingestellt ist die Nutzung der eigenen Chatverläufe durch das Unternehmen dahinter, um das Perplexity-Sprachmodell zu verbessern. Das kann man abschalten.

Insgesamt bietet Perplexity über GPT-4 hinausgehende Funktionen wie die Alternative Claude 2 als Sprachmodell, das viel längere Prompts erlaubt, und die schnelle Live-Suche auf Internetseiten. Beim alten GPT-4 gelingt Vergleichbares nur mit Plugins.

Sind Perplexity und Dante damit Aspiranten auf die Nachfolge oder Wachablösung von GPT-4? Nein, dazu fehlen ihnen weitgehend die eigenen Trainingsdaten. Doch ist der simple Austausch des Motors auch von fremden Anbietern unter der Haube etwas, das ChatGPT nicht bietet. Und dann ist auch noch die Funktion „Advanced Data Analysis“ bei GPT-4, die das Hochladen eigener Dokumente erlaubt.

Der Markt wird unübersichtlich

Die Funktionalitäten der KIs werden weiter rasant erweitert. Der Markt wird für Laien zusehends unübersichtlich. Rund 7.500 KI-Dienste versammelt die „Übersicht“ namens There's an AI for that. Was da jeweils unter der Motorhaube steckt und Erfolg hat, muss der Markt sichten und richten.

Und da haben wir bisher nicht über weiterhin agierende große alternative Dienste wie von Google („Bart“ und „Duet AI“) und der angeblichen europäischen Alternative Aleph Alpha aus Heidelberg gesprochen. Für Duet AI habe ich meine Freischaltung zum Testen beantragt, bei Aleph Alpha befand ich die Antwortqualität nach einem Test auf deren Spielwiese nicht konkurrenzfähig. Die Ansprüche steigen.

Marcus Schwarze

Journalist und Berater Digitales. Angelernt, nie ausgelernt bei Behörden, F.A.Z., Reporterfabrik, EA RLP, StoryMachine, Morgenpost, Rhein-Zeitung, HAZ

Koblenz, Germany

GPT-4 mit nachlassender Qualität

Wer sind Sie und was wollen Sie?

Die Maschine schaut selbst im Internet nach

Der Markt wird unübersichtlich

Marcus Schwarze

Comments ( )

You might also like...

Comments ()