Der ungehobene Schatz: Screenshots und Bilder mit Beschreibung

Der ungehobene Schatz: Screenshots und Bilder mit Beschreibung

Täglich Dutzende Dateien speichere ich als Screenshots – fürs Weiterverwenden in Posts, zum Merken und Wiederfinden oder zur Beweissicherung. Die Künstliche Intelligenz (KI) macht daraus jetzt sprechende Dateinamen.

Es sind die kleinen Dinge. „Bildschirmfoto 2024-01-21 um 18.07.56.png“ benennt mein Mac einen Screenshot, den ich just zu dieser Zeit gefertigt habe. Was drin steckt, weiß nur ich, sobald ich die Datei öffne.

Neuerdings benennt Künstliche Intelligenz den Dateinamen vollautomatisch um, sobald ich die Datei markiere und das KI-Programm starte. Daraus wird jetzt „20240121_180756_Banking_Transaktionen_Suchergebnisse“. Das Datum der Aufnahme also plus Uhrzeit sowie Stichwörter zum Inhalt. In diesem Fall geht es um einen Screenshot, der eine irreguläre Abbuchung von meinem Kreditkartenkonto enthält, eine Rücküberweisung aufgrund meines Widerspruchs und eine neuerliche Abbuchung. Eine ärgerliche Sache, die es zu dokumentieren gilt.

Die KI unternimmt mittlerweile vollautomatisch diese Änderungen des Dateinamens. „Keep It Shot“ heißt das Programm dafür. Es überwacht im Hintergrund meinen Screenshot-Ordner. Erscheint dort eine neue Datei, lädt es sie zu OpenAI hoch. Dort analysiert die KI die Inhalte des aufgenommenen Bildes. Ist das reiner Text, so wird der in Stichwörtern zusammengefasst. Die Anwendung kostet einmalig 19 Dollar. Plus Zugang zu OpenAI, was Kosten im Milli-Cent-Bereich erzeugt.

Auch fotografische Inhalte können so zusammengefasst werden. „Businessfrau im Büro“ oder „Fußgänger mit Stadtplan“ interpretiert die KI dann aus den Bildern. Die drei, vier Stichwörter schickt OpenAI zurück an meinen Mac, und das Programm „Keep it Shot“ benennt den zuvor hochgeladenen Screenshot nach meinem gewünschten Muster um. Das Muster lautet: „Translate content to German with German umlauts. Add file creation timestamp in front of file name.“

Wer das will, erstellt einen Automatismus für das Programm „Keep It Shot“: Es überwacht dann den Screenshots-Ordner und benennt die Dateien automatisch um. Auch für Windows ist eine entsprechende Software in der Mache (ich habe sie nicht ausprobiert).

Das Schöne an dem Screenshot-Umbenennungsdienst ist seine Verknüpfung mit OpenAI. Man muss lediglich einen API-Schlüssel von OpenAI hinterlegen, dann wird für jede Screenshot-Analyse GPT-4 genutzt. Wahlweise kann auch Azure OpenAI hinterlegt werden, falls jemand dort Kunde ist. Die Verknüpfung lässt noch mehr erahnen: Theoretisch wäre an dieser Stelle eine Verknüpfung mit einer eigenen KI auf dem eigenen Rechner möglich. Dann verließe kein Screenshot mehr das eigene Haus. Und wie die Entwicklung zeigt, werden eigene KIs und Open-Source-Anwendungen aus diesem Bereich immer leistungsfähiger.

Ich ahne, was Apple und gewiss auch Microsoft demnächst in ihren Systemen noch tiefer einbauen. Die Bildanalyse mit Stichwörtern ist schon heute in Microsoft Word für Bildunterschriften hinterlegt. Da wäre es doch ein Klacks, wenn das künftig auch für Screenshots funktioniert. Ganz zu schweigen von den unseligen IMG_01234-Dateien.

Auf Apple-Rechnern funktioniert schon heute eine Kategorisierung von Fotos nach ihren gezeigten Inhalten. Im Programm „Fotos“ wird mittlerweile jedes Bild untersucht und in Kategorien wie Strand, Wald, Pferd und, und, und einsortiert, je nach Inhalt. Das erleichtert das Wiederfinden von Aufnahmen: Zeig mir das Bild von den Kindern am Strand aus 2017. Zusammen mit der Gesichtserkennung und den Metadaten wie dem per GPS hinterlegten Aufnahmeort werden so auch Bildersammlungen mit 60.000 Fotos locker durchsuchbar.

Man stelle sich das vor für Speicherordner von Unternehmen, Bildarchive, digitale Messis. Es wird plötzlich ein leichtes, jenes eine Bild von der CeBIT vor 20 Jahren wiederzufinden, auf dem eine Standparty gemeinsam mit der Kollegin gefeiert wurde, die jetzt in den Ruhestand geht. Es sind die kleinen Dinge.

Marcus Schwarze

Marcus Schwarze

Journalist, Promptpraktiker, Berater Digitales. Angelernt, nie ausgelernt bei Behörden, F.A.Z., Reporterfabrik, EA RLP, StoryMachine, Morgenpost, Rhein-Zeitung, HAZ
Koblenz, Germany