Pseudo-Fotografien per KI und die sprichwörtlichen 1000 Worte
Teil 2
Bemerkenswert ist die Tendenz der bildgebenden KI, sich beim Bildausschnitt auf Nötiges zu beschränken. Für das Hauptmotiv gilt: Was im Prompt nicht erwähnt oder ...
... beschrieben wird, wird auch nicht gezeigt. Ein Auftrag für ein fotorealistisches Bild einer Person wird in der Regel zu einem Kopfportrait führen. Konkrete Angaben zum gewünschten Kleidungsstil können die KI dazu veranlassen, gerade so viel vom Oberkörper zu zeigen, dass die gewünschte Bekleidung erkennbar wird. Erst mit der Erwähnung von Schuhen oder einer situativen Angabe, z.B. "auf Bank sitzend", ist ein Ganzkörperbildnis zu erwarten.
Abstraktion als Arbeitsprinzip
Eine ähnlich abstrahierende Verarbeitung zeigt sich auch bei der Erscheinungsweise bestimmter Bildelemente. So visualisiert die KI beim Bild einer städtischen Straße mit parkenden Autos, wenn nichts anderes angegeben wird, den Begriff "Auto" im übertragenen Sinn. Im Ergebnis erscheinen Automobile dann oft in einer abstrakten Mischung unterschiedlicher Typ- und Markenmerkmale. Am deutlichsten outeten sich KI-Bilder von Personen bisher durch die fehlerhafte Darstellung der Hände. Das wird allmählich besser. Gelegentlich interpretiert die KI Hände aber immer noch im übertragenen Sinne und erachtet die korrekte Anzahl und die physiognomisch richtige Länge der Finger dabei als unwesentlich. Unrealistische physiognomische Proportionen, ein Ineinanderfließen von Körperteilen, ein korkenzieherartig verdrehter Hals beim Blick über die Schulter oder eine Hand dort, wo ein Fuß sein sollte, erwecken mitunter den Eindruck eines Horrorkabinetts. Oftmals stehen einer fotoähnlichen Wiedergabe auch eine wächserne Wiedergabe der Gesichter junger Frauen oder eine Art Dragan-Effekt, eine überkontrastierte, faltenzerfurchte Darstellung von Männergesichtern, entgegen.
Pseudofotografische Portraits
Die fotorealistischen Leistungen von KI-Tools werden zweifellos besser. Im Rahmen einer iterativen Session mit sehr vielen Ausschussbildern erscheinen vereinzelt überraschend gute Bildergebnisse. Unregelmäßige Hautstrukturen, lebendige Tonwerte, Sommersprossen oder ein kleines Muttermal, die realistische Darstellung von Haaren, Zöpfen und Strähnen oder die Wiedergabe von Schweisströpfchen auf der Haut können eine Annäherung zum fotografierten Portrait erreichen. Auch Lichteffekte, wie ein weich reflektiertes Licht in Innenräumen, ein modellierendes Streiflicht, ein Portraitlicht im Rembrandt-Stil oder die Wiedergabe verschiedener Oberflächen wie Metall, Leder oder Textilien beherrscht die KI mittlerweile beeindruckend gut. Und, ganz selten, gelingt in künstlich generierten Gesichtern sogar ein sympathisches Lächeln, dem man die Künstlichkeit nicht ansieht.
Frei nach dem deutschen Maler Albert Spethmann (1894-1986), der das menschliche Antlitz einmal als "schwierigste und faszinierendste Aufgabe" in der Kunst bezeichnet haben soll,* sind es wahrscheinlich weniger die künstlichen Bildwelten, die die KI vor Herausforderungen stellen. Immerhin entspricht die artifizielle Wirkung dabei der Erwartungshaltung des Publikums. Architektur- und Landschaftsmotive beherrscht die KI dagegen so gut, dass die Abgrenzung zum fotografischen Bild oft schwerfällt. Dagegen mag man annehmen, dass die Erstellung eines Close-Up Portraits mit der realistischen Darstellung von Lichtverläufen auf Wangen, zartem Flaum auf menschlicher Haut, unregelmäßigen Fältchen auf den Lippen, ausdrucksvollen Augen, unregelmäßiger Pigmentierung und detaillierter Darstellung von Wimpern und Haaren eine schwerer zu lösende Aufgabe darstellt. Dies vor allem deswegen, weil es uns hier dank unserer Seh- und Kommunikationsgewohnheiten am leichtesten fällt, Unechtes zu entlarven.
* https://www.sueddeutsche.de/muenchen/wolfratshausen/bad-toelz-der-maler-von-nebenan-1.2676693
Diese Annahme war der Ausgangspunkt für eine Serie von Portraits, bei denen ich versuche, mit einer iterativ erarbeiteten Steuerung der KI-Tools, sukzessive verfeinertem Prompting und einer zum Teil umfangreichen digitalen Nachbearbeitung konkrete Bildideen umzusetzen. Ziel ist herauszufinden, wie weit mir mit einer simulierten klassischen Studiobeleuchtung, wie ich sie früher bei meinen Portraitfotos eingesetzt habe, die Annäherung an einen realfotografischen Eindruck gelingt. Im Mittelpunkt des Interesses steht dabei der stoffliche Kontrast zwischen Hauttönen und der Wirkung von Licht auf Metall-, Leder- oder Textiloberflächen. Der entlarvend geringe Betrachtungsabstand von Kopfportraits dient dem Zweck, eventuelle Artefakte besser erkennen zu können. Der sich daraus ergebende enge Bildausschnitt beschränkt den gewünschten Materialmix auf die Darstellung von Kopfbedeckungen, Kragen, Schmuck oder Masken.
Copyright 2024 by Klaus Schörner / www.bonnescape.de
Digital Artwork unter Verwendung von Midjourney, Lightroom und Photoshop
Beiträge zu ähnlichen Themen:
Kommentar schreiben
Andreas Fein (Donnerstag, 04 April 2024 15:58)
Ein sehr informativer und erleuchtender Einblick in die Materie! Ich bin auf die Galerie gespannt.
Klaus (admin) (Donnerstag, 04 April 2024 18:01)
Danke. Die Galerie füllt sich gerade noch ;-)
Petra Kaiser (Donnerstag, 11 April 2024 12:09)
Sehr schöne Portraits, auch die in der Galerie. Ich hätte Interesse an ein oder zwei Bildern.
Kann man bei dir/bei Ihnen auch Prints bestellen? Welche Größe und Ausführung wäre da möglich und was würde das kosten mit Versand nach Düsseldorf?
LG
Klaus (admin) (Donnerstag, 11 April 2024 17:47)
Hallo Petra,
danke, freut mich dass dir die Arbeiten gefallen. Es gibt hier noch keine Shop-Funktion, ich liefere die Bilder aber auch gern als Print. Möglich sind zur Zeit ungerahmte Vergrößerungen auf Fotopapier (seidenmatt bzw. pearl) oder auf Leinwand im Keilrahmen bis zu einer Größe von 50x50 cm, ggf. auch größer.
Schreib mir gerne über das Kontaktformular deine Vorstellungen und für welche Motive du dich interessierst, ich schicke dir dann ein Angebot.
Liebe Grüße
Klaus
Mariam (Dienstag, 27 August 2024 07:53)
Das Projekt ist interessant, die strategischen Überlegungen finde ich nachvollziehbar und die Bilder sind sehr gut gelungen. Sie wirken wie im Studio fotografiert. Besonders spannend finde ich die Feinheiten in der Beleuchtung und die Angaben zum Verständnis der KI-Bedienung. Aber sind diese nicht nur eine Momentaufnahme und jetzt schon überholt?