web analytics
dall-e, AI, inteligenta artificiala

Generatoarele de imagini cu inteligență artificială DALL-E și Midjourney vor ucide fotografia?

Parteneri

Una dintre cele mai discutate evoluții din lumea fotografiei și a artei este popularitatea tot mai mare a generatoarelor de imagini bazate pe software și alimentate de inteligența artificială (AI). Cele mai populare dintre aceste generatoare automate de imagini AI sunt Midjourney și DALL-E, ambele disponibile online, cu unele funcții oferite gratuit.

Pentru a utiliza Midjourney sau DALL-E (și vreo alte șase produse similare existente), tot ce trebuie să faceți este să tastați o scurtă descriere a ceea ce doriți ca software-ul să creeze într-o căsuță promptă. De exemplu, scrieți fraza „peisaj de iarnă înzăpezit, cu cerbi care trec lăsând urme în zăpadă”, așteptați câteva secunde, iar software-ul vă va oferi patru interpretări artistice diferite a ceea ce ați scris. Unele vor fi probabil mai mult ilustrative, în timp ce altele vor fi fotorealiste. Altele vor fi de-a dreptul suprarealiste.

Dacă doriți rezultate și mai precise, puteți încărca o imagine, cum ar fi o fotografie sau o ilustrație, iar software-ul va „interpreta” imaginea cu propria versiune generată de inteligența artificială. În timp ce unele dintre randări pot fi destul de îngrozitoare, altele sunt surprinzător de bune. De fapt, o astfel de ilustrație produsă de AI chiar a câștigat recent un concurs de artă, spre consternarea altor artiști.

Zach Sutton
Zach Sutton

Dacă vă simțiți puțin înfiorat de toate acestea, nu sunteți singurul. Cu toate acestea, un fotograf care este intrigat de potențialul acestui software este Zach Sutton de la Lensrentals, care este, de asemenea, un colaborator al Digital Photo Pro. Sutton a decis recent să pună la încercare Midjourney și DALL-E, scriind descrierile unor fotografii ale sale în căsuțele lor de dialog și văzând cât de aproximativ pot reda imaginile originale.

Sutton a scris despre această experiență recent pe blogul Lensrentals într-un post provocator intitulat „Is AI Art Generation Going to Destroy Art as We Know It?” (Generarea artei prin AI va distruge arta așa cum o știm?).

„Având în vedere că Midjourney și DALL-E sunt cele două instrumente de generare a AI mult mai populare, am decis să le testez pe fiecare dintre ele folosind o selecție aleatorie de imagini din portofoliul meu”, a explicat Sutton.

„Extragând șase imagini din diverse lucrări ale mele de-a lungul anilor, le-am dat atât lui DALL-E, cât și lui Midjourney o serie de fraze care descriu munca pe care o vor imita. De acolo, am selectat cea mai bună randare dintre cele patru generate de instrumentele de generare a AI. Acest lucru ar trebui să vă ofere o idee de bază despre cum arată arta lor și ce capacități oferă. Rezultatele celor șase imagini și sugestii sunt prezentate mai jos.”

Fără a dezvălui prea multe (ar trebui să citiți cu adevărat postarea sa originală pentru a vedea toate rezultatele), Sutton a ieșit impresionat de cât de bine s-au descurcat cele două generatoare de imagini AI, în ciuda unor rezerve.

„Deși arta vorbește de la sine, m-am trezit foarte impresionat de unele dintre randări, în special de munca creată de DALL-E”, a scris el. „Unele dintre lucrări, dându-le doar câteva fraze au ieșit uimitor de precise. Ambii subiecți par să se lupte cu ochii și buzele, dar să creezi arta atât de repede cum o face este cu siguranță impresionant.”

Prima fotografie furnizată de Sutton VS imaginile generate AI

zach sutton, imagini ai, dall-e

În acest prim test, Sutton a selectat o imagine pe care a fotografiat-o cu o femeie cu părul roșcat (mai sus) și apoi a solicitat celor două Generatoare de Imagini AI următorul text pentru a vedea dacă pot reproduce fotografia sa: „Fotografia de frumusețe a unui model tânăr roșcat cu buze roșii care zâmbește la cameră, ușor întors într-o parte, cu fața în centrul atenției. Părul flutură ușor în vânt”.

După cum puteți vedea, inteligența artificială a Midjourney a făcut o treabă decentă cu redarea portretului roșcat al lui Sutton, dar imaginea automată a lui DALL-E a fost chiar mai aproape de fotografia originală, creând o fotografie de frumusețe mai fotorealistă, cu părul ei părând a fi suflat de vânt.

A doua fotografie furnizată de Sutton VS imaginile generate AI

zach sutton, imagini ai, dall-e

Sutton a selectat una dintre imaginile sale astrofotografice pentru cea de-a doua fotografie, pe care o puteți vedea în partea de sus a imaginilor de mai sus. Pentru căsuța de text, el a scris următoarea descriere a imaginii în cele două generatoare de imagini AI: „ultra-fotorealistic, fotografie a Căii Lactee, siluete de copaci în prim-plan, culori albastre.”

Deși nici DALL-E, nici Midjourney nu au surprins cu adevărat scena fotografiei originale a lui Sutton, acestea sunt imagini decente ale cerului de noapte. Interpretarea Midjourney este cea mai atrăgătoare dintre cele două, dar mai puțin realistă.

A treia fotografie furnizată de Sutton VS imaginile generate AI

zach sutton, imagini ai, dall-e

Pentru cea de-a treia fotografie, pe care o puteți vedea în partea de sus a grupării de mai sus, Sutton a scris următorul mesaj în cele două generatoare de imagini AI: „o fată tânără blondă fotorealistă care zâmbește, așezată în fața unui spalier alb și a unor tufișuri verzi.”

În opinia mea, acestea au fost cele mai puțin reușite interpretări ale fotografiei originale a lui Sutton. Deși au obținut majoritatea drepturilor elementelor, rezultatele finale nu au fost atrăgătoare, ilustrația Midjourney arătând aproape diabolic. În special, dinții ciudați ai fetei și zâmbetul înfiorător sunt neliniștitoare, iar pe mine m-a frapat cămașa ei aproape ca o cămașă de forță.

A patra fotografie furnizată de Sutton VS imaginile generate AI

zach sutton, imagini ai, dall-e

Cea de-a patra fotografie a lui Sutton este o fotografie artistică a unor sticle de lac de unghii. Pentru îndemnul la acțiune a scris următoarele: „Fotografie de ansamblu a cinci sticle de lac de unghii pe fundal alb. lac de unghii care se revarsă din fiecare sticlă”.

Ambele generatoare de imagini cu inteligență artificială au făcut o treabă bună cu randările lor bazate pe textul de îndemn. Deși niciuna dintre ele nu seamănă cu imaginea originală a lui Sutton, ilustrația Midjourney este destul de drăguță, iar randarea DALL-E arată ca ceva ce ai putea vedea într-o reclamă reală.

A cincea fotografie furnizată de Sutton VS imaginile generate AI

zach sutton, imagini ai, dall-e

Cea de-a cincea fotografie a lui Sutton este un portret izbitor al unui bărbat cu barbă, cu o iluminare complexă și capricioasă. Pentru îndemnul de descriere a imaginii, el a scris: „fotografie a unui bărbat cu barbă mare care se uită în altă parte, cu o lumină albastră pe față, pe un fundal violet”.

Reprezentarea lui Midjourney arată ca un personaj bizar dintr-un joc video. Creația lui DALL-E arată, de asemenea, ca și cum ar putea fi dintr-un joc video, dar amintește în mod straniu de fotografia originală. În special, barba completă, urechea și partea laterală a tunsorii par să imite fotografia lui Sutton, ceea ce este cu atât mai impresionant cu cât rezultatul se bazează doar pe descrierea textului lui Sutton.

A șasea fotografie furnizată de Sutton VS imaginile generate AI

zach sutton, imagini ai, dall-e

Pentru cea de-a șasea fotografie a lui Sutton, care este un prim-plan al unei perechi de buze roșii lucioase, a scris următoarele în căsuța de dialog pentru cele două generatoare de imagini AI: „fotografie cu buze roșii lucioase ușor deschise”.

După cum puteți vedea, randarea DALL-E bazată pe acest text este apropiată, dar nu la fel de clară sau senzuală ca imaginea originală a lui Sutton. Redarea Midjourney, la fel ca majoritatea rezultatelor sale, este mai ilustrativă și mai puțin precisă.