Tutorial DALL-E 2 și 3, aplicația AI care generează imagini din text

Aplicația cu inteligența artificială generativă pentru imagini DALL-E 3, dezvoltată de OpenAI (care dezvoltă și Chat GPT), este și mai puternică și mai creativă.

În acest articol găsești un tutorial în care explic cum să folosești aplicația DALL-E ca să generezi poze, imagini, ilustrații sau desene pornind de la un simplu text.

Ce este DALL-E

Înainte de a-ți arăta cum să folosești DALL·E, trebuie mai întâi să explic ce este acesta.

DALL·E este un algoritm de inteligență artificială, dezvoltat de OpenAI, care poate genera imagini pe baza descrierilor textuale, având capacitatea de a învăța concepte legate de spațiu și timp.

Printre diversele funcții pe care le oferă, se numără posibilitatea de a face modificări realiste contextului imaginilor generate cu DALL·E sau imaginilor încărcate pe platformă, permițând astfel crearea mai multor variante inspirate de imaginea „originală”.

Gratuit, poți să folosești doar versiunea DALL-E 2, dar atenție, funcționează pe un sistem de credite: pentru a fi mai precis, primești 50 de credite la înregistrare și apoi 15 credite gratuite în fiecare lună ulterioară.

Fiecare credit oferă posibilitatea de a face o solicitare originală către DALL·E (prompt, în jargonul specific), iar fiecare prompt generează patru imagini.

De asemenea, cu un singur credit, poți efectua o solicitare de modificare/variație, care returnează trei imagini.

Dacă ai nevoie de mai multe credite, acestea pot fi cumpărate, cu prețuri începând de la 115 credite/15 dolari (ceea ce echivalează cu 460 de imagini generate).

DALL-E 3, cea mai nouă versiune a aplicației, a fost integrată în ChatGPT-4 și este disponibilă doar utilizatorilor care au cumpărat abonamentul ChatGPT Plus.

Numărul de imagini pe care le poți genera în prezent pe DALL·E 3 este nelimitat.

Cu toate acestea, este important să fii atent, deoarece GPT-4 – modelul cel mai „creativ” de ChatGPT, care a integrat DALL·E 3 – acceptă de la fiecare utilizator un maxim de 50 de mesaje la fiecare trei ore.

La sfârșitul acestui tutorial o să scriu și o modalitate ca să folosești DALL-E 3 și ChatGPT-4 gratuit.

Cum să folosești DALL-E pentru generarea de imagini din text

Iau pe rând cele două versiuni, deci mai întâi iată cum să folosești generatorul AI de imagini DALL-E 2.

DALL-E 2

Ca să folosești DALL-E 2 gratis mai întâi trebuie să accesezi platforma la adresa openai.com/dall-e-2 și să te autentifici.

Dacă cumva ți-ai creat cont pentru ChatGPT poți să te autentifici cu acele date, dacă nu trebuie să creezi un cont nou.

După autentificare o să vezi o interfață simplă ca în poza de mai jos.

DALL-E 2, generator gratuit de imagini din text

În câmpul evidențiat cu roșu scrie promptul tău și apoi apasă ”ENTER” pe tastatură sau fă click pe ”Generate”

Un prompt nu este altceva decât comanda/solicitarea scrisă pe care o dai aplicației.

Din testele mele am observat că nu prea înțelege limba română, deci cel mai bine introduci prompturi în engleză, în acest mod aplicația îți va oferi răspunsuri corecte.

Eu de exemplu i-am scris promptul ”an oil painting with a vase of mountain flowers”, iar rezultatul este cel din poza de mai jos.

Imagini generate cu aplicația AI DALL-E

Odată ce ai generat imaginea, fă click pe simbolul (…) care apare când treci cu mouse-ul peste acesta (îl poți vedea în colțul din dreapta sus al fiecărei imagini generate) și, dacă dorești, generează alte versiuni ale imaginii selectând opțiunea Generate variations.

Selectând opțiunea Edit, poți accesa unele instrumente pentru retușarea fotografiilor, prin intermediul cărora poți, de exemplu, șterge fundalul (pictograma gumă) și suprapune alte imagini (pictograma cu +).

Odată mulțumit de rezultatul obținut, ca să descarci imaginea fă click pe butonul care reprezintă o săgeată îndreptată în jos (în colțul din dreapta sus) sau selectează opțiunea Download (după ce ai făcut click pe butonul (…) în dreapta sus a previzualizării imaginii respective).

Creditele disponibile le poți verifica accesând meniul din dreapta sus (cele 3 puncte orizontale).

Credite DALL-E

Dacă ai nevoie de mai multe credite le poți cumpăra făcând click pe ”Buy credits”.

DALL-E 3

După cum am scris deja la începutul acestui tutorial, DALL-E 3 a fost integrat în ChatGPT-4, deci doar cine plătește un abonament ”Plus” are acces la aplicație.

Ca să folosești DALL-E 3 deschide ChatGPT-4, alege din dreapta ”Explore” și în fereastra care se deschide alege DALL-E 3, ca în poza de mai jos.

Chat GPT 4 și DALL-E 3

După ce ai ales să folosești aplicația DALL-E 3, interfața arată ca în imaginea de mai jos.

Interfața DALL-E 3

În câmpul evidențiat cu roșu, unde este scris ”Message DALL-E” scrie promptul tău și apoi în câteva secunde aplicația îți va crea imaginile dorite.

Iată un exemplu mai jos în care am cerut aplicației DALL-E să creeze o imagine cu o pisică alb cu negru.

Aplicație care generează imagini din text DALL-E

Spre deosebire de versiunea 2, DALL-3 înțelege mai bine limba română, deci nu trebuie să scrii prompturile în engleză ca să te faci mai bine înțeles.

Dar, din nenumăratele teste pe care le-am făcut, nu e rar ca aplicația să-ți răspundă în engleză.

Ce nu-mi place la DALL-E 3 e faptul că, spre deosebire de ce se întâmplă pe Midjourney și cu anteriorul DALL·E 2, imaginile propuse de AI sunt doar două și nu se pot crea variații pornind de la o imagine deja generată.

Astfel, nu este posibil să selectezi fotografia sau ilustrația care îți place cel mai mult și să ceri aplicației DALL·E 3 să genereze un nou set de imagini pornind de la aceasta.

Pentru a modifica o creație, în concluzie, trebuie să furnizezi AI-ului o nouă solicitare sub forma unui text.

Ceea ce m-a impresionat imediat la DALL·E 3 este că inteligența artificială reinterpretează promptul furnizat de utilizator pentru a genera alternative diferite – de exemplu – ale aceleiași scene.

Mi-am dat seama de acest lucru pentru că AI-ul oferă lângă fiecare dintre creațiile sale promptul care a fost folosit pentru a le produce.

Și acesta este întotdeauna diferit de promptul meu.

De exemplu, ca să generez cele două imagini cu pisica eu am scris în câmpul dedicat doar ”o pisică alb cu negru”.

Iată mai jos promptul care a generat de fapt acele două imagini pe care le-am cerut eu.

Aplicația AI gratuită care creează poze din text

După cum se vede, promptul este mai detaliat față de al meu, detalii pe care aplicația le-a adăugat din proprie inițiativă pentru a genera o imagine mai completă.

În orice caz, ca și în cazul aplicației ChatGPT, cu cât un prompt este mai detaliat, cu cât oferi mai mult context, cu atât vei primi răspunsuri mai bune din punct de vedere calitativ.

Calitatea imaginilor create de aplicația AI DALL-E 3

Acum să analizăm calitatea imaginilor generate de DALL-E 3.

Poză cu o femeie frumoasă generată de AI DALL-E

Iată mai jos promptul care a generat această poză și cealaltă versiune oferită de DALL-E.

Generator AI de imagini gratuit DALL-E

La prima vedere, creațiile aplicației DALL·E 3 sunt impresionante.

Fotografiile par realiste, scenele sunt bine definite, ilustrațiile sunt bine realizate, iar grafica vectorială – pentru proiectarea de logouri, ilustrații, desene tehnice, diagrame, grafice și multe alte tipuri de imagini unde este important să se mențină calitatea și precizia – pare în multe cazuri perfectă.

Dar punctul este că – comparativ cu creațiile unor instrumente similare, cum ar fi Midjourney – imaginile de la DALL·E 3 sunt „prea” impresionante.

Senzația este aceea de a avea de-a face constant cu fotografiile lucioase dintr-o revistă.

Chiar și când în prompt se cere clar o „poză realistă”, sau se încearcă să se specifice tipul de cameră foto sau chiar de peliculă pe care AI-ul trebuie să o imite, rezultatul este o fotografie care pare că a fost deja aplicat un filtru evident.

Cele două fotografii create sunt credibile și extrem de frumoase la vedere, dar dacă sunt descărcate și mărite – nu este posibil să faci zoom direct prin DALL·E 3, și acesta, în opinia mea, este o limitare – se observă cât de „zgomotoase” sunt acestea.

Și acest lucru nu este bun.

„Zgomotul”, într-o fotografie digitală, este o distorsiune care poate părea similară cu granulele care apar ca punctulețe vizibile pe suprafața imaginii.

Zgomotul digital poate degrada calitatea imaginii, făcând detaliile mai puțin clare și compromițând fidelitatea culorilor.

„Zgomotul”, în concluzie, este un element care, în fața creațiilor DALL·E 3, nu mă face întotdeauna să spun „Aceasta pare cu adevărat o fotografie”.

Când am întrebat aplicația AI de ce nu face pozele să pară mai realistice, mi-a răspuns, citez: ”Tehnologiile actuale de AI, inclusiv DALL-E, au limitări în ceea ce privește procesarea și generarea de detalii extrem de fine. DALL-E este proiectat să fie creativ și să genereze imagini unice. Acest lucru poate duce la compromisuri între creativitatea artistică și realismul absolut.”

Teoria care predomină este alta: efectul lucios despre care vorbim ar fi o contramăsură concepută de OpenAI pentru a evita imaginile inconfortabile – adică prea credibile – care ar putea fi folosite pentru a produce dezinformare sau pentru a aduce prejudicii persoanelor, unei minorități sau unei întregi societăți.

Cum poți să utilizezi DALL-E 3 gratis

Așa cum am promis la începutul articolului, iată o metodă legală să utilizezi DALL-E gratis, fără să plătești abonament la ChatGPT Plus.

Iată ce trebuie să faci:

  1. Accesează Bing.com sau instalează aplicația Bing pe telefon de pe Google Play sau App Store
  2. Autentifică-te sau dacă nu ai cont creează unul nou și apoi autentifică-te pe Bing
  3. Dacă intri cu calculatorul din meniul de sus alege ”Discutați pe chat”, iar dacă ai ales să instalezi aplicația pe telefon alege din meniul de jos ”Copilot”.
  4. Dacă ai intrat cu calculatorul, în fereastra care se deschide alege stilul de conversație ”Mult mai creativ”, iar dacă ai ales să folosești aplicația pe telefon alege GPT-4.

Gata, poți să folosești ChatGPT-4 gratis plus aplicația AI pentru imagini DALL-E.

Lasă un comentariu