Teknologji dhe Inovacion

AI ka mësuar të gjenerojë imazhe që duken si foto të këqija

Dhe për këtë arsye janë edhe më realiste

Gazeta Si – Nëntorin e kaluar, Google zbuloi Nano Banana Pro, versionin më të fundit të modelit të saj të inteligjencës artificiale, i aftë të gjenerojë imazhe bazuar në përshkrime tekstuale.

Modeli menjëherë bëri përshtypje me realizmin dhe saktësinë e tij, madje edhe në gjenerimin e fotografive.

Fotografitë e gjeneruara nga inteligjenca artificiale shpesh kanë një estetikë artificiale lehtësisht të dallueshme, me fytyra dhe sipërfaqe të lëmuara, jo natyrale.

Imazhet e Nano Banana Pro janë më bindëse, sepse ngjajnë me foto reale, me të metat dhe kufizimet e tyre.

Në mënyrë specifike, modeli kopjon karakteristikat tipike të fotografisë me smartphone, e cila mbështetet në lente dhe sensorë më pak të përparuar, duke rezultuar në foto me më pak thellësi dhe kontrast sesa kamerat profesionale.

Realizmi në rritje i arritur nga Nano Banana Pro padyshim që përfaqëson një problem potencial, duke pasur parasysh zbatimin e teknologjive të ngjashme në dezinformata dhe mashtrime, por gjithashtu përfaqëson një hap të rëndësishëm përpara për industrinë.

Ka disa arsye pse fotografitë sintetike (domethënë, të gjeneruara nga AI) zakonisht duken të panatyrshme. E para lidhet me trajnimin e këtyre programeve, të cilat zhvillohen duke analizuar miliona imazhe të të gjitha llojeve, shumë prej të cilave vijnë nga uebi, ku ka shumë imazhe të stilizuara dhe të stokut, zakonisht me një estetikë shumë të shkëlqyeshme.

Një tjetër, është teknika me të cilën trajnohen këto AI, e quajtur difuzion. Pas zhvillimit të programeve të afta për të njohur elementët e një imazhi, zhvilluesit i ekspozojnë ato ndaj përmbajtjes së korruptuar digjitalisht, domethënë, me piksel shtesë që e turbullojnë pamjen e përgjithshme, si efekti i borës në televizorët e vjetër.

Me kalimin e kohës, modeli mëson të njohë dhe heqë këtë “zhurmë” për të rindërtuar imazhin themelor; pasi të ketë mësuar ta bëjë këtë, hapi tjetër është të fillojë nga zhurma e pastër për të gjeneruar një imazh të rastësishëm, i cili për këtë arsye do të jetë jashtëzakonisht i pastër.

Sipas Valentina Tanni, historiane arti dhe autore e librit Antimacchine. Duke mos respektuar Teknologjinë, modele si Nano Banana Pro po “ulin efektin me shkëlqim dhe estetikën hiper-të detajuar, karakteristikat që ne priremi t’i shoqërojmë me imazhe të rreme, të ndërtuara dhe të manipuluara”.

Përhapja e AI-së gjeneruese ka ndryshuar tashmë kriteret që përdorim për të përcaktuar realizmin e një fotografie: “Një imazh i papërsosur, shpesh na duket shumë më real dhe autentik, sepse largon dyshimin për manipulim”.

Silvio Lorusso, shkrimtar dhe autor i librit “The Designer Without Quality”, pajtohet se, vetëm në pak vite, inteligjenca artificiale ka “përmbysur plotësisht idenë tonë të realizmit”.

Përpara këtyre teknologjive, krijimi i një fotografie të mirë kërkonte ndriçim, skena, makina cilësore dhe personel të kualifikuar, si dhe kohë; sot, megjithatë, këto modele ju lejojnë të krijoni imazhe të çdo lloji vetëm në pak sekonda.

Nano Banana Pro demonstron se ekziston një mënyrë tjetër për të rritur fotorealizmin e AI-së: jo duke përsosur detajet anatomike të trupit të njeriut (modelet dihet se kanë vështirësi në paraqitjen e saktë të gishtërinjve, për shembull), por duke imituar mjetet me të cilat bëhen fotografitë.

Kjo përfshin të metat dhe kufizimet e tyre teknike, të tilla si “rezolucioni i ulët, kokrriza digjitale, vinjetimi, syri i kuq e kështu me radhë”, thotë Lorusso.

Sipas Ben Sandofsky, bashkëthemelues i aplikacionit të fotografisë Halide, “Google mund ta ketë anashkaluar luginën e çuditshme”, atë ndjenjë neverie dhe shqetësimi që ndiejmë ndaj robotëve, makinave dhe kukullave që janë si realiste, por jo tërësisht.

Siç shpjegon “The Verge”, Google nuk është i vetmi që ofron modele të afta për ta bërë këtë: Meta AI dhe Adobe Firefly gjithashtu u lejojnë përdoruesve të menaxhojnë “intensitetin vizual” të imazheve, duke i bërë ato më pak të shndritshme dhe më “të papërsosura”.

E njëjta gjë ndodh edhe në gjenerimin e videove. Dy modelet kryesore në industri, Sora 2 i OpenAI dhe Veo 3 i Google, janë të afta të gjenerojnë video me kokrriza dhe rezolucion të ulët, sikur të ishin xhiruar nga pajisje me cilësi të ulët.

Janë pikërisht këto lloje përmbajtjesh sintetike që përdoruesit i ngatërrojnë më shpesh me të vërteta, siç demonstrohet nga rasti i fundit i një videoje virale që imitonte regjistrimet e kurtheve të kafshëve gjatë natës.

Përshtati: Gazeta “Si”


Copyright © Gazeta “Si”


Më Shumë