Apple put ka veštačkoj inteligenciji: kompanija objavila AI model za uređivanje slika na osnovu tekstualnih komandi

Novi AI model koji može da uređuje slike na osnovu tekstualnih komandi ubrzava Apple put ka veštačkoj inteligenciji u kome je kompanija do sada bila tiha

Apple put ka veštačkoj inteligenciji: kompanija objavila AI model za uređivanje slika na osnovu tekstualnih komandi

Iako nije jedan od vodećih igrača u svetu veštačke inteligencije danas, novi Apple otvoreni AI model za uređivanje slika može doprineti ovoj oblasti. Na taj način Apple put ka veštačkoj inteligenciji se poboljšava, a model nazvan MLLM-Guided Image Editing (MGIE) koristi multimodalne velike jezičke modale za tumačenje tekstualnih komandi pri uređivanju slika. Drugim rečima, alat ima sposobnost uređivanja fotografija na osnovu teksta koji korisnik unese.

Iako ovo nije prvi alat koji to može, „ljudske instrukcije su ponekad previše kratke da bi trenutno dostupne metode mogle da ih uhvate i prate“, piše u dokumentaciji projekta. Apple je razvio MGIE sa istraživačima sa Univerziteta Kalifornija u Santa Barbari.

Veliki jezički modeli imaju moć da transformišu jednostavne ili nejasne tekstualne komande u detaljnije i jasnije instrukcije koje sam uređivač fotografija može da prati. Na primer, ukoliko korisnik želi da uredi fotografiju pice sa feferoni papričicama, tako da ona izgleda zdravije, veliki jezički modeli to mogu da interpretiraju kao „dodavanje povrća“ i urede fotografiju u skladu sa tim.

Osim pravljenja glavnih promena na fotografijama, MGIE takođe može da iseče, menja veličinu i rotira fotografije, kao i da poboljša njihovu svetlinu, kontrast i balans boja, sve putem tekstualnih komandi. Takođe može da uređuje specifična područja fotografije i, na primer, da modifikuje kosu, oči i odeću osobe na njoj, ili da ukloni elemente u pozadini, čemu će se verovatno obradovati mnogi Instagram korisnici.

Apple je model objavio na GitHub platformi, ali zainteresovani trenutno mogu isprobati samo demo koji je trenutno dostupan na Hugging Face Spaces u okviru Git respozitorijuma.

Kompanija još nije saopštila da li planira da koristi ono što nauči iz ovog projekta kao alat ili funkciju koju može ugraditi u neki od svojih proizvoda, kao što je iPhone, na čiju sledeću generaciju zvanično stižu stižu funkcije veštačke inteligencije.

Ostani u toku

Prijavi se na newsletter listu i jednom nedeljno cemo ti poslati email sa najnovijim testovima i vestima iz sveta tehnologije.

Hvala!

Uspešno ste se prijavili na na naš newsletter! Proverite vaš email nalog kako bi potvrdili prijavu.

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji
Možda vam se svidi