U sredu je kompanija Meta objavila svoj AI model pod nazivom Segment Anything Model (SAM) koji može da identifikuje pojedinačne objekte na slikama i video snimcima, čak i one na koje se ne susreću tokom trenažnog procesa.
Prema blog postu, SAM je model segmentacije slika koji može da odgovori na tekstualne upite ili klikove korisnika tako da izoluje određene objekte unutar slike. Segmentacija slike je proces koji uključuje podelu slike na više segmenata ili oblasti, od kojih svaka predstavlja određeni objekat ili interesantnu oblast.
Svrha segmentacije slike je da olakša analizu ili obradu slike. Meta takođe vidi da je tehnologija korisna za razumevanje sadržaja veb stranica, aplikacija proširene stvarnosti, uređivanje slika i pomoć naučnim studijama automatskim lokalizovanjem životinja ili objekata za praćenje na video snimku.
Stvaranje tačnog modela segmentacije „zahteva visoko specijalizovan rad tehničkih stručnjaka sa pristupom infrastrukturi za obuku AI i velikim količinama pažljivo obeleženih podataka u domenu“. Stvaranjem SAM-a, Meta se nada da će “demokratizovati” ovaj proces smanjenjem potrebe za specijalizovanom obukom i ekspertizom, za šta se nada da će podstaći dalja istraživanja u ovoj oblasti.
Pored SAM-a, Meta je sastavila skup podataka koji naziva “SA-1B” koji uključuje 11 miliona slika licenciranih od “velike foto kompanije” i 1,1 milijardu maski za segmentaciju koje je proizveo njihov model segmentacije. Meta će učiniti SAM i njegov skup podataka dostupnim u istraživačke svrhe pod Apache 2.0 licencom.
Kod je trenutno dostupan na GitHub-u, a Meta je kreirala besplatnu interaktivnu demonstraciju svoje tehnologije segmentacije. U demonstraciji, posetioci mogu da otpreme fotografiju i koriste „Hover & Click“ (odabir objekata mišem), „Box“ (odabir objekata u okviru za izbor) ili „Everything“ (pokušava da automatski identifikuje svaki objekat u slika).
Iako tehnologija segmentacije slika nije nova, SAM je vredan pažnje po svojoj sposobnosti da identifikuje objekte koji nisu prisutni u njegovom skupu podataka za obuku i njegovom delimično otvorenom pristupu. Takođe, izdavanje SA-1B modela moglo bi da izazove novu generaciju aplikacija za kompjuterski vid, slično kao što je Meta LLaMA jezički model već inspirisao nove projekte.
Kako prenosi Rojters, izvršni direktor kompanije Meta, Mark Zukerberg je naglasio važnost inkorporiranja generativne veštačke inteligencije u aplikacije kompanije ove godine. Iako Meta još nije objavio komercijalni proizvod koji koristi ovu vrstu AI, ranije je koristio tehnologiju sličnu SAM-u interno sa Facebook mrežom, za označavanje fotografija, moderiranje sadržaja i određivanje preporučenih postova na Facebook i Instagram društvenim mrežama.
Najava kompanije Meta dolazi usred žestoke konkurencije među velikim tehnološkim kompanijama da dominiraju prostorom veštačke inteligencije. ChatGPT jezički model kompanije OpenAI koji podržava Microsoft privukao je široku pažnju u jesen 2022. godine, što je izazvalo talas investicija koje bi mogle definisati sledeći veliki poslovni trend u tehnologiji izvan društvenih medija i pametnih telefona.
Nema komentara 😞
Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!
Pridruži se diskusiji