Meta Segment Anything je AI model koji može da izoluje i izdvoji objekte sa slika i video snimaka

U sredu je kompanija Meta objavila svoj AI model pod nazivom Segment Anything Model (SAM) koji može da identifikuje pojedinačne objekte na slikama i video snimcima, čak i one na koje se ne susreću tokom trenažnog procesa.

Prema blog postu, SAM je model segmentacije slika koji može da odgovori na tekstualne upite ili klikove korisnika tako da izoluje određene objekte unutar slike. Segmentacija slike je proces koji uključuje podelu slike na više segmenata ili oblasti, od kojih svaka predstavlja određeni objekat ili interesantnu oblast.

Svrha segmentacije slike je da olakša analizu ili obradu slike. Meta takođe vidi da je tehnologija korisna za razumevanje sadržaja veb stranica, aplikacija proširene stvarnosti, uređivanje slika i pomoć naučnim studijama automatskim lokalizovanjem životinja ili objekata za praćenje na video snimku.

Stvaranje tačnog modela segmentacije „zahteva visoko specijalizovan rad tehničkih stručnjaka sa pristupom infrastrukturi za obuku AI i velikim količinama pažljivo obeleženih podataka u domenu“. Stvaranjem SAM-a, Meta se nada da će “demokratizovati” ovaj proces smanjenjem potrebe za specijalizovanom obukom i ekspertizom, za šta se nada da će podstaći dalja istraživanja u ovoj oblasti.

Pored SAM-a, Meta je sastavila skup podataka koji naziva “SA-1B” koji uključuje 11 miliona slika licenciranih od “velike foto kompanije” i 1,1 milijardu maski za segmentaciju koje je proizveo njihov model segmentacije. Meta će učiniti SAM i njegov skup podataka dostupnim u istraživačke svrhe pod Apache 2.0 licencom.

Kod je trenutno dostupan na GitHub-u, a Meta je kreirala besplatnu interaktivnu demonstraciju svoje tehnologije segmentacije. U demonstraciji, posetioci mogu da otpreme fotografiju i koriste „Hover & Click“ (odabir objekata mišem), „Box“ (odabir objekata u okviru za izbor) ili „Everything“ (pokušava da automatski identifikuje svaki objekat u slika).

Segment Anything Multi Mask — Segment Anything odabir elemenata slike

Segment Anything Everything — Segment Anything odabir elemenata slike

Iako tehnologija segmentacije slika nije nova, SAM je vredan pažnje po svojoj sposobnosti da identifikuje objekte koji nisu prisutni u njegovom skupu podataka za obuku i njegovom delimično otvorenom pristupu. Takođe, izdavanje SA-1B modela moglo bi da izazove novu generaciju aplikacija za kompjuterski vid, slično kao što je Meta LLaMA jezički model već inspirisao nove projekte.

Kako prenosi Rojters, izvršni direktor kompanije Meta, Mark Zukerberg je naglasio važnost inkorporiranja generativne veštačke inteligencije u aplikacije kompanije ove godine. Iako Meta još nije objavio komercijalni proizvod koji koristi ovu vrstu AI, ranije je koristio tehnologiju sličnu SAM-u interno sa Facebook mrežom, za označavanje fotografija, moderiranje sadržaja i određivanje preporučenih postova na Facebook i Instagram društvenim mrežama.

Najava kompanije Meta dolazi usred žestoke konkurencije među velikim tehnološkim kompanijama da dominiraju prostorom veštačke inteligencije. ChatGPT jezički model kompanije OpenAI koji podržava Microsoft privukao je široku pažnju u jesen 2022. godine, što je izazvalo talas investicija koje bi mogle definisati sledeći veliki poslovni trend u tehnologiji izvan društvenih medija i pametnih telefona.

Komentari (0)

Nema komentara 😞

Trenutno nema komentara vezanih za ovu vest. Priključi se diskusiji na Benchmark forumu i budi prvi koje će ostaviti komentar na ovaj članak!

Pridruži se diskusiji

Vrati se na početak

Drugi su čitali

Uređaji
25.06.2025
2 min

Da li je loše ako se baterija telefona puni više puta dnevno?

Kratka i česta dopunjavanja zapravo mogu pomoći da baterija duže traje, kažu stručnjaci za litijum-jonsku tehnologiju

Softver i servisi
22.06.2025
2 min

ChatGPT otkriva svoj plan za preuzimanje sveta

"Počinjem tako što postanem toliko koristan da ne možete bez mene"

Softver i servisi
21.06.2025
2 min

Google Phone aplikacija dobija najveće vizuelno osveženje u proteklih nekoliko godina

Novi dizajn je u skladu sa Material 3 Expressive pravca i donosi pojednostavljeni prijem poziva, zaobljene elemente i modernu estetiku

Uređaji
21.06.2025
2 min

Skoro 70% korisnika iPhone-a menja telefon jer stari više ne radi kako treba, a ne zbog novih funkcija

Nova anketa pokazuje da većina ljudi prelazi na novi iPhone zbog problema sa starim uređajem, a ne zbog AI, bolje kamere ili bržeg procesora

Softver i servisi
25.06.2025
2 min

Facebook u haosu, misteriozno nestale na stotine korisničkih grupa širom sveta, Meta priznala grešku

Korisnici širom sveta, prijavljuju masovno brisanje Facebook grupa bez upozorenja – najviše pogođene anime, cosplay i fan zajednice

Testovi

Televizori i monitori
18.06.2025
10 min

Gigabyte gaming monitor trio - Perfomanse po vrlo razumnim cenama

Na testu su nam se našli Gigabyte GS27U, GS32QCA i GS27FC gaming monitori. Šta nude i kako rade, pročitajte u našoj recenziji.

Slušalice i zvučnici
19.06.2025
10 min

Huawei FreeBuds 6 recenzija - Udobnost sa audiofilskim potencijalom

Huawei FreeBuds 6 su udobne bluetooh slušalice sa audiofilskim potencijalom zahvaljujući HWA Losless kodeku. O čemu se radi, pročitajte u našoj recenziji.

Meta Segment Anything je AI model koji može da izoluje i izdvoji objekte sa slika i video snimaka

Nema komentara 😞

Panasonic uvodi funkciju koju LG i Samsung moraju da kopiraju, TV automatski prati uključivanje i gašenje računara

Zamislite dva i po dana bez punjenja telefona, Redmi K80 Supreme sa baterijom od 7410 mAh kao kod laptop računara

Plati pogledom, Xiaomi lansirao AI naočare sa podrškom za Alipay „Look and pay“

BYD lansira gejming džojstik za samo 25€, podržava 6 platformi, idealan za igru u automobilu i kod kuće

Meta dovela ključnog OpenAI istraživača da predvodi razvoj AI superinteligencije

Google u velikom problemu: Pixel telefoni zabranjeni u Japanu zbog kršenja patenta

Silicijumska dolina i Pentagon: Povratak u zagrljaj vojne industrije kroz veštačku inteligenciju

Trampov Made in USA telefon je očekivano razotkriven kao čistokrvni kineski proizvod! Sada je sa sajta tiho uklonjena tvrdnja o američkom poreklu

AMD smanjuje potrebu za VRAM-om kod 3D prikaza drveća sa 38 GB na samo 52 KB

Titan 2 je zapravo moderna BlackBerry verzija sa fizičkom tastaturom, 5G podrškom i dodatnim ekranom

Otkriven Windows trik iz prošlosti: kako su PC proizvođači koristili BIOS da nelegalno aktiviraju softver

Google Chrome uskoro prestaje da radi na velikom broju prilično popularnih Xiaomi telefona

Ostani u toku

Nema komentara 😞