Google je zvanično najavio da Gemini, zahvaljujući novom muzičkom modelu Lyria 3, sada može da generiše muzičke numere u trajanju do 30 sekundi, na osnovu tekstualnog upita ili da remiksuje postojeću muziku po želji korisnika. Time se Gemini dodatno proširuje izvan teksta, slika i videa, a ista tehnologija biće dostupna i kroz YouTube opciju Dream Track, namenjenu kreiranju muzičke podloge za Shorts sadržaje.
Za razliku od klasičnih alata za produkciju muzike, korišćenje Lyria 3 modela ne zahteva tehničko znanje. Dovoljni su jednostavni opisi, poput Google-ovog primera „komična R&B balada o čarapi koja pronalazi svoj par“, ali sistem dozvoljava i preciznije upravljanje elementima kao što su tempo, ritam bubnjeva ili muzički stil.
Osim teksta, Gemini može da generiše muziku i na osnovu fotografije ili video zapisa, dok se numere mogu kombinovati sa omotima albuma koje kreira Google Nano Banana model za slike.
Gemini i Lyria 3 menjaju pristup generisanju muzike
Prema navodima Google-a, Lyria 3 donosi primetno realističniji i muzički složeniji zvuk u odnosu na prethodne audio modele. Sistem nudi veću kontrolu nad pojedinačnim komponentama pesme, kao i automatsko generisanje tekstova. Trenutno su generisani klipovi ograničeni na 30 sekundi, ali način na koji Google promoviše ovu funkciju jasno sugeriše da bi trajanje moglo biti produženo, kao i da će se tehnologija integrisati u dodatne aplikacije, poput Google Messages-a.
Kao i ostali sadržaji koje generiše Gemini, i muzika nastala pomoću Lyria 3 modela automatski se obeležava Google SynthID vodenim žigom, čime se otežava predstavljanje AI sadržaja kao ljudskog rada. Google je tokom Google I/O 2025 konferencije započeo i uvođenje SynthID Detector alata, namenjenog prepoznavanju AI-generisanog sadržaja.
Iako su primeri koje je Google objavio prilično uverljivi, pojedini elementi ipak otkrivaju mašinsko poreklo. Instrumentalne deonice često zvuče veoma kvalitetno, dok tekstovi pesama povremeno deluju neobično ili preterano banalno.
Lyria 3 je od danas dostupna u Gemini servisu za korisnike starije od 18 godina, uz podršku za engleski, španski, nemački, francuski, hindi, japanski, korejski i portugalski jezik, prenosi Engadget.
Fino radi.
View image at the forums
Gemini - директан приступ Google AI-у
Направљено помоћу Gemini-ја
View image at the forums
gemini.google.com
Insiprisano pesmom Bobana Zdravkovića, Srce Lava.
Znaci mozemo kolektivno da pocnemo da pakujemo kofere. Donedavno sam bio siguran da ta tranzicija nece doci jos koju god ( 5+) ali posle testiranja GTP 5.2 i opus 4.6 u pitanju su ne godine i meseci nego dani.
Fala bogu, i ti muzicari da pocmu da rade nesto konkretno. 😀
Cenzurisan je pa radi šta mu se ćefne, ali neka mu bude 😆
View image at the forums
Gemini - директан приступ Google AI-у
Направљено помоћу Gemini-ја
View image at the forums
gemini.google.com
Mislim da nije cenzurisan, nego od postavljenog teksta pravi pesmu. Tako nekako i piše u manualu. Ni ja nisam mogao da ga nateram da peva moje stihove.
Inače, kao cenzurišu svašta, a ovu pesmu mi napravio na moj sledeći tekst (odslušati do kraja):
GRLO URLA, ČIZMA GAZI
VOJSKA MRTVIH ĐAVOLJOM STAZOM PROLAZI
MAJKA KUKA, SVE DO ZORE
SINOVI SE UZ ĐAVOLA BORE
View image at the forums
Gemini - директан приступ Google AI-у
Направљено помоћу Gemini-ја
View image at the forums
gemini.google.com
Wtf?
Opa