Kompanija Google zvanično je najavila da njen AI servis Gemini dobija značajno proširenje funkcionalnosti – zahvaljujući novom muzičkom modelu Lyria 3, sada je moguće generisati muzičke numere u trajanju do 30 sekundi na osnovu jednostavnog tekstualnog upita, ali i remiksovati postojeću muziku.

Ova tehnologija biće dostupna i kroz Dream Track opciju na platformi YouTube, namijenjenu kreiranju muzičke podloge za Shorts sadržaje.

Za razliku od klasičnih alata za produkciju, korišćenje modela Lyria 3 ne zahtijeva muzičko ili tehničko predznanje. Dovoljno je unijeti opis željene pjesme – na primjer, „komična R&B balada o čarapi koja pronalazi svoj par“ – a sistem će automatski generisati odgovarajuću numeru.

Korisnicima je omogućena i preciznija kontrola nad elementima kao što su tempo, ritam bubnjeva ili muzički stil. Osim na osnovu teksta, Gemini može da generiše muziku i na osnovu fotografije ili video zapisa, dok se numere mogu kombinovati sa omotima albuma koje kreira model za slike pod nazivom Nano Banana.

Prema navodima Google-a, Lyria 3 donosi primjetno realističniji i muzički složeniji zvuk u odnosu na ranije audio modele. Sistem omogućava veću kontrolu nad pojedinačnim komponentama pjesme, uključujući i automatsko generisanje tekstova.

Iako su generisani klipovi trenutno ograničeni na 30 sekundi, način na koji kompanija promoviše funkciju sugeriše da bi u budućnosti moglo doći do produženja trajanja, kao i integracije u druge aplikacije, uključujući Google Messages.

Kao i ostali sadržaji koje generiše Gemini, i muzika nastala pomoću Lyria 3 modela automatski se označava SynthID vodenim žigom. Google je tokom konferencije Google I/O 2025 započeo i uvođenje alata SynthID Detector, namijenjenog prepoznavanju AI-generisanog sadržaja.

Iako primjeri koje je kompanija objavila zvuče uvjerljivo, pojedini detalji ipak otkrivaju mašinsko porijeklo – instrumentalne dionice su često veoma kvalitetne, dok tekstovi pjesama povremeno djeluju pojednostavljeno ili neobično.

Model Lyria 3 od danas je dostupan u okviru Gemini servisa korisnicima starijim od 18 godina, uz podršku za engleski, španski, njemački, francuski, hindi, japanski, korejski i portugalski jezik, prenosi Engadget.

(Benchmark)

Tagovi