Nakatutugon ba ang MusicLM ng Google sa Hype?

Nakatutugon ba ang MusicLM ng Google sa Hype?
Ang mga mambabasang tulad mo ay tumutulong sa pagsuporta sa MUO. Kapag bumili ka gamit ang mga link sa aming site, maaari kaming makakuha ng isang affiliate na komisyon. Magbasa pa.

Noong Enero 2023, inanunsyo ng Google ang MusicLM, isang pang-eksperimentong AI tool na maaaring makabuo ng musika batay sa mga paglalarawan ng teksto. Sa tabi ng balita, naglabas ang Google ng isang nakamamanghang research paper para sa MusicLM na nag-iwan sa maraming tao na nasilaw sa kakayahang mag-conjure ng musika mula sa manipis na hangin.





MAKEUSEOF VIDEO OF THE DAY MAG-SCROLL PARA MAGPATULOY SA NILALAMAN

Dahil sa isang text prompt, nangako ang modelo na gagawa ng high fidelity na musika na naghahatid sa lahat ng uri ng paglalarawan mula sa genre hanggang instrumento hanggang sa abstract na mga caption na naglalarawan sa mga sikat na likhang sining. Ngayong bukas na ang MusicLM sa publiko, nagpasya kaming subukan ito.





Pagtatangka ng Google na Gumawa ng AI Music Generator

  Web application para sa Google's MusicLM AI music generator

Ang paggawa ng text prompt tulad ng 'nakaka-relax na jazz' sa isang ready-to-play na track ay malamang na ang banal na grail ng mga eksperimento sa AI music. Katulad ng mga sikat na AI image generator tulad ng Dall-E o Midjourney, hindi mo kailangang magkaroon ng kaunting kaalaman sa musika para makagawa ng track na may melody at beat.





Noong Mayo 2023, maaaring subukan ng mga nag-sign up sa AI Test Kitchen ng Google ang demo sa unang pagkakataon. Binabati ng isang user-friendly na web page at ilang gabay na panuntunan—ang mga electronic at classical na instrumento ay pinakamahusay na gumagana, at huwag kalimutang tumukoy ng isang 'vibe'—ang paggawa ng isang snippet ng musika ay hindi maisip na madali.

Ang bilis ay isa sa ilang bagay na tunay na naihahatid ng MusicLM, kasama ng mga sample na medyo mataas ang katapatan. Gayunpaman, ang tunay na pagsubok ay hindi dapat masukat gamit ang isang segundometro lamang. Maaari bang makagawa ang MusicLM ng tunay, nakikinig na musika batay sa ilang salita? Hindi eksakto (malapit na natin ito).



Paano Gamitin ang MusicLM sa AI Test Kitchen ng Google

Ang paggamit ng MusicLM ay madali, maaari kang mag-sign up sa waitlist para sa AI Test Kitchen ng Google kung gusto mong subukan.

Sa web app, makakakita ka ng text box kung saan makakagawa ka ng prompt mula sa ilang salita hanggang sa ilang pangungusap na naglalarawan sa uri ng musikang gusto mong marinig. Para sa pinakamahusay na mga resulta, pinapayuhan ka ng Google na 'maging napaka mapaglarawan', idinagdag na dapat mong subukang isama ang mood at damdamin ng musika.





pinakamahusay na oras upang bumili ng isang desktop computer

Kapag handa ka na, pindutin ang enter upang simulan ang pagproseso. Sa loob ng humigit-kumulang 30 segundo, dalawang audio snippet ang magiging available para sa iyong audition. Mula sa dalawa, mayroon kang opsyon na magbigay ng tropeo sa pinakamagandang sample na tumutugma sa iyong prompt, na tumutulong naman sa Google na sanayin ang modelo at pahusayin ang output nito.

Ano ang Tunog ng MusicLM

Gumagawa ang mga tao ng musika mula pa noong hindi bababa sa 40,000 taon na ang nakalilipas nang walang tiyak na ideya kung ang musika ay dumating bago, pagkatapos, o kasabay ng pag-unlad ng wika. Kaya sa ilang mga paraan, hindi nakakagulat na ang MusicLM ay hindi masyadong nag-crack ng code sa sinaunang unibersal na sining na ito.





Ang research paper ng Google MusicLM Iminungkahi na ang MusicLM ay maaaring bumuo ng musika mula sa mga caption na kabilang sa mga sikat na likhang sining, at sundin ang mga tagubilin tulad ng pagbabago ng genre o mood sa maayos na paraan kasunod ng pagkakasunod-sunod ng iba't ibang mga senyas.

Gayunpaman, bago makarating sa mga ganoong kataas-taasang order, nalaman namin na ang MusicLM ay may ilang pangunahing problema na dapat unahin.

Ang hirap Dumikit sa Tempo

Ang pinakapangunahing trabaho ng sinumang musikero ay ang paglalaro sa tamang oras. Sa madaling salita, manatili sa tempo. Nakakagulat, hindi iyon isang bagay na magagawa ng MusicLM 100% ng oras.

Sa katunayan, gamit ang parehong prompt nang 10 beses, na gumagawa ng 20 track ng musika, tatlo lang ang nasa oras. Ang natitirang 17 sample ay mas mabilis o mas mabagal kaysa sa tinukoy na tempo na isinulat sa 'beats per minute', isang malawakang ginagamit na termino upang ilarawan ang musika.

Sa halimbawang ito, ginamit namin ang prompt na 'solo classical piano na tumutugtog sa 80 beats bawat minuto, mapayapa at mapagnilay-nilay'. Sa malapit na pakikinig, ang musika ay madalas na bumilis o bumagal sa loob ng maliit na haba ng sample.

Kulang din ng malakas na beat ang musika at parang may natamaan ng play sa kalagitnaan ng piyesa. Sinadya man ito o hindi, nahihirapang husgahan kung ang MusicLM ay talagang makakagawa ng tamang simula o pagtatapos sa isang piraso ng musika sa ibabaw ng pagdidikit sa beat.

Random na Pagpili ng Instrumento

Marahil ay hindi pa natututo ang MusicLM kung paano tumugtog sa mahigpit na timing, kaya lumipat kami sa isa pang karaniwang parameter ng musika. Gusto naming makita kung ibibigay nito ang aming kahilingan para sa ilang partikular na instrumento.

paano magbahagi ng laro ng xbox isa

Sumulat kami ng iba't ibang prompt na may kasamang mga paglalarawan tulad ng 'Solo synthesizer' at 'Solo bass guitar'. Ang iba ay mas malalaking ensemble tulad ng 'String quartet' o 'Jazz band'. Sa kabuuan, tila isang 50:50 na pagkakataon na makuha mo ang iyong hiniling.

Ang isang teorya ay ang modelo ay nag-uugnay ng ilang mga instrumento sa mga sikat na genre ng musika. Kunin, halimbawa, ang prompt na 'Solo synthesizer, chord progression. Lively and upbeat'. Sa halip na makakuha ng sarili nitong tunog ng synthesizer, gumawa ang MusicLM ng electronic track na kumpleto sa mga drum at bass.

Posible na ang modelo ay walang sapat na data at sapat na pagsasanay upang maunawaan ang partikular na kahilingan para sa isang instrumento.

Ang mga Vocal ay Wala sa Equation

Ayon sa mga paghihigpit noong panahong iyon, hindi gagawa ang modelo ng musikang naglalaman ng mga vocal. Ang matitinik na isyu sa copyright at buggy vocal ng MusicLM ay isang malamang na kadahilanan kung bakit pinili ng Google na i-play ito nang ligtas sa pamamagitan ng pagtatakda ng limitasyong ito.

Ngunit pagkatapos mag-eksperimento sa MusicLM sa loob ng ilang panahon, napagtanto namin na ang kontrol ng Google sa output ng modelo ay hindi eksaktong matatag. Kakatwa, ang isang prompt tulad ng 'acoustic guitar' ay gagawa ng isang track na naglalaman ng mala-multo na vocal sa background na tila mahina at malayo.

Bagama't hindi ito isang pangkaraniwang pangyayari, ito ay nag-iiwan sa iyo ng pagtataka tungkol sa kakayahan ng MusicLM na lumikha ng mga nakakumbinsi na vocal sa unang lugar.

Gamit ang software tulad ng VOCALOID at Synthesizer V na nangunguna sa pagpasok AI-assisted vocal synthesis technology , ang pag-alis ng mga vocal mula sa kasalukuyang modelo ay nag-iiwan sa amin ng pag-iisip kung hindi pa ba ito sapat na mahusay upang makipagkumpitensya laban sa umiiral na teknolohiya. Maaaring malayo pa ang mararating ng MusicLM bago kantahin ng mga musikero ang mga papuri nito.

Ang Kinabukasan ng AI Music Generators

  Iba't ibang prompt na mungkahi sa MusicLM's web application

Habang inilipat ng MusicLM ang generative AI music technology, kailangan nitong bumalik sa paaralan at matuto ng ilan pang bagay bago ito makapagsagawa ng praktikal na gawain sa industriya ng musika.

Bago ngayon, ang pinakamahusay na pagtatangka sa generative AI music ay isang modelo na tinatawag na JukeboxAI ng OpenAI. Ito ay hindi eksakto sa isang ready-to-use na estado, at tumagal ng napakalaking siyam na oras upang mag-render ng isang minuto lang ng musika.

Para sa iyong mga pagsusumikap, malamang na maibalik mo ang isang tunay na alien-sounding track na puno ng pagbaluktot ng audio at mga artifact. Sa kabilang banda, hindi ka magsasawa nakikinig sa mga kakaibang likha na kinukuha ng Jukebox .

Dahil dito, gumawa ang MusicLM ng ilang makabuluhang pagsulong tungo sa isang user-friendly na AI music generator. Halos mapapatawad na namin ang modelo para sa mga random na output nito kapag huminto ka para isipin kung gaano kakomplikado ang pagbuo ng musika sa raw audio form.

Matapos gumana ang modelo, gayunpaman, pakiramdam ng MusicLM ay kalahating lutong kapag inihambing sa kung ano ang inilathala ng Google sa paunang papel na pananaliksik nito. Bihirang makuha ng AI image generator ang imahe ng isang Apple, gayundin ang isang AI music generator ay dapat makakuha ng ilang mga pangunahing kaalaman tulad ng tempo at mga instrumento.

Ang MusicLM ng Google ay Bumagsak sa Mga Inaasahan

Sa pakikipagkarera ng mga tech na kumpanya na lumampas sa pakikipagkumpitensya sa isa't isa sa harap ng AI, pakiramdam ng MusicLM ay parang pumasok ito sa mga pampublikong pagsubok bago ito handa. Sa halip na gawing tama ang mga pangunahing kaalaman, ang modelo ay tila nagsasagawa ng mas malabo at subjective na diskarte sa paggawa ng musika.

kung paano magtanggal ng isang kaganapan sa kalendaryo

Maaaring hikayatin ka ng Google na maging partikular sa iyong prompt, ngunit hindi nito mahawakan nang maayos ang tempo, at hindi ka garantisadong makukuha ang mga instrumentong hinihiling mo sa bawat pagkakataon. Maaaring kawili-wili ang MusicLM, at isang mahusay na pagpapakita ng mga makapangyarihang pagsulong ng AI, ngunit kung musika ang pangwakas na layunin, malayo pa ang mararating nito.