Ang 5 Pinakamahusay na Open-Source AI Image Generators - |Ipinaliwanag ang Teknolohiya|Malikhain|

Mga Mabilisang Link

Crayon

Matatag na Pagsasabog 1.5

DreamShaper

InvokeAI

Openjourney

Ang mga modelo ng pagbuo ng text-to-image na nakabatay sa AI ay nasa lahat ng dako at nagiging mas madaling ma-access araw-araw. Bagama't madali lang bumisita sa isang website at makabuo ng larawang hinahanap mo, ang mga open-source na text-to-image generator ay ang iyong pinakamahusay na mapagpipilian kung gusto mo ng higit na kontrol sa proseso ng pagbuo.

MAKEUSEOF VIDEO OF THE DAY MAG-SCROLL PARA MAGPATULOY SA NILALAMAN

Mayroong dose-dosenang libre at open-source na AI text-to-image generator na available sa internet na dalubhasa sa mga partikular na uri ng mga larawan. Kaya, na-filter namin ang pile at natagpuan ang pinakamahusay na open-source AI text-to-image generator na maaari mong subukan ngayon.

1 Crayon

Ang Craiyon ay isa sa pinakamadaling ma-access na open-source AI image generators. Ito ay batay sa DALL-E Mini, at habang maaari mong i-clone ang Github repository at i-install ang modelo nang lokal sa iyong computer, mukhang inalis ni Craiyon ang diskarteng ito pabor sa website nito.

Ang opisyal na imbakan ng Github ay hindi na-update mula noong Hunyo 2022, ngunit ang pinakabagong modelo ay magagamit pa rin nang libre sa opisyal na site ng Craiyon . Wala ring Android o iOS app.

Sa mga tuntunin ng functionality, makikita mo ang lahat ng karaniwang opsyon na inaasahan mo mula sa isang AI image generator. Kapag naipasok mo na ang iyong prompt at makakuha ng larawan, maaari mong gamitin ang upscale na feature para makakuha ng mas mataas na resolution na kopya. Mayroong tatlong mga estilo na mapagpipilian: Sining, Larawan, at Pagguhit. Maaari mo ring piliin ang opsyong 'Wala' kung gusto mong magpasya ang modelo.

Bukod pa rito, hinahayaan ka ng 'Expert Mode' na magsama ng mga negatibong salita, na nagsasabi sa modelo na iwasan ang mga partikular na item. Mayroon ding tampok na maagang hula, na gumagamit ng ChatGPT upang matulungan ang mga user na isulat ang pinakamahusay, pinakadetalyadong mga senyas na posible. Panghuli, ang AI-powered remove background feature ay makakatulong sa iyong makatipid ng oras at pagsisikap sa pag-crop ng mga background sa mga larawan.

kung paano makahanap ng mga lumang mensahe sa iphone

At iyon ay tungkol sa lahat ng ginagawa ni Craiyon. Hindi ito ang pinaka-sopistikadong modelo ng pagbuo ng imahe ng AI, ngunit mahusay ito bilang pangunahing modelo kung hindi mo gusto ang isang bagay na detalyado o makatotohanan.

Ang modelo ay malayang gamitin, ngunit ang mga libreng user ay limitado sa siyam na libreng larawan sa isang pagkakataon sa loob ng isang minuto. Maaari kang mag-subscribe sa kanilang Supporter o Professional na mga tier (presyo sa at sa isang buwan, ayon sa pagkakabanggit, at sinisingil taun-taon) upang walang mga ad o watermark, mas mabilis na henerasyon, at ang opsyon na panatilihing pribado ang iyong mga nabuong larawan. Pinapayagan din ng Custom na subscription tier ang mga custom na modelo, pagsasama, dedikadong suporta, at pribadong server.

2 Matatag na Pagsasabog 1.5

Ang Stable Diffusion ay marahil ang isa sa pinakasikat na open-source na text-to-image na mga modelo ng henerasyon. Pinapalakas din nito ang iba pang mga modelo, kabilang ang tatlong mga generator ng imahe na binanggit sa ibaba. Inilabas ito noong 2022 at nagkaroon ng maraming pagpapatupad mula noon.

Ililibre ko sa iyo ang sobrang teknikal na mga detalye kung paano gumagana ang modelo (kung saan maaari mong tingnan ang kanilang opisyal na imbakan ng Github ), ngunit ang modelo ay madaling i-install kahit na para sa mga ganap na nagsisimula at gumagana nang maayos hangga't mayroon kang nakalaang GPU na may hindi bababa sa 4GB ng memorya. Maaari mo ring ma-access Matatag na Pagsasabog online, at nasasakupan ka namin kung gusto mo magpatakbo ng Stable Diffusion sa isang Mac .

Mayroong ilang mga checkpoint (isaalang-alang ang mga ito na mga bersyon) na magagamit para sa Stable Diffusion. Habang sinubukan namin ang bersyon 1.5, bersyon 2.1 ay nasa aktibong pag-unlad din at mas tumpak.

Yadullah Abidi/MakeUseOf/DreamShaper

Ang pagpapatakbo ng modelo ay medyo madali din. Sinubukan namin ito gamit ang AUTOMATIC1111 Stable Diffusion web user interface , at lahat ng mga kontrol at parameter ay gumagana nang maayos. Ito rin ay medyo NSFW-proof sa kagandahang-loob ng LAION-5B database kung saan sinanay ang modelo (bagaman hindi ito perpekto, isipin mo). Habang ang oras ng pagbuo mismo ay mag-iiba-iba batay sa iyong hardware, maaari mong asahan na ang iyong mga larawan ay magiging detalyado at makatotohanan kahit na may mga pangunahing senyas.

3 DreamShaper

Ang DreamShaper ay isang modelo ng pagbuo ng imahe batay sa Stable Diffusion. Ito ay nilayon bilang isang open-source na alternatibo sa MidJourney at tumutuon sa photorealism sa mga nabuong larawan, bagama't maaari nitong pangasiwaan ang mga estilo ng anime at pagpipinta sa pamamagitan ng ilang mga pag-aayos.

bakit hindi ang aking netflix ay naglo-load

Ang modelo ay mas may kakayahan kaysa sa Stable Diffusion, na nagbibigay-daan sa mga user ng higit na kalayaan sa huling output, mula sa mga pagpapahusay ng kidlat hanggang sa mas maluwag na mga paghihigpit sa NSFW. Ang pagpapatakbo ng modelo ay madali rin, na may isang mada-download, pre-trained na bersyon na available online para sa lokal na pag-access at isang host ng mga website, kabilang ang Sinkin.ai , RandomSeed , at Mage.space (nangangailangan ng pangunahing subscription) na nagbibigay-daan sa iyong patakbuhin ang modelo na may GPU acceleration.

Tulad ng maaari mong hulaan sa ngayon, ang mga imahe na nabuo ng DreamShaper ay malamang na magmukhang mas makatotohanan kumpara sa Stable Diffusion. Kahit na magpatakbo ka ng parehong prompt sa parehong mga modelo, ang modelo ng DreamShaper ay malamang na maging mas makatotohanan, detalyado, at mas maliwanag.

Ito ay totoo lalo na para sa mga portrait o character, isang bagay na nakita kong kulang sa Stable Diffusion kumpara sa parehong prompt. Kung ang iyong mga larawan ay naging masyadong makatotohanan, narito apat na paraan upang matukoy ang isang imaheng binuo ng AI .

Hindi mo kailangan ng behemoth PC para patakbuhin ang modelo, alinman. Ang aking GTX 1650Ti na may 4GB VRAM ay perpektong nagpatakbo ng modelo. Medyo mas mahaba ang oras ng pagbuo, ngunit mukhang hindi ito nakakaapekto sa aktwal na output. Iyon ay sinabi, maaari kang mangailangan ng mga GPU na may higit pang VRAM upang patakbuhin ang DreamShaper XL, na batay sa modelong Stable Diffusion XL.

4 InvokeAI

Ang Invoke AI ay isa pang modelo ng pagbuo ng imahe na nakabatay sa AI batay sa Stable Diffusion, na may bersyon ng XL na batay sa Stable Diffusion XL. Mayroon din itong sariling web at command line na user interface, ibig sabihin, hindi mo na kakailanganing tumalon sa mga bagay tulad ng Stable Diffusion web UI.

Nakatuon ang modelo sa pagpayag sa mga user na lumikha ng mga visual batay sa kanilang intelektwal na ari-arian na may mga customized na daloy ng trabaho. Ang InvokeAI ay isa sa pinakamahusay na open-source AI image generation model para sa pagsasanay ng mga custom na modelo at pagtatrabaho sa intelektwal na ari-arian.

Nito opisyal na imbakan ng Github naglilista ng dalawang paraan ng pag-install: pag-install sa pamamagitan ng installer ng InvokeAI o paggamit ng PyPI kung komportable ka sa isang terminal at Python at kailangan mo ng higit pang kontrol sa mga package na naka-install sa modelo.

kung paano makakuha ng mga pribilehiyo ng administrator ng windows 10

Gayunpaman, ang labis na kontrol ay nagdadala ng ilang mga limitasyon, lalo na ang mas mahigpit na mga kinakailangan sa hardware. Inirerekomenda ng InvokeAI ang isang nakalaang GPU na may hindi bababa sa 4GB ng memorya, na may anim hanggang walong GB na inirerekomenda para sa pagpapatakbo ng XL variant. Nalalapat ang mga kinakailangan sa VRAM sa parehong AMD at Nvidia GPU. Kakailanganin mo rin ang hindi bababa sa 12GB ng RAM at 12GB ng libreng puwang sa disk para sa modelo, mga dependency nito, at Python.

Yadullah Abidi/MakeUseOf/InvokeAI

Bagama't hindi inirerekomenda ng dokumentasyon ang GTX 10 Series at 16 Series GPU ng Nvidia para sa kanilang kakulangan ng memorya ng video, gumana nang maayos ang ibinigay na installer. Bagama't maaaring mag-iba ang iyong mileage, kung ikaw ay nasa lower-end na GPU, asahan na maghintay nang mas matagal upang makita ang iyong mga prompt na ginagawang mga larawan. Sa wakas, kung ikaw ay nasa Windows, maaari ka lamang gumamit ng Nvidia GPU, dahil walang suporta para sa mga AMD GPU sa kasalukuyan.

Para sa bahagi ng pagbuo ng imahe, ang modelo ay may posibilidad na mas sumandal sa mga artistikong istilo kaysa sa photorealism. Siyempre, maaari mong sanayin ang modelo sa iyong dataset at hayaan itong makabuo ng mga larawan na mas malapit sa gusto mo, kahit na nagsasangkot iyon ng mga photorealistic na larawan, lalo na kung nagtatrabaho ka sa disenyo ng produkto, arkitektura, o mga retail space. Gayunpaman, isang mahalagang bagay na dapat tandaan ay ang InvokeAI ay pangunahing isang image generation engine, ibig sabihin ay malamang na kailangan mong gumamit ng sarili mong mga modelo para sa pinakamahusay na mga resulta (madaling mahanap sa pamamagitan ng model manager na ibinigay sa web interface) bilang default modelo ay medyo katulad sa Stable Diffusion mismo.

5 Openjourney

Ang Openjourney ay isang libre, open-source na modelo ng pagbuo ng imahe ng AI na nakabatay muli sa Stable Diffusion. Kung nagtataka ka kung bakit tinawag na Openjourney ang modelo, ito ay dahil sinanay ito sa mga imahe ng Midjourney at maaaring gayahin ang istilo nito sa mga larawang nabuo nito.

PromptHero , ang kumpanya sa likod ng Openjourney, ay hinahayaan kang subukan ang modelo kasama ng iba pang mga modelo, kabilang ang Stable Diffusion (bersyon 1.5 at 2), DreamShaper, at Realistic Vision. Kapag nagsa-sign up, makakakuha ka ng 25 libreng credits (isang credit para sa bawat nabuong larawan), pagkatapos nito kailangan mong mag-subscribe sa kanilang Pro subscription tier, na nagkakahalaga ng sa isang buwan at nagbibigay sa iyo ng access sa 300 credits bawat buwan kasama ang iba pang mga eksklusibong feature.

Gayunpaman, kung gusto mong patakbuhin ito nang lokal at libre, magagawa mo i-download ang modelong file mula sa HuggingFace at patakbuhin ito gamit ang Stable Diffusion web UI. Ang Openjourney din ang pangalawang pinakana-download na AI image generation model sa HuggingFace, sa likod mismo ng Stable Diffusion.

Hindi naglilista ang Openjourney ng anumang partikular na kinakailangan ng hardware para sa lokal na pagpapatakbo ng modelo sa website nito, ngunit maaari mong asahan ang mga katulad na kinakailangan ng hardware sa Stable Diffusion. Nangangahulugan ito ng nakalaang GPU na may 4GB VRAM, 16GB RAM, at humigit-kumulang 12 hanggang 15GB ng libreng espasyo sa iyong computer upang i-save ang modelo at ang mga dependency nito.

Yadullah Abidi/MakeUseOf/OpenJourney

Ang mga larawang nabuo ng Openjourney ay may posibilidad na maging balanse sa pagitan ng photorealism at sining maliban kung tinukoy. Kung naghahanap ka ng all-around na modelo at mas gusto mo ang hitsura at pakiramdam ng Midjourney nang hindi nagbabayad para sa subscription, ang Openjourney ay isa sa mga pinakamahusay na opsyon.