5 geriausi atvirojo kodo AI vaizdo generatoriai

5 geriausi atvirojo kodo AI vaizdo generatoriai

Greitos nuorodos

AI pagrįsti teksto į vaizdą generavimo modeliai yra visur ir kasdien tampa vis lengviau pasiekiami. Nors paprasta apsilankyti svetainėje ir sugeneruoti ieškomą vaizdą, atvirojo kodo teksto į vaizdą generatoriai yra geriausias pasirinkimas, jei norite labiau valdyti generavimo procesą.





DIENOS VAIZDO ĮRAŠO PAGALBA SLĖKITE, KAD TĘSITE SU TURINIU

Internete yra daugybė nemokamų atvirojo kodo AI teksto į vaizdą generatorių, kurie specializuojasi tam tikrų tipų vaizduose. Taigi, mes ištyrėme krūvą ir radome geriausius atvirojo kodo AI teksto į vaizdą generatorius, kuriuos galite išbandyti dabar.





1 Kreidelė

  craiyon-home-page

„Craiyon“ yra vienas lengviausiai pasiekiamų atvirojo kodo AI vaizdo generatorių. Jis pagrįstas DALL-E Mini, o jūs galite klonuoti Github saugykla ir įdiekite modelį vietoje savo kompiuteryje, atrodo, kad „Craiyon“ atsisakė šio požiūrio ir pasirinko savo svetainę.





Oficiali „Github“ saugykla nebuvo atnaujinta nuo 2022 m. birželio mėn., tačiau naujausias modelis vis dar pasiekiamas nemokamai oficiali Craiyon svetainė . Taip pat nėra „Android“ ar „iOS“ programų.

Kalbant apie funkcionalumą, pamatysite visas įprastas parinktis, kurių tikitės iš AI vaizdo generatoriaus. Įvedę raginimą ir gavę vaizdą, galėsite naudoti aukštesnės raiškos kopiją naudodami aukštesnio lygio funkciją. Galima rinktis iš trijų stilių: meno, nuotraukos ir piešimo. Taip pat galite pasirinkti parinktį „Nėra“, jei norite, kad modelis nuspręstų.



kodėl mano garsiakalbiai neveikia?
  „Craiyon“ sukurtas vaizdas

Be to, „Eksperto režimas“ leidžia įtraukti neigiamus žodžius, kurie nurodo modeliui vengti konkrečių elementų. Taip pat yra greito numatymo funkcija, kuri naudoja „ChatGPT“, kad padėtų vartotojams parašyti geriausius ir išsamiausius raginimus. Galiausiai, dirbtinio intelekto valdomos fono pašalinimo funkcijos gali padėti sutaupyti laiko ir pastangų apkarpant foną iš vaizdų.

Ir tai yra viskas, ką daro Craiyonas. Tai nėra pats sudėtingiausias AI vaizdo generavimo modelis, tačiau jis puikiai tinka kaip pagrindinis modelis, jei nenorite kažko detalaus ar tikroviško.





Modeliu galima naudotis nemokamai, tačiau nemokami vartotojai vienu metu gali pateikti devynis nemokamus vaizdus per minutę. Galite užsiprenumeruoti jų rėmėjų arba profesionalų lygius (atitinkamai 5 ir 20 USD per mėnesį ir apmokestinami kasmet), kad neliktų jokių skelbimų ar vandens ženklų, greitesnis generavimas ir galimybė išlaikyti savo sukurtus vaizdus privačius. Pasirinktinė prenumeratos pakopa taip pat leidžia pasirinktinius modelius, integraciją, specialų palaikymą ir privačius serverius.

2 Stabili difuzija 1.5

„Stable Diffusion“ yra turbūt vienas populiariausių atvirojo kodo teksto į vaizdą generavimo modelių. Jis taip pat maitina kitus modelius, įskaitant tris toliau nurodytus vaizdo generatorius. Jis buvo išleistas 2022 m. ir nuo to laiko buvo daug įdiegtų.





  stabili-difuzija-web-ui

Nepagailėsiu pernelyg techninių modelio veikimo detalių (kurią galite patikrinti jų oficiali Github saugykla ), tačiau modelį lengva įdiegti net pradedantiesiems ir jis veikia gerai, jei turite specialų GPU su bent 4 GB atminties. Taip pat galite prieiti Stabili difuzija internete ir, jei norite, mes jums padėsime paleiskite „Stable Diffusion“ „Mac“. .

Yra keletas kontrolinių punktų (laikyk juos versijomis), kuriuos galima naudoti stabiliai difuzijai. Kol išbandėme 1.5 versiją, versija 2.1 taip pat aktyviai vystosi ir yra tikslesnis.

  Dreamshaper-ai-generated-image
Yadullah Abidi/MakeUseOf/DreamShaper

Paleisti modelį taip pat gana lengva. Mes jį išbandėme su AUTOMATIC1111 Stable Diffusion žiniatinklio vartotojo sąsaja , o visi valdikliai ir parametrai veikia gerai. Tai taip pat gana atspari NSFW, nes LAION-5B duomenų bazė, kurią modelis mokėsi (nors ji nėra tobula, atminkite). Nors pats generavimo laikas skirsis priklausomai nuo jūsų aparatinės įrangos, galite tikėtis, kad jūsų vaizdai bus išsamūs ir tikroviški net ir su pagrindiniais raginimais.

3 DreamShaper

DreamShaper yra vaizdų generavimo modelis, pagrįstas stabilia difuzija. Jis buvo skirtas kaip atvirojo kodo „MidJourney“ alternatyva ir daugiausia dėmesio skiria fotorealizmui generuotuose vaizduose, nors su keliais pataisymais jis taip pat puikiai tinka anime ir tapybos stiliams.

Modelis yra pajėgesnis nei „Stable Diffusion“, todėl naudotojams suteikiama daugiau laisvės dėl galutinės išvesties, pradedant žaibiškais patobulinimais ir baigiant laisvesniais NSFW apribojimais. Paleisti modelį taip pat lengva, naudojant a galima atsisiųsti, paruošta versija internetu vietinei prieigai ir daugybei svetainių, įskaitant Sinkin.ai , RandomSeed , ir Magas.erdvė (reikalinga pagrindinė prenumerata), leidžianti paleisti modelį su GPU spartinimu.

  svajonių kūrėjas-stabledifuzija-palyginimas

Kaip tikriausiai jau galite atspėti, „DreamShaper“ sukurti vaizdai paprastai atrodo tikroviškiau, palyginti su „Stable Diffusion“. Net jei abiejuose modeliuose vykdysite tą patį raginimą, „DreamShaper“ modelis greičiausiai bus tikroviškesnis, detalesnis ir geriau apšviestas.

Tai ypač pasakytina apie portretus ar personažus, kurių, palyginti su tuo pačiu raginimu, man trūksta stabilios sklaidos. Jei jūsų vaizdai tampa pernelyg tikroviški, čia yra keturi būdai identifikuoti AI sukurtą vaizdą .

Norint paleisti modelį, jums taip pat nereikia behemotiško kompiuterio. Mano GTX 1650Ti su 4 GB VRAM puikiai veikė modelį. Generavimo laikas buvo šiek tiek ilgesnis, bet atrodė, kad tai neturėjo įtakos faktinei produkcijai. Vis dėlto gali prireikti GPU su daugiau VRAM, kad paleistumėte „DreamShaper XL“, pagrįstą „Stable Diffusion XL“ modeliu.

4 InvokeAI

„Invoke AI“ yra dar vienas dirbtiniu intelektu pagrįstas vaizdų generavimo modelis, pagrįstas „Stable Diffusion“, su XL versija, pagrįsta „Stable Diffusion XL“. Jis taip pat turi savo žiniatinklio ir komandinės eilutės vartotojo sąsają, o tai reiškia, kad jums nereikės šokinėti su tokiais dalykais kaip „Stable Diffusion“ žiniatinklio vartotojo sąsaja.

  invokeai-user-interface-with-image

Modelis orientuotas į tai, kad naudotojai galėtų kurti vaizdinius elementus, pagrįstus jų intelektine nuosavybe, naudojant pritaikytas darbo eigas. „InvokeAI“ yra vienas geriausių atvirojo kodo AI vaizdų generavimo modelių, skirtų pritaikyti modelius ir dirbti su intelektine nuosavybe.

Jo oficiali Github saugykla pateikiami du diegimo būdai: diegimas naudojant „InvokeAI“ diegimo programą arba PyPI naudojimas, jei jums patinka terminalas ir „Python“ ir jums reikia daugiau valdyti su modeliu įdiegtus paketus.

Tačiau papildomas valdymas kelia tam tikrų apribojimų, ypač griežtesnių techninės įrangos reikalavimų. „InvokeAI“ rekomenduoja specialų GPU su mažiausiai 4 GB atminties, o XL variantui paleisti rekomenduojama nuo šešių iki aštuonių GB. VRAM reikalavimai taikomi tiek AMD, tiek Nvidia GPU. Taip pat modeliui, jo priklausomybėms ir Python reikės bent 12 GB RAM ir 12 GB laisvos vietos diske.

  invoke-ai-generated-image
Yadullah Abidi / MakeUseOf / InvokeAI

Nors dokumentacijoje nerekomenduojami Nvidia GTX 10 ir 16 serijos GPU dėl vaizdo atminties trūkumo, pateikta diegimo programa veikė puikiai. Nors jūsų rida gali skirtis, jei naudojate žemesnės klasės GPU, laukite ilgiau, kol jūsų raginimai bus paversti vaizdais. Galiausiai, jei naudojate „Windows“, galite naudoti tik „Nvidia“ GPU, nes šiuo metu AMD GPU nepalaikoma.

Kalbant apie įvaizdžio generavimą, modelis labiau linkęs į meninius stilius nei į fotorealizmą. Žinoma, galite pritaikyti modelį savo duomenų rinkiniui ir leisti jam generuoti vaizdus, ​​artimesnius norimiems, net jei tai susiję su fotorealistiniais vaizdais, ypač jei dirbate gaminio projektavimo, architektūros ar mažmeninės prekybos srityse. Tačiau svarbu nepamiršti, kad „InvokeAI“ visų pirma yra vaizdų generavimo variklis, o tai reiškia, kad greičiausiai turėsite naudoti savo modelius, kad pasiektumėte geriausių rezultatų (lengvai randami naudojant modelių tvarkyklę, pateiktą žiniatinklio sąsajoje), kaip numatytąjį. modelis yra gana panašus į patį Stable Diffusion.

5 Openjourney

„Openjourney“ yra nemokamas atvirojo kodo dirbtinio intelekto vaizdų generavimo modelis, pagrįstas stabilia difuzija. Jei jums įdomu, kodėl modelis vadinamas „Openjourney“, taip yra todėl, kad jis buvo išmokytas naudoti „Midjourney“ vaizdus ir gali imituoti savo stilių sukurtuose vaizduose.

PromptHero „Openjourney“ kompanija leidžia išbandyti modelį kartu su kitais modeliais, įskaitant „Stable Diffusion“ (1.5 ir 2 versijos), „DreamShaper“ ir „Realistic Vision“. Prisiregistruodami gausite 25 nemokamus kreditus (po vieną kreditą už kiekvieną sugeneruotą vaizdą), po kurių turėsite užsiprenumeruoti jų „Pro“ prenumeratos pakopą, kuri kainuoja 9 USD per mėnesį ir suteikia prieigą prie 300 kreditų kiekvieną mėnesį su kitomis išskirtinėmis funkcijomis.

  atvira kelionė – stabili difuzija – palyginimas

Tačiau, jei norite jį paleisti vietoje ir nemokamai, galite atsisiųskite modelio failą iš HuggingFace ir paleiskite jį naudodami Stable Diffusion žiniatinklio vartotojo sąsają. „Openjourney“ taip pat yra antras dažniausiai atsisiunčiamas AI vaizdo generavimo modelis HuggingFace, iškart po „Stable Diffusion“.

„Openjourney“ savo svetainėje nenurodo jokių konkrečių aparatinės įrangos reikalavimų modeliui paleisti vietoje, tačiau galite tikėtis panašių aparatinės įrangos reikalavimų kaip „Stable Diffusion“. Tai reiškia specialų GPU su 4 GB VRAM, 16 GB RAM ir maždaug 12–15 GB laisvos vietos jūsų kompiuteryje, kad būtų išsaugotas modelis ir jo priklausomybės.

  openjourney-ai-generated-image
Yadullah Abidi / MakeUseOf / OpenJourney

„Openjourney“ sukurti vaizdai paprastai yra subalansuoti tarp fotorealizmo ir meno, jei nenurodyta kitaip. Jei ieškote universalaus modelio ir teikiate pirmenybę „Midjourney“ išvaizdai ir jausmui nemokėdami už prenumeratą, „Openjourney“ yra vienas geriausių variantų.