Github – Borisdayma/Dalle -Mini: Dall · E mini – képeket generál egy szöveges üzenetből, hogyan működik a dalle -mini?
Hogyan működik a Dalle-Mini
.
Elmentett keresések
Használja a mentett kereséseket az eredmények gyorsabb szűrésére
Bejelentkezett egy másik fülkel vagy ablakkal. Töltse le újra a munkamenet frissítéséhez. Jelentkezett egy másik lapon vagy ablakon. Töltse le újra a munkamenet frissítéséhez. A fiókokat egy másik lapon vagy ablakon váltotta. .
Dall · e mini – képeket generáljon egy szöveges üzenetből
Ez az elkötelezettség nem tartozik a tároló egyik ágához, és a raktáron kívüli villához tartozik.
Név már használatban van
A címke már létezik a megadott ágnévvel. Sok GIT parancs elfogadja mind a címkét, mind az ágnevet, így ennek az ágnak a létrehozása váratlan viselkedést okozhat. Biztosan szeretné létrehozni ezt az ágot?
- Kápakiak
Használja a GIT -t vagy a Checkout -ot az SVN -vel a web URL segítségével.
. .
Jelentkezzen be a szükséges
Kérjük, jelentkezzen be a CodeSpaces használatához.
A GitHub Desktop elindítása
Ha semmi sem történik, töltse le a GitHub Desktop -ot, és próbálja újra.
A GitHub Desktop elindítása
Ha semmi sem történik, töltse le a GitHub Desktop -ot, és próbálja újra.
Az Xcode elindítása
.
A kódjele egyszer kinyílik, ha készen áll.
.
Legújabb kötelezettségvállalás
Git statisztika
Nem sikerült betölteni a legfrissebb kötelezettségvállalási információkat.
Legfrissebb kötelezettségvállalási üzenet
2021. november 30. 04:14
Rátyol.
Dall · e mini
Hogyan kell használni?
Használhatja a modellt a ️ crayonon
Hogyan működik?
- Dall · e mini – képeket generáljon bármilyen szövegbejuttatásból
- Dall · E MEGA – Képzési folyóirat
Fejlesztés
Függőségi telepítés
Csak a következtetéshez használja a PIP Install Dalle-Mini-t .
A fejlesztéshez klónozza a repo -t, és használja a PIP install -e -t “. . A PR készítése előtt ellenőrizze a stílust a Make Style segítségével .
Kísérletezhet a csővezetékkel lépésről lépésre a következtetési csővezeték notebookunkon keresztül
Dall képzése · e mini
A sweep konfigurációs fájlt is beállíthatja, ha hiperparaméter -keresést kell végrehajtania.
GYIK
?
- Dall · e mini vagy dall · e mega képek előállítása egy szöveges üzenetből
Honnan származik a logó?
Az Openai a “Avokádó alakú karosszéket az avokádó formájában” használta, amikor a dall · e -t felszabadította a modell képességeinek szemléltetésére. .
Csatlakozzon a közösséghez a Laion Discordon. Bármilyen hozzájárulást üdvözölünk, a jelentési kérdésektől a javítások/fejlesztések javaslatáig vagy a modell hűvös utasításokkal történő teszteléséig!
- Szabadítsa ki a saját alkalmazását a Dall-E Playground Repository-val (köszönöm Szahar)
- Próbálja ki a Dall · E Flow projektet a hurok-hurok-munkafolyamat előállításához, diffúziójához és fellendüléséhez (köszönöm Han Xiao)
- futtassa a replikátumot, a böngészőben vagy az API -n keresztül
Elgondolkodások
- Az arc átölelése a len/jax közösségi hét megszervezéséhez
- A Google TPU Research Cloud (TRC) program számítási erőforrások biztosításához
- Súlyok és elfogultságok az infrastruktúra biztosításához a kísérletkövetéshez és a modellkezeléshez
A dall · e mini -t eredetileg a következők fejlesztették ki:
- A Dalle-Pytorch és az Eleutherai közösségek hűvös ötletek tesztelésére és cseréjére
- Rohan Anil az elosztott sampon optimalizáló hozzáadásáért, és mindig nagyszerű javaslatokat ad
- Phil Wang sok hűvös megvalósítást nyújtott a transzformátor variánsokról, és érdekes betekintést nyújt az X-transzformátorokkal
- Katherine Crowson a szuper kondicionáláshoz
Ha a Dall · e mini hasznosnak találja a kutatásában, vagy hivatkozni kíván, kérjük, használja a következő BiBTEX bejegyzést.
Referenciák
- “Deepnet: A transzformátorok méretezése 1000 rétegre”
- “Swin Transformer: Hierarchikus Vision Transformer váltott ablakokkal”
- “Cogview: A szöveg-képtermelés elsajátítása a Transformers-en keresztül”
- “A gyökér átlag négyzetréteg normalizálása”
- “Sinkformers: Transzformátorok, kétszer sztochasztikus figyelemmel”
- “Alapítványtranszformátorok
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@misc< title=, author=, year=, url= >
@misc< title=, author=, year=, eprint= archivePrefix=, primaryClass= >
@misc< title=, author=, year=, eprint=, archivePrefix=, primaryClass= >
@InProEedings< title=, author=, booktitle=, year= >
@misc< title = , author = , year = , eprint = , archivePrefix = , primaryClass = >
< title = , author = , year = , eprint = , archivePrefix = , primaryClass = >
@misc< title = , url = , author = , publisher = , year = , >
< title = , url = , author = , publisher = , year = , >
@misc< title = , url = , author = , publisher = , year = , >
Dall · e mini – képeket generáljon egy szöveges üzenetből
Hogyan működik a Dalle-Mini?
A Dalle Mini egy ingyenes, nyílt forráskódú AI, amely csodálatos képeket készít a szöveges bemenetekből. Így működik.
2022. június 15. • 4 perc olvasás
Biztos vagyok benne, hogy olyan képeket látott, mint a Twitter -hírcsatornában az elmúlt napokban. Ha azon tűnődött, hogy mi voltak, akkor képeket készítenek egy AI nevű DALL · E MINI. Ha még soha nem látta ezeket, el kell olvasnia ezt a cikket, mert hiányzik. Ha kíváncsi vagy, hogy ez lehetséges, nos, akkor a tökéletes cikkben van, és kevesebb, mint öt perc alatt megismeri a választ.
Ennek a névnek, a Dall · E -nek már csengőnek kell lennie, mivel az Open AI által az elmúlt évben készített modell két verzióját hihetetlen eredményekkel fedeztem fel. De ez más. .
.
A link az alábbi referenciákban található, de adja meg még néhány másodpercig ezt a cikket, mielőtt vele játszik. Megéri, és sokkal többet fog tudni erről az AI -ről, mint mindenki, akit ismersz körülötted.
A lényeg a Dall · e mini nagyon hasonló a Dall · e -hez, tehát a modell kezdeti videója nagyszerű bevezetés ennek. Két fő alkotóeleme van, amint azt gyanítja, egy nyelvet és egy képmodult.
Először meg kell értenie a szöveges parancsot, majd képeket generál, két nagyon különböző dolog, amely két nagyon különböző modellt igényel. . Itt van egy BART nevű nyelvmodellünk. A BART egy olyan modell, amelynek célja a szöveges bemenetek átalakításának átalakítása a következő modell számára érthető nyelvgé. Az edzés során pár képalapú képaláírást adunk a dall · e mini -hez. A BART átveszi a szöveges feliratot, és diszkrét tokenekké alakítja, és azt a generált kép és a bemenetként elküldött kép közötti különbség alapján állítjuk be.
? Ezt dekódernek hívjuk. . .
Röviden: a vqgan nagyszerű építészet az ellenkezőjéhez. . Amint azt gyanítja, a GPT-3 és más nyelven generáló modellek nagyon hasonló dolgot csinálnak, szöveget kódolva és az újonnan generált feltérképezés dekódolása egy új szövegbe, amelyet visszaad. Itt ugyanaz, de a pixelekkel egy képet alkotó betűk helyett mondatot alkotnak. .
. Hasonlóképpen, általában csak egy kis zajt adunk ezeknek a kódolásoknak, hogy új képet generáljunk, amely ugyanazt a szöveges parancsot képviseli.
És voilà! Így tanulja meg a mini képeket a szöveges feliratokból képeket generálni.
További eredmények megtekintése a videóban:
Mint már említettem, nyílt forráskódú, és azonnal játszhatsz vele, a Huggingface-nek köszönhetően. Természetesen ez csak egy egyszerű áttekintés volt, és kihagytam néhány fontos lépést az érthetőség érdekében. . Nemrégiben két rövid videót tettem közzé a YouTube -on, amelyek néhány vicces eredményt mutatnak be, valamint összehasonlító eredményeket a Dall · e 2 -vel ugyanazon szöveg -felszólításhoz.
Nagyon jó látni!
Remélem, tetszett neki ez a cikk és a videó, és ha igen, kérjük, szánjon néhány másodpercet, hogy tudassa velem a megjegyzésekben, és hagyjon hasonlóan.
Látni foglak, nem a jövő héten, de két hét múlva egy másik csodálatos papírral!
►https: // diszkréció.gg/tournaitogether
Iratkozzon fel még ilyenre.
Az LLM -ek adaptálása konkrét feladatok elvégzéséhez!
Mvdream: élethű 3D -s modellek létrehozása szavakból
MVDREAM: Új szöveg-3D megközelítés (magyarázva)!
Az AI mély tanulás elmagyarázta
Dall-e mini
A Dall-E 2 úttörő kutatás az Openai-tól, amely a technológia velejáró ígéretét követi: lehetővé téve a normál emberek számára, hogy megszerezzék a tehetséges és gazdagok szuperhatalmait. A legtöbb embernek nincs képessége vagy tehetsége a rajzoláshoz. Azoknak, akiknek csak nem lehet pénze, szakembereket bérelhetnek. .
Hotpot..
Dalle-mini
.
AI fejlövő generátor
. . Tökéletes a közösségi média profilokhoz, társkereső alkalmazásokhoz, LinkedIn profilokhoz, vagy egyszerűen csak új módon látja magát.
AI művészet
. .
Az NVIDIA, a Google, a Stabilitás úttörő kutatása alapján.AI és Openai, ezek az AI képmodellek megérthetik az egyszerű utasításokat és képeket készítenek – hasonlóan ahhoz, hogy az emberi művészek hogyan kapnak utasításokat a mecénásoktól. De vajon ez a művészet vagy akár az intelligencia?
Rövid válasz: Nem számít, hogy ezek a termékek tükrözik -e a művészetet vagy az intelligenciát. Az az számít, hogy segítenek az embereknek. Segíthet -e az AI a képzeletének valósággá változtatni, és mosolyt hozhat az arcába, vagy talán az áru alapjává válhat, hogy eladja a Shopify -ot, vagy segítsen a következő album borítójának létrehozásában?
További gondolatok az AI művészetről.