Szükségem van -e GPU -ra a stabil diffúzióhoz? PC útmutató, stabil diffúziós referenciaértékű: Melyik GPU fut a leggyorsabb (frissítve) | Tom s hardver

Egy pillanat alatt eljutunk más elméleti számítási teljesítményszámhoz, de példaként ismét az RTX 2080 Ti és az RTX 3070 Ti -t tekintjük. A 2080 -as Ti tensor magok nem támogatják a ritkaságot, és akár 108 TFLOPS FP16 számítással rendelkeznek. . Az a tény, hogy a 2080 -as TI legyőzi a 3070 Ti -t, egyértelműen azt jelzi, hogy a ritkaság nem tényező. Ugyanez a logika vonatkozik más összehasonlításokra, mint például a 2060 és 3050, vagy a 2070 Super és a 3060 Ti.

?

Kíváncsi vagy, hogy szüksége van -e GPU -ra a stabil diffúzióhoz? A megfelelő helyre jöttél.

A stabil diffúzió kétségtelenül egy gyors és intuitív AI művészet generáló eszköz, mint például a Dall-E és a MidJourney. Eredményei lenyűgözőek, tehát most több millió felhasználó van. Ha azonban a számítógépen szeretné használni, ellenőrizze, hogy a követelmények teljesülnek, különösen a grafikus kártyák esetében. Ebből beszélve, arról fogunk beszélni, hogy a stabil diffúzió GPU nélkül működhet -e, vagy ha továbbra is szüksége lesz egy grafikus kártyára a megfelelő működéshez.

A GPU -k vagy a grafikus kártyák apró technikák, amelyek komolyan frissítik a játék vagy a kreatív szakmai élményt. Alapvető fontosságúak az AI által generált művészet létrehozásához kereskedelmi vagy szakmai szinten.

Alapvető AI eszközök

Exkluzív üzlet 10 000 ingyenes bónusz kredit

Márkás AI tartalom bárhová is létrehoz. . Egy AI eszköz, a legjobb modellek.

. 8 millió felhasználó élvezi a blogok írását 10x gyorsabb, könnyedén létrehozva a magasabb konvertáló közösségi média bejegyzéseket vagy vonzóbb e -maileket írni. Iratkozzon fel egy ingyenes próbára. Olvass tovább

Csak 0 dollár.!

Winston AI detektor

Winston AI: A legmegbízhatóbb AI -detektor. .

.01 /100 szó

Eredetiség AI detektor

Eredetiség.Az AI a legpontosabb AI detektálás.A 1200 adatminta tesztelési adatkészletén keresztül 96% -os pontosságot ért el, míg a legközelebbi versenytársa csak 35% -ot ért el. Hasznos króm kiterjesztés. Az e -mailek, a Google dokumentumok és a webhelyek közötti észlelések. Olvass tovább

*Az árak megváltozhatnak. A PC útmutató olvasó által támogatott. Amikor a webhelyünk linkjein keresztül vásárol, kaphatunk kapcsolt jutalékot.

Tehát szüksége van egy stabil diffúzió grafikus kártyájára, hogy működjön? Vagy az egyik kicserélheti a másikot? Találjuk ki.

?

Igen, ahhoz, hogy a stabil diffúzió zavartalanul működjön, bármilyen probléma nélkül GPU -val kell rendelkeznie a számítógépen. Legalább nézzen meg a 8-10 GB-os NVIDIA modelleket. Sőt, győződjön meg arról, hogy a PC -rendszerben 16 GB PC RAM van az instabilitás elkerülése érdekében.

A GPU stabil diffúziót fog futtatni anélkül, hogy olyan kérdésekbe kerülne, mint egy lassabb reagáló sebesség. . Ami a GPU használatát illeti, javasoljuk az NVIDIA RTX 4080 és 4090 modelleket, 16 vagy 24 GB VRAM -mal a legjobb eredmények elérése érdekében. Ezek komolyan erőteljes készletek, amelyek garantálják a gyors szolgáltatást.

Lehetséges -e stabil diffúziót futtatni egy AMD GPU -n??

Igen, stabil diffúziót is futtathat az AMD GPU -n, az NVIDIA sorozatú modelleken kívül. . Sőt, a legjobb eredmény elérése érdekében győződjön meg arról, hogy van -e további 8 GB -os vagy annál magasabb, hogy elkerülje a kellemetlenségeket.

Működhet -e a stabil diffúzió az Apple Mac processzorokon?

Igen, a stabil diffúzió támogatja az Apple Mac könyveket. . Bármely modell korábban nem a legjobb eredmény. Még egy régebbi M1 és M2 modell is rendben lesz, ha teljesíti a követelményeket.

A GPU rendelkezése kötelező követelmény a mai technológiai világban. . . Bár van néhány módja annak, hogy GPU nélkül futtassák, nem olyan megbízhatóak, mint amilyennek tűnhetnek. .

A grafikus kártya általában jó ötlet a legtöbb kihozáshoz a PC -ből. Tízszeresen javítják a játék- és kreatív élményeket. Ha olyan ötletekre van szüksége, amelyekhez menni kell, nézd meg itt a legjobb grafikus kártyák kerekítését.

Stabil diffúziós referenciaértékű: Melyik GPU a leggyorsabban futtatja (frissítve)

. . De milyen gyorsan vannak a fogyasztói GPU -k az AI következtetéshez?

Megállapítottuk a stabil diffúziót, a népszerű AI -kép -készítőt a legújabb Nvidia, AMD és még az Intel GPU -n, hogy megnézzük, hogyan állnak össze. ! – ez lehet. A rövid összefoglaló az, hogy az NVIDIA GPUS -ja a Roost -ot szabályozza, a legtöbb szoftverrel, amelyet CUDA és más NVIDIA eszközök segítségével terveztek. De ez nem azt jelenti, hogy nem tudsz stabil diffúziót futtatni a másik GPU -n.

Végül három különféle stabil diffúziós projektet használtunk a teszteléshez, főleg azért, mert egyetlen csomag sem dolgozott minden GPU -n. Az NVIDIA esetében az Automatic 1111 Webui verzióját választottuk; A legjobban teljesített, több lehetősége volt, és könnyű volt futni. Az AMD GPU -t Nod segítségével teszteltük.. . Az Intel Arc GPU -jának futásának megszerzése egy kicsit nehezebb volt a támogatás hiánya miatt, de a stabil diffúziós Openvino adott nekünk néhányat alapvető funkcionalitás.

. Nem kódoltuk ezeket az eszközöket, de olyan dolgokat kerestünk, amelyeket könnyű futtatni (Windows alatt), amely szintén úgy tűnt, hogy ésszerűen optimalizált. Viszonylag biztosak vagyunk abban, hogy az NVIDIA 30-sorozatú tesztek jó munkát végeznek az optimális teljesítmény közelében való kinyeréshez-különösen akkor, ha az XFormers engedélyezve van, ami további ~ 20% -os teljesítményt nyújt a teljesítményben (bár csökkentett pontossággal, amely befolyásolhatja a minőséget). Az RTX 40 sorozatú eredmények kezdetben alacsonyabbak voltak, de George SV8ARJ biztosította ezt a javítást, ahol a Pytorch Cuda DLL cseréje egészséges lendületet adott a teljesítménynek.

Az AMD eredményei szintén egy kicsit vegyes táskák: az RDNA 3 GPU nagyon jól teljesít, míg az RDNA 2 GPUS meglehetősen közepesnek tűnik. Bólint.Az AI tudatja velünk, hogy továbbra is dolgoznak az RDNS 2 „hangolt” modelljein, amelyeknek eléggé növelik a teljesítményt (potenciálisan duplán), amint rendelkezésre állnak. .

. .Az AI cápa verziója SD2 -t használ…1 az automatikus 1111 -en). Ismét, ha van valamilyen belső ismerete a stabil diffúzióról, és szeretné ajánlani a különféle nyílt forráskódú projekteket, amelyek jobban működhetnek, mint amit használtunk, tudassa velünk a megjegyzésekben (vagy csak e -mailben Jarred e -mailben).

A tesztelési paramétereink minden GPU -nál azonosak, bár nincs lehetőség negatív prompt opcióra az Intel verzión (legalábbis nem azt, hogy megtalálhatnánk). , hosszabb, hogy befejezze). . . Itt vannak a releváns beállítások:

Pozitív prompt:


Lépések:

Osztályozó ingyenes útmutatás:
.0


. .

Íme az AMD RX 7000/6000 sorozat, az NVIDIA RTX 40/30-sorozat és az Intel ARC A-Series GPU-k tesztelése eredményei. Vegye figyelembe, hogy minden NVIDIA GPU -nak két eredménye van: az egyik az alapértelmezett számítási modellt (lassabban és fekete), a második pedig a Facebook gyorsabb “XFormers” könyvtárát használja (gyorsabban és zöldben).

. . Alig több mint három másodpercbe telik az egyes képek generálása, és még az RTX 4070 Ti is képes kiütni a 3090 TI -t (de nem, ha letiltja az XFormers -t).

A dolgok nagyon következetes módon esnek le az NVIDIA GPU -k legfontosabb kártyáiról, a 3090 -től a 3050 -ig. Eközben az AMD RX 7900 XTX köti az RTX 3090 TI -t (kiegészítő újravizsgálat után), míg az RX 7900 XT köti az RTX 3080 TI -t. . . .

A megfelelő optimalizálás megduplázhatja a teljesítményt az RX 6000 sorozatú kártyákon. Bólint.Az AI szerint az elkövetkező napokban be kellett hangolnia az RDNS 2 modelleit, ahol a teljes állást jobban kell korrelálni az elméleti teljesítménygel. Bólintásról szólva..52 it/s a 4090, 13 -on.31 A 4080, 11 -en..76 A 3090 -en – nem tudtuk kipróbálni a többi kártyát, mivel ezeket először engedélyezni kell).

A 7900 -as kártyák hangolt modelljeinek felhasználásával történő teljesítménye alapján kíváncsi vagyunk az NVIDIA kártyákra és arra, hogy mennyire képesek kihasználni a tenzor magjaikat. Papíron a 4090 -nek az RX 7900 XTX – és 2 teljesítményének ötszörösének ötszöröse van.A teljesítmény 7 -szerese akkor is, ha kedvezményes a szűkösségnek. A gyakorlatban a 4090 jelenleg csak körülbelül 50% -kal gyorsabb, mint az XTX az általunk használt verziókkal (és ez mindössze 13% -ra csökken, ha elhagyjuk az alacsonyabb pontosságú XFormers eredményt). .

Az Intel ARC GPU -ja jelenleg nagyon kiábrándító eredményeket hoz, különösen mivel támogatják az FP16 XMX (Matrix) műveleteket, amelyeknek akár 4x -es teljesítményt kell biztosítaniuk a rendszeres FP32 számításokként. . Mellesleg, ha meg akarja próbálni az SD futtatását egy ARC GPU -n, vegye figyelembe, hogy szerkesztenie kell a ‘stabil_diffusion_engine -t.PY ‘Fájl és a “CPU” módosítása “GPU” -ra – különben nem fogja használni a grafikus kártyákat a számításokhoz, és lényegesen hosszabb ideig tart.

. . .

. . De az eredmények itt nagyon érdekesek.

Először, az RTX 2080 Ti véget vet az RTX 3070 TI -nek. Ez általában nem történik meg, és a játékokban még a vanília 3070 is hajlamos legyőzni az egykori bajnokot. Ennél is fontosabb, hogy ezek a számok azt sugallják, hogy az NVIDIA “Sparsity” optimalizálásait az amper -építészetben egyáltalán nem használják – vagy talán egyszerűen nem alkalmazhatók.

Egy pillanat alatt eljutunk más elméleti számítási teljesítményszámhoz, de példaként ismét az RTX 2080 Ti és az RTX 3070 Ti -t tekintjük. A 2080 -as Ti tensor magok nem támogatják a ritkaságot, és akár 108 TFLOPS FP16 számítással rendelkeznek. . Az a tény, hogy a 2080 -as TI legyőzi a 3070 Ti -t, egyértelműen azt jelzi, hogy a ritkaság nem tényező. .

. Az 5700 XT a 6650 XT előtt, de a 6600 alatti 5700 földet megelőzően landol. Papíron az XT -kártyának legfeljebb 22% -kal kell lennie. Tesztelésünk során azonban 37% -kal gyorsabb. .

Végül, a GTX 1660 szuper papíron körülbelül 1/5 -nek kell lennie az RTX 2060 elméleti teljesítményének, az utóbbi tensor magjainak felhasználásával. . De a tesztelésünk során a GTX 1660 Super csak körülbelül 1/10 az RTX 2060 sebessége.

. Az sem világos, hogy ezek a projektek teljes mértékben kihasználják -e azokat a dolgokat, mint az NVIDIA Tenzormagjai vagy az Intel XMX magjai. Mint ilyen, azt gondoltuk, hogy érdekes lenne megnézni a különféle GPU -k maximális elméleti teljesítményét (TFLOPS). A következő táblázat bemutatja az egyes GPU -k elméleti FP16 teljesítményét (csak a legújabb grafikus kártyákat nézve), a tensor/mátrix magok felhasználásával, ahol alkalmazható. Az Nvidia eredményei magukban foglalják a szűkösséget is – alapvetően az a képesség, hogy a mátrixban a sejtek legfeljebb felét a szaporodásokkal kiugorják, ami állítólag nagyon gyakori előfordulás a mély tanulási munkaterhelésekkel.

Azok a tenzormagok az NVIDIA -n egyértelműen csomagolnak egy lyukasztót (a szürke/fekete rudak nem ritkán vannak), és a stabil diffúziós tesztelésünk nyilvánvalóan nem felel meg pontosan ezeknek a figuráknak – még nem is közeli. . .

Közben nézd meg az ív GPU -t. . . A leggyorsabb A770 GPU -k az RX 6600 és az RX 6600 XT között az A750 az RX 6600 mögött esik, és az A380 az A750 sebességének körülbelül egynegyede. .

. Az A380 elméleti számítási teljesítménye körülbelül egynegyed az A750-ben, és itt leszáll a stabil diffúziós teljesítmény szempontjából. Valószínűleg az ARC GPU -k árnyékolókat használnak a számításokhoz, teljes precíziós FP32 módban, és hiányoznak néhány további optimalizálásról.

A másik dolog, amit észre kell venni, az, hogy az AMD RX 7900 XTX/XT elméleti számítása sokat javult az RX 6000-sorozathoz képest. .AI azt mondta, hogy a teljesítmény 2x javulását várja el az RDNS 2 -en. A memória sávszélessége nem volt kritikus tényező, legalábbis az általunk használt 512×512 cél felbontáshoz – a 3080 10 GB és 12 GB -os modellek viszonylag közel állnak egymáshoz.

. . .

Nyilvánvaló, hogy az FP16 számításának ez a második pillantása nem felel meg a tényleges teljesítményünknek, mint a tensor és a mátrix magok diagramja, de talán további összetettség van a mátrix számítások beállításában, és így a teljes teljesítmény szükséges. . .

. Nem teszteltük az új AMD GPU-kat, mivel a Linux-ot kellett használnunk az AMD RX 6000-sorozatú kártyákon, és nyilvánvalóan az RX 7000-sorozatnak újabb Linux kernelre van szüksége, és nem tudtuk működni. .

. . A 4070 Ti érdekes módon 22% -kal lassabb volt, mint a 3090 Ti, az XFormers nélkül, de 20% -kal gyorsabb az XFormers -szel.

Úgy tűnik, hogy a 2048×1152 bonyolultabb célfelbontása jobban kihasználja a potenciális számítási erőforrásokat, és talán a hosszabb futási idő azt jelenti, hogy a tenzormagok teljes mértékben hajlíthatják az izomjukat.

Végül ez a legjobb esetben egy pillanatkép a stabil diffúziós teljesítmény idején. Gyakori projektfrissítéseket látunk, a különféle képzési könyvtárak támogatását és még sok más. .

. .

Információinak benyújtásával elfogadja a feltételeket és az adatvédelmi irányelvet, és 16 éves vagy annál idősebb.

. 2004 óta dolgozik technológiai újságíróként, az Anandtech, a Maximum PC és a PC Gamer számára ír. .