Mik azok a GAN-ok? Hogyan és miért érdemes használni őket!



Ez a cikk a „Mik azok a GAN-ok” részletes magyarázatát tartalmazzák, korlátozásokkal és kihívásokkal, amelyek lefedik a képzési folyamatot és a Felhasználási esetek megvalósítását.

A Generative Adversarial Networks vagy a GAN generatív modellezési megközelítés Mély tanulás okosan képezni a modellt adatok generálására a szubmodell megközelítés alkalmazásával. Ebben a cikkben megpróbáljuk részletesen megérteni a „Mik azok a GAN-ok” címet. Ez a cikk a következő témákkal foglalkozik:

Mik azok a generatív modellek?

A generatív modellek nem mások, mint azok, amelyek egy megközelítés. Egy generatív modellben vannak minták az adatokban, vagyis az X bemeneti változók, de hiányzik belőle az Y kimeneti változó. Csak a bemeneti változókat használjuk a generatív modell kiképzéséhez, és a bemeneti változókból mintákat ismer fel ismeretlen kimenet előállításához. és csak a képzési adatok alapján.





Ban ben , jobban igazodunk a bemeneti változókból származó prediktív modellek létrehozásához, ezt a típusú modellezést diszkriminatív modellezésnek nevezzük. Osztályozási probléma esetén a modellnek meg kell különböztetnie, hogy a példa melyik osztályba tartozik. Másrészt felügyelet nélküli modelleket használnak új példák létrehozására vagy létrehozására az input terjesztésben.

mik a csomagok a java-ban

A generatív modellek meghatározása laikus kifejezéssel azt mondhatjuk, hogy a generatív modellek képesek a mintából új példákat generálni, amelyek nemcsak hasonlóak más példákhoz, de megkülönböztethetetlenek is.



A generatív modell leggyakoribb példája a amelyet gyakrabban használnak diszkriminatív modellként. A generatív modellek további példái közé tartozik a Gauss-féle keverékmodell és egy meglehetősen modern példa, amely a General Adversarial Networks. Próbáljuk megérteni, hogy mi a GAN?

Mi az a generatív kontradiktórius hálózat?

A Generative Adversarial Networks vagy a GAN egy mélyen tanuláson alapuló generatív modell, amelyet a felügyelet nélküli tanuláshoz használnak. Alapvetően egy olyan rendszerről van szó, ahol kettő versenyez Neurális hálózatok versengenek egymással az adatok variációinak létrehozása vagy létrehozása érdekében.

Először 2014-ben írta le Ian Goodfellow, és egy szabványosított és sokkal stabilabb modellelméletet Alec Radford javasolt 2016-ban, amely DCGAN (Deep Convolutional General Adversarial Networks) néven ismert. A ma létező GAN-ok többsége DCGAN-architektúrát használ.



A GAN architektúra két almodellből áll Generátor modell és a Diszkriminátor modell. Próbáljuk megérteni, hogyan működnek a GAN-ok.

Hogyan működik?

A GAN működésének megértéséhez bontsuk le.

  • Generatív - Ez azt jelenti, hogy a modell követi a megközelítés és generatív modell.
  • Kontradiktórius - A modellt ellentétes körülmények között képezték ki
  • Hálózat - A modell oktatásához a neurális hálózatokat használja mesterséges intelligencia algoritmusként.

A GAN-okban van egy Generator hálózat, amely mintát vesz és generál adatmintát, majd ezt követően a Diszkriminátor hálózat eldönti, hogy az adatokat binárisan állítják-e elő vagy veszik-e a valós mintából. probléma egy sigmoid függvény segítségével, amely a kimenetet 0 és 1 közötti tartományba adja.

folyamatábra - mik azok a gnas - edureka

A generatív modell úgy elemzi az adatok eloszlását, hogy a képzési szakasz után a diszkriminátor hibázásának valószínűsége maximalizálódik. A Diszkriminátor pedig egy olyan modellen alapszik, amely megbecsüli annak valószínűségét, hogy a minta a valós adatokból származik, és nem a generátorból.

A teljes folyamat az alábbiakban megadott matematikai képlettel formalizálható.

A fenti képletben:

G = Generátor

D = Diszkriminátor

Pdata (x) = Valódi adatok eloszlása

Pdata (z) = A generátor forgalmazója

x = minta valós adatokból

z = minta a generátorból

különbség a hasmap és a hashtable között a java-ban

D (x) = Diszkriminátor hálózat

G (z) = Generátor hálózat

Most következik a GAN képzési része, amelyet további 2 részre lehet osztani, amelyeket egymás után végeznek.

Hogyan képezzünk egy GAN-t?

1. rész:

Képezze ki a diszkriminátort és fagyassza le a generátort, ami azt jelenti, hogy a generátor számára beállított betanítás False-ként van bekapcsolva, és a hálózat csak az elõzõ átadást hajtja végre, és nem alkalmaznak vissza-terjedést.

Alapvetően a megkülönböztető képzést kap a valódi adatokról, és ellenőrzi, hogy képes-e őket előre megjósolni, és ugyanezt a hamis adatokkal is, hogy hamisnak azonosítsa őket.

2. rész:

Képezze ki a generátort és fagyassza le a diszkriminátort. Ebben a szakaszban megkapjuk az első fázis eredményeit, és felhasználhatjuk őket arra, hogy az előző állapotból jobbá tegyük a diszkriminátor jobb becsapására.

Az edzés lépései

  1. Határozza meg a problémát - határozza meg a problémát és gyűjtsön adatokat.
  2. Válassza a GAN architektúráját - A problémától függően válassza ki, hogyan nézzen ki a GAN.
  3. Vonat-diszkriminátor a valós adatokról - Képezze a megkülönböztető személyt valós adatokkal, hogy n-sokszor valósnak jelezze őket.
  4. Hamis bemenetek generálása a generátor számára - Készítsen hamis mintákat a generátorból
  5. Vonat-diszkriminátor a hamis adatokról - A diszkriminátor képzése arra, hogy a keletkezett adatokat hamisnak jelezze.
  6. Vonatgenerátor a diszkriminátor teljesítményével - Miután megkapta a megkülönböztető jóslatokat, képezze a generátort, hogy becsapja a megkülönböztetőt

A generatív kontradiktórius hálózat kihívásai

A GAN-ok koncepciója meglehetősen lenyűgöző, de sok olyan kudarc van, amely sok akadályt okozhat az útjában. A GAN-ok előtt álló néhány fő kihívás a következő:

  1. Stabilitás szükséges a diszkriminátor és a generátor között, különben az egész hálózat csak leesne. Abban az esetben, ha a megkülönböztető eszköz túl erős, a generátor nem fog teljesen edzeni. És ha a hálózat túl engedékeny, akkor bármilyen kép keletkezik, ami használhatatlanná teszi a hálózatot.
  2. A GAN-ok nagy kudarcot vallanak a az objektumok pozícionálása abból a szempontból, hogy az objektumnak hányszor kell megjelennie ezen a helyen.
  3. A 3D-s perspektíva zavarja a GAN-okat, mivel nem képes megérteni perspektíva , gyakran ad sík képet egy 3D-s objektumhoz.
  4. A GAN-oknak problémája van a globális objektumok . Nem képes megkülönböztetni vagy megérteni a holisztikus struktúrát.
  5. Az újabb típusú GAN-ok fejlettebbek, és várhatóan teljes mértékben kiküszöbölik ezeket a hiányosságokat.

Generatív kontradiktórius hálózati alkalmazások

Az alábbiakban bemutatjuk a GAN-ok néhány alkalmazását.

A következő képkocka előrejelzése egy videóban

A jövőbeni események előrejelzése egy videoképben a GAN-ok segítségével lehetséges. A DVD-GAN vagy a Dual Video Discriminator GAN 256 × 256 videókat képes létrehozni, amelyek hűségesek, legfeljebb 48 képkocka hosszúságig. Ez felhasználható különféle célokra, beleértve a megfigyelést is, amelyben meghatározhatjuk a tevékenységeket olyan keretek között, amelyek torzulnak más tényezők, például eső, por, füst stb. Miatt.

Szöveg képgenerálás

Az objektumvezérelt figyelmes GAN (obj-GAN) két lépésben hajtja végre a szöveg-kép szintézist. A szemantikus elrendezés létrehozása a kezdeti lépés, majd a kép előállítása a kép szintetizálásával egy konvolúció nélküli képgenerátor segítségével az utolsó lépés.

Ezt intenzíven lehetne felhasználni képek előállítására a feliratok, elrendezések megértésével és a részletek finomításával a szavak szintetizálásával. Van egy másik tanulmány a storyGAN-ról, amely egyszerű bekezdésekből képes szintetizálni az egész storyboardokat.

A kép felbontásának javítása

A szuperfelbontású generatív kontradiktórius hálózat vagy az SRGAN egy GAN, amely alacsony felbontású képekből finomabb részletességgel és jobb minőséggel képes szuperfelbontású képeket előállítani.

Az alkalmazások hatalmasak lehetnek, képzelj el egy jobb minőségű képet, finomabb részletekkel, amelyeket egy kis felbontású kép generál. A kis felbontású képek részleteinek azonosításához nyújtott segítséget szélesebb körű célokra lehet felhasználni, ideértve a felügyeletet, a dokumentációt, a biztonságot, a minták felismerését stb.

Kép-kép fordítás

A Pix2Pix GAN egy általános célú kép-kép-fordításra tervezett modell.

Interaktív képgenerálás

A GAN-ok felhasználhatók interaktív képek előállítására is, a Computer Science és a mesterséges intelligencia laboratórium (CSAIL) kifejlesztett egy GAN-t, amely valósághű megvilágítással és tükröződéssel rendelkező 3D-s modelleket képes létrehozni az alak és a textúra szerkesztése által.

adja át az értéket és adja át a referenciát a java-ban

A közelmúltban a kutatók előálltak egy olyan modellel, amely képes szintetizálni az ember mozgása által animált újrarajzolt arcot, ugyanakkor megőrzi az arc megjelenését.

Ezzel eljutottunk a cikk végéhez, ahol megtanultuk a „Mik a GAN-ok” c. Remélem, tisztában van azzal, amit megosztott veled ebben az oktatóanyagban.

Ha relevánsnak találta ezt a cikket a „Mik azok a GAN-ok” témában, nézze meg a egy megbízható online tanulási vállalat, amelynek több mint 250 000 elégedett tanulóból álló hálózata van az egész világon.

Azért vagyunk itt, hogy segítsünk az utazás minden lépésében, és kidolgozzunk egy tananyagot, amelyet olyan hallgatók és szakemberek számára tervezünk, akik szeretnének . A tanfolyamot úgy tervezték meg, hogy előrelépést nyújtson a Python programozásában, és képezze mind az alapvető, mind a haladó Python fogalmakra a különféle megoldásokkal együtt tetszik

Ha bármilyen kérdése merülne fel, nyugodtan tegye fel minden kérdését a „Mik azok a GAN-ok” megjegyzés rovatban, és csapatunk örömmel válaszol.