Melyek a gépi tanulás előfeltételei?



Ez a gépi tanulás előfeltételeiről szóló blog segít megérteni azokat az alapvető fogalmakat, amelyeket tudnia kell, mielőtt elkezdené a gépi tanulást.

A gépi tanulás kétségtelenül a korszak legkeresettebb technológiája! Ha kezdő vagy, aki kezdi a gépi tanulást, fontos, hogy ismerje a gépi tanulás előfeltételeit. Ez a blog segít megérteni azokat a különböző fogalmakat, amelyeket ismernie kell, mielőtt elkezdené a gépi tanulást.

A mesterséges intelligencia és a gépi tanulás mélyreható ismereteinek megszerzéséhez regisztrálhat élőben Edureka 24/7 támogatással és élethosszig tartó hozzáféréssel.





Íme a témák listája ez a blog foglalkozik:

  1. A gépi tanulás előfeltételei
  2. A gépi tanulás megértése használati esettel

A gépi tanulás előfeltételei

KezdeniA gépi tanulásnak ismernie kell a következő fogalmakat:



  1. Statisztika
  2. Lineáris algebra
  3. Számítás
  4. Valószínűség
  5. Programozási nyelvek

Statisztika

A statisztikák olyan eszközöket tartalmaznak, amelyek felhasználhatók valamilyen eredmény elérésére az adatokból. Vannak leíró statisztikák, amelyeket néhány fontos információ nyers adatainak átalakítására használnak. Ezenkívül a következtetési statisztikák felhasználhatók arra, hogy a teljes adatkészlet használata helyett fontos információkat nyerjenek egy adatmintából.

További információkért A statisztikákat a következő blogokban tekintheti meg:

Lineáris algebra

Lineáris algebra foglalkozikvektorokkal, mátrixokkal és lineáris transzformációkkal. Nagyon fontos a gépi tanulásban, mivel felhasználható az adatkészlet átalakítására és műveleteinek végrehajtására.



Számítás

A számítás fontos terület a matematikában, és szerves szerepet játszik számos gépi tanulási algoritmusban. Több jellemzővel rendelkező adatkészletgépi tanulási modellek felépítésére használják, mivel a jellemzők többféle változók, a gépi tanulási modell felépítésében fontos szerepet játszik a számítás. Az integrációk és a differenciálások elengedhetetlenek.

Valószínűség

A valószínûség segít megjósolni az események valószínûségét, segít nekünk abban, hogy a helyzetet megismételjük, vagy nem. A gépi tanulásnál a valószínűség a Alapítvány.

Mathematics

Ha többet szeretne megtudni a Valószínűségről, átélheti ezt Blog.

egyesítés rendezés c ++ algoritmus

Programozási nyelv

A gépi tanulás teljes folyamatának megvalósításához elengedhetetlen a programozási nyelvek ismerete, például az R és a Python. A Python és az R beépített könyvtárakat kínálnak, amelyek nagyon megkönnyítik a Machine Learning algoritmusok megvalósítását.

Az alapvető programozási ismeretek mellett az is fontos, hogy tudd, hogyan kell kinyerni, feldolgozni és elemezni az adatokat. Ez az egyik legfontosabb képesség, amely a gépi tanuláshoz szükséges.

Ha többet szeretne megtudni a programozásról A gépi tanulás nyelvein a következő blogokat tekintheted meg:

  1. A legjobb Python könyvtárak az adattudomány és a gépi tanulás számára

Gépi tanulás használati esete

A gépi tanulás lényege egy algoritmus létrehozása, amely az adatokból tanulva előrejelzést adhat, például milyen típusú objektumok vannak a képen, vagy az ajánlásmotor, a gyógyszerek legjobb kombinációja az adott betegség vagy a spamszűrés gyógyítására.

A gépi tanulás matematikai előfeltételekre épül, és ha tudja, miért használják a matematikát a gépi tanulásban, az szórakoztatóvá teszi. Ismernie kell a használni kívánt függvények mögött álló matematikát, valamint azt, hogy melyik modell alkalmas az adatokra és miért.

Kezdjük tehát egy érdekes problémával a házárak előrejelzésében, mivel rendelkezünk egy adatkészlettel, amely különböző jellemzők és árak történetét tartalmazza, egyelőre figyelembe vesszük a lakóterület négyzetméter alapterületét és az árakat.

Most van egy adatsorunk, amely két oszlopot tartalmaz, az alábbiak szerint:

Bizonyos összefüggésnek kell lennie e két változó között, hogy kiderüljön, szükségünk lesz-e egy olyan modell felépítésére, amely képes megjósolni a házak árát.

Ábrázoljuk ezeket az adatokat, és nézzük meg, hogyan néz ki:

Itt az X tengely a lakótér négyzetméterenkénti ára, az Y tengely pedig a ház ára. Ha az összes adatpontot ábrázoljuk, akkor kapunk egy szóródási diagramot, amelyet egy vonallal ábrázolhatunk, amint az a fenti ábrán látható, és ha beírunk néhány adatot, akkor ez megjósol valamilyen eredményt. Ideális esetben meg kell találnunk egy vonalat, amely metszi a maximális adatpontokat.

Itt megpróbálunk létrehozni egy sort, amelyet a következőknek nevezünk:

Y = mX + c

Ezt a módszert a cél (függő változó) és a prediktor változó (független változó) közötti lineáris kapcsolat előrejelzésére lineáris regressziónak nevezzük. Ez lehetővé teszi számunkra, hogy tanulmányozzuk és összefoglaljuk két változó közötti kapcsolatot.

  • X = Független változó
  • Y = Függő változó
  • c = y-metszéspont
  • m = a vonal meredeksége

Ha figyelembe vesszük az egyenletet, akkor vannak értékeink X-re, amely egy független változó, így csak annyit kell tennünk, hogy kiszámoljuk m és c értékeit, hogy megjósoljuk Y értékét.

Tehát hogyan találjuk meg ezeket a változókat?

Ezeknek a változóknak a megtalálása érdekében kipróbálhatunk egy csomó értéket, és megpróbálhatunk olyan vonalat megtudni, amely metszi a maximális adatpontok számát. De hogyan lehet megtalálni a legjobban illeszkedő vonalat?

Tehát a legjobban illeszkedő vonal megtalálásához használhatjuk a legkisebb négyzetek hibafüggvényt, amely megtalálja az y valós értéke és a megjósolt y érték közötti hibát.

A legkisebb négyzet hibafüggvény a következő egyenlet segítségével ábrázolható:

Ennek a függvénynek a segítségével megtudhatjuk az egyes előrejelzett adatpontok hibáját, összehasonlítva azt az adatpont tényleges értékével. Ezután összeszedi ezeket a hibákat és négyzetbe állítja őket, hogy megtudja az előrejelzés eltérését.

hogyan készítsen mély másolatot java-ban

Ha hozzáadjuk a harmadik tengelyt az összes lehetséges hibaértéket tartalmazó grafikonunkhoz, és háromdimenziós térben ábrázoljuk, a következőképpen néz ki:

A fenti képen az ideális értékek a fekete alsó részen lennének, amely megjósolja az árakat a tényleges adatpont közelében. A következő lépés az m és c lehető legjobb értékeinek megtalálása. Ez a gradiens ereszkedésnek nevezett optimalizálási technika alkalmazásával valósítható meg.

A gradiens süllyedés egy iteratív módszer, ahol a változók néhány értékkészletének inicializálásával kezdjük, és lassan javítjuk őket a tényleges és a megjósolt érték közötti hiba minimalizálásával.

Most, ha azt gondoljuk, hogy a lakás árai valójában nem csak a négyzetméter árától függenek, sok tényező létezik, például a hálószobák, a fürdőszobák száma stb. Ha figyelembe vesszük ezeket a jellemzőket is, akkor az egyenlet valamit kinéz mint ez

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Ez egy többvonalas regresszió, ez a lineáris algebra része, itt használhatunk mxn méretű mátrixokat, ahol m jellemzők és n adatpontok.

Vegyünk egy másik helyzetet, ahol a valószínűség alapján meg tudjuk találni a ház állapotát, hogy a házat besorolhassuk az alapján, hogy jó vagy rossz állapotban van-e. Ehhez a munkához a Logistic Regression nevű technikát kell használnunk, amely a szigmoid függvény által képviselt események valószínűségén dolgozik.

Ebben a cikkben kitértünk a gépi tanulás előfeltételeire és azok alkalmazására a gépi tanulásban. Tehát alapvetően statisztikákból, számításokból, lineáris algebrákból és valószínűségelméletekből áll. A Calculusnak vannak optimalizálási technikái, a lineáris algebra algoritmusokkal rendelkezik, amelyek hatalmas adatkészleteken dolgozhatnak, valószínűséggel megjósolhatjuk az előfordulások valószínűségét, és a statisztikák hasznos következtetésekre engednek következtetni az adatsorok mintájából.

Most, hogy ismeri a gépi tanulás előfeltételeit, biztos vagyok benne, hogy kíváncsi további információkra. Íme néhány blog, amelyek segítenek a Data Science használatának megkezdésében:

Ha be akar jelentkezni a mesterséges intelligencia és a gépi tanulás teljes tanfolyamára, az Edureka speciálisan kurátora van amellyel jártas lesz az olyan technikákban, mint a felügyelt tanulás, a felügyelet nélküli tanulás és a természetes nyelv feldolgozása. Képzést tartalmaz a mesterséges intelligencia és a gépi tanulás legújabb fejleményeiről és technikai megközelítéseiről, mint például a mély tanulás, a grafikus modellek és a megerősítő tanulás.