A gépi tanulás statisztikája: Útmutató kezdőknek



Ez a cikk a Gépi tanulás statisztikáiról átfogó útmutató a statisztikák különböző fogalmairól, példákkal.

Az adatok megértése és azok értékteremtése az évtized képessége. A gépi tanulás egy olyan alapvető készség, amely segíti a vállalatokat annak megvalósításában. A kezdéshez azonban meg kell építeni az alapjait. Tehát ebben a cikkben néhány alapfogalommal foglalkozom, és útmutatással szolgálok a gépi tanulás útjának megkezdéséhez. Tehát ebben a cikkben a gépi tanulás statisztikáiról a következő témákat tárgyaljuk:

  1. Valószínűség
  2. Statisztika
  3. Lineáris algebra

A gépi tanulás valószínűsége és statisztikája:





Mi a valószínűség?

A valószínűség számszerűsíti az esemény bekövetkezésének valószínűségét. Például, ha tisztességes, elfogulatlan kockát dob, akkor annak valószínűsége egy a felfordulás 1/6 . Most, ha kíváncsi vagyhy? Akkor a válasz meglehetősen egyszerű!

Ennek oka az, hogy hat lehetőség van, és mindegyik egyformán valószínű (fair die). Ezért hozzátehetjük 1 + 1 + 1 + 1 + 1 + 1 = 6. De mivel minket érdekel a esemény, ahol 1 fordul elő . Van csak egy módon fordulhat elő az esemény. Ebből adódóan,



1 felfordulás valószínűsége = 1/6

Hasonló a helyzet az összes többi számmal, mivel minden esemény egyformán valószínű. Egyszerű, igaz?

Nos, ennek a példának a gyakorisága szerint a valószínűség meghatározása így hangzik - az 1-es felfordulás valószínűsége az 1-es fordulatszám és a szerszám végtelen számú hengerlésének az aránya. alkalommal.Hogy van ennek értelme?



Tegyük érdekesebbé. Vegyük figyelembe a két esetet - ötször dobtál korrekt kockát. Egy esetben a felfelé forduló számok sorrendje - [1,4,2,6,4,3]. A másik esetben megkapjuk - [2,2,2,2,2,2]. Ön szerint melyik a valószínűbb?

Mindkettő egyformán valószínű. Furcsának tűnik, igaz?

Most vegyünk fontolóra egy másik esetet, ahol mindegyik 5 tekercs van független . Vagyis az egyik tekercs nem érinti a másikat. Az első esetben, amikor 6 fordul elő, fogalma sem volt arról, hogy 2 megfordult előtte. Ennélfogva mind az 5 tekerés egyformán valószínű.

Hasonlóképpen, a második esetben az egyenes 2-k független események sorozataként is felfoghatók. És ezek az események egyaránt valószínűek. Összességében, mivel ugyanaz a kocka, annak valószínűsége, hogy egy adott szám felbukkan abban az esetben, ha az egyik megegyezik a második esettel. Ezután, ebben a cikkben a gépi tanulás statisztikáiról, értsük meg a kifejezést Függetlenség.

Függetlenség

Két esemény A és B függetlennek mondják, ha A bekövetkezése nem befolyásolja a B eseményt . Például, ha dobsz egy érmét és dobsz egy kockát, akkor a szerszám kimenetele nincs hatással arra, hogy az érme feje vagy farka látható-e. Továbbá a két független esemény A és B , az annak valószínűsége, hogy A és B együtt fordulhat elő . Például, ha azt szeretné, hogy annak a valószínűsége legyen, hogy az érme fejet mutat, a halál pedig 3-at mutat.

mi az init a pythonban

P (A és B) = P (A) * P (B)

Ezért P = & frac12 (a fejek felfordulásának valószínűsége) * ⅙ (3 felfordulás valószínűsége) = 1/12

Az előző példában mindkét esetben P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙.

Most beszéljünk olyan eseményekről, amelyek nem függetlenek. Vegye figyelembe a következő táblázatot:

Elhízott Nem elhízott
Szív problémákNégy öttizenöt
Nincsenek szívproblémák10.30

100 fős felmérést készítettek. 60-nak volt szívproblémája, 40-nek nem. A 60 szívproblémából 45 elhízott volt. A 40 betegnek, akiknek nincs szívproblémája, 10 elhízott volt. Ha valaki megkérdezi -

  1. Mennyi a valószínűsége a szívproblémáknak?
  2. Mennyi a valószínűsége annak, hogy szívproblémái vannak, és nem lesz elhízott?

Az első kérdésekre könnyű a válasz - 60/100. A másodikra ​​15/100 lenne. Most vegyük fontolóra a harmadik kérdést - egy személyt véletlenszerűen választottak ki. Megállapították, hogy szívbetegsége van. Mennyi a valószínűsége annak, hogy elhízott?

Gondoljon most a kapott információkra - Ismert, hogy szívbetegsége van. Ezért nem lehet a 40-ből, akiknek nincs szívbetegségük. Csak 60 lehetséges opció áll rendelkezésre (a táblázat legfelsõ sora). E csökkent lehetőségek között annak valószínűsége, hogy elhízott, 45/60. Most, hogy tudta, mi a független esemény, a gépi tanulás statisztikáiról szóló következő cikkben hadd értsük meg a feltételes valószínűségeket.

Feltételes valószínűségek

A feltételes valószínűségek megértése érdekében folytassuk a vitát a fenti példával. Az elhízás és a szívproblémák állapota nem független. Ha az elhízás nem befolyásolta a szívproblémákat, akkor a szívproblémákkal küzdő emberek elhízott és nem elhízott eseteinek száma azonos lett volna.

Azt is megkaptuk, hogy az illetőnek szívproblémái vannak, és meg kellett derítenünk annak valószínűségét, hogy elhízott. Tehát ebben az esetben a valószínűséget feltételezhetően attól függ, hogy szívproblémája van. Ha az A esemény bekövetkezésének valószínűsége a B eseménytől függ, akkor ezt ábrázoljuk

P (A | B)

Most van egy tétel, amely segít kiszámítani ezt a feltételes valószínűséget. Az úgynevezett Bayes-szabály .

P (A | B) = P (A és B) / P (B)

Ezt a tételt ellenőrizheti az imént tárgyalt példa csatlakoztatásával. Ha eddig megértetted, elkezdheted a következőket - Naiv Bayes . Feltételes valószínűségekkel osztályozza, hogy az e-mail spam-e vagy sem. Sok más osztályozási feladatot is képes végrehajtani. De lényegében a feltételes valószínűség áll a középpontban .

Statisztika:

A statisztikák nagyszámú adatpont összefoglalására és következtetések levonására szolgál. Az adattudományban és a gépi tanulásban gyakran a következő terminológiával találkozhat

  • Központi intézkedések
  • Eloszlások (különösen normál)

Központi intézkedések és spreadek mértéke

Átlagos:

A Mean csak egy számok átlaga . A középérték megismeréséhez összegeznie kell a számokat és el kell osztania a számok számával. Például az [1,2,3,4,5] átlaga 15/5 = 3.

mean-statistics-for-machine-learning

Középső:

A medián az számkészlet középső eleme amikor növekvő sorrendben vannak elrendezve. Például az [1,2,4,3,5] számokat növekvő sorrendbe rendezzük [1,2,3,4,5]. Ezek közül a középső a 3. Ezért a medián a 3. De mi van akkor, ha a számok száma páros és ezért nincs középső száma? Ebben az esetben a két legközelebbi szám átlagát veszi. 2n szám növekvő sorrendben átlagolja az n-edik és (n + 1) értéketthszámot a medián megszerzéséhez. Példa - Az [1,2,3,4,5,6] mediánja (3 + 4) / 2 = 3,5

Mód:

A mód egyszerűen a számhalmaz leggyakoribb száma . Például az [1,2,3,3,4,5,5,5] módja 5.

Variancia:

A variancia nem központi intézkedés. Méri hogyan oszlanak meg adatai az átlag körül . Számszerűsítve

xaz N szám átlaga. Vesz egy pontot, kivonja az átlagot, veszi ennek a különbségnek a négyzetét. Tegye ezt mind az N számra, és átlagolja. A variancia négyzetgyökét szórásnak nevezzük. Ezután, ebben a cikkben a gépi tanulás statisztikáiról, értsük meg a normál eloszlást.

hogyan lehet duplán leadni az int

Normális eloszlás

A terjesztés segít nekünk megérteni az adataink terjedését . Például egy életkorú mintában több fiatalunk lehet, mint idősebb felnőttek, ennélfogva a kisebb életkor értékek meghaladják a nagyobb értékeket. De hogyan definiálhatunk egy eloszlást? Tekintsük az alábbi példát

Az y tengely a sűrűséget jelenti. Ennek az eloszlásnak a módja 30, mivel ez a csúcs és ezért a leggyakoribb. Megtalálhatjuk a mediánt is. A medián az x tengely azon pontján fekszik, ahol a görbe alatti terület fele be van fedve. A normál eloszlás alatti terület 1, mert az összes esemény valószínűségének összege 1. Például:

A medián a fenti esetben 4 körül van. Ez azt jelenti, hogy a görbe alatti terület 4 előtt megegyezik a 4. utáni területrel. Vegyünk egy másik példát

Három normális eloszlást látunk. A kék és a piros jelentése azonos. A pirosnak nagyobb a szórása. Ezért jobban elterjedt, mint a kék. De mivel a területnek 1-nek kell lennie, a vörös görbe csúcsa rövidebb, mint a kék görbe, hogy a terület állandó maradjon.

Remélem, megértette az alapstatisztikákat és a normális eloszlásokat. Most, a gépi tanulás statisztikáiról szóló cikk következő részében ismerkedjünk meg a Lineáris Algebrával.

Lineáris algebra

A modern mesterséges intelligencia nem lehetséges lineáris algebra nélkül. Ez alkotja a magját Mély tanulás és még olyan egyszerű algoritmusokban is használták, mint a . Minden további késedelem nélkül kezdjük.

Biztosan ismeri a vektorokat. Ezek egyfajta geometriai ábrázolások a térben. Például egy [3,4] vektornak 3 egysége van az x tengely mentén és 4 egység az y tengely mentén. Tekintsük a következő képet -

A d1 vektor az x tengely mentén 0,707 egységet, az y tengely mentén pedig 0,707 egységet tartalmaz. Egy vektornak 1 dimenziója van. Ennek feltétlenül van nagysága és iránya. Például,

A fenti képen van egy vektor (4,3). Nagysága 5, és az x tengellyel 36,9 fokot tesz ki.

Mi az a mátrix? A Matrix egy többdimenziós számtömb. Mire használták? Majd meglátjuk. De először nézzük meg, hogyan használják.

Mátrix

Egy mátrixnak számos dimenziója lehet. Vegyünk egy 2-dimenziós mátrixot. Sorai (m) és oszlopai (n) vannak. Ezért m * n elemei vannak.

Például,

Ennek a mátrixnak 5 sora és 5 oszlopa van. Nevezzük A-nak. Ezért A (2,3) a bejegyzés a második sorban és a harmadik oszlopban, amely 8.

Most, hogy tudja, mi a mátrix, engedje meg, hogy megvizsgáljuk a mátrix különböző műveleteit.

Mátrix műveletek

Mátrixok hozzáadása

Két mátrixa azonos dimenziók hozzáadhatók. Az összeadás elemenként történik.

Skaláris szorzás

A mátrixot meg lehet szorozni skaláris mennyiséggel. Egy ilyen szorzás oda vezet, hogy a mátrix minden bejegyzése megszorozódik a skalárral. A skalár csak egy szám

Matrix Transpose

A mátrix átültetése egyszerű. Az A (m, n) mátrix esetében legyen A ’transzpozíciója. Azután

A '(i, j) = A (j, i)

Például,

Mátrix szorzás

Ez valószínűleg kissé trükkös, mint más műveletek. Mielőtt belevetnénk magunkat, definiáljunk pont-szorzatot két vektor között.

Tekintsük X = [1,4,6,0] és Y = [2,3,4,5] vektorokat. Ekkor az X és Y közötti pont szorzatot úgy definiáljuk

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

Tehát elemenkénti szorzás és összeadás. Most,tekintsünk két A (m, n) és B (n, k) mátrixot, ahol m, n, k dimenziók és ennélfogva egész számok. A mátrixszorzást úgy definiáljuk

A fenti példában a (44) szorzat első elemét a bal oldali mátrix első sorának és a jobb oldali mátrix első oszlopának ponttermékével kapjuk meg. Hasonlóképpen, 72-t kapunk a bal mátrix első sorának és a jobb mátrix második oszlopának ponttermékével.

a szkenner osztály metódusai lehetővé teszik

Vegye figyelembe, hogy a bal mátrix esetében az oszlopok számának meg kell egyeznie a jobb oldali oszlop sorainak számával. Esetünkben az AB szorzat létezik, a BA azonban nem, mivel m nem egyenlő k-val. Két A (m, n) és B (n, k) mátrix esetében meghatározzuk az AB szorzatot, és a szorzat mérete (m, k) ((m, n), (n, k) )). De a BA csak akkor definiálható, ha m = k.

Ezzel véget értünk ennek a cikknek a Gépi tanulás statisztikáiról. Remélem, megértettek néhányat a Gépi Tanulási Szaknyelvből. Ennek azonban itt nincs vége. Annak érdekében, hogy biztosan készen álljon az iparra, megnézheti az Edureka Data Science és AI tanfolyamait. Megtalálhatók