Felügyelt tanulás az Apache Mahout-ban



A felügyelt tanulás a gépi tanulás technikája, amelyben egy funkciót a képzési adatok címkézett példáiból következtetnek ki.

A felügyelt tanulás az a módszer, ahol a képzési adatok tartalmazzák mind a bevitelt, mind a kívánt eredményeket. A rendszer gyakorlását példákkal hívják felügyelt tanulásnak. Vagy pedig az algoritmus tanítóval történő oktatása felügyelt tanulásként is kezelhető. Az algoritmus összes mintadatával vagy címkézett adattal történő tanítása után, amelynek mindkét prediktora van a célváltozón, ki lehet oktatni az algoritmust, és a láthatatlan példát felhasználni a további osztályozáshoz.





különbség a túlterhelés és az felülbírálás között c ++ - ban

Íme néhány a felügyelt tanulás Mahout-ban:

  • A megfelelő képzési, validációs és tesztkészlet (Bok) felépítése elengedhetetlen.
  • Ezek a módszerek általában gyorsak és pontosak.
  • A felügyelt tanulási módszereknek képesnek kell lenniük általánosításra.
  • Helyes eredményt adnak, amikor új adatokat adnak meg a bemenetben anélkül, hogy aprioricél.
  • Bizonyos esetekben a helyes eredmények (célok) ismeretesek, és a tanulási folyamat során megadják a modellt.

Példa a felügyelt tanulásra

Abban az esetben, ha küldetést szeretne képezni, és két különböző képcsoportot kap a címkézett adatokkal együtt, pl. a fenti képen az egyik csoportban elefánt, a másikban oroszlán képei láthatók. A címkézett adatok azt jelentik, hogy minden adatkészletnek van célértéke. A fenti példában az adatkészlet elefánt képe, míg a neki adott címke, azaz „Elephant” az adatkészlet célértéke. Ilyen címkézett adatsort használnak a képzési folyamathoz, így a képzési algoritmus kiaknázhatja ezt az adatsort, és felépíthet valamilyen modellt, amelyet tovább lehet használni a láthatatlan példák besorolásához a címkézett adatok vagy célváltozó nélkül.



Határozzuk meg azokat a jellemzőket, amelyek segítenek azonosítani egy tárgyat elefántként vagy oroszlánként:

A jellemzői lehetne - méret, szín, magasság, fülméret, törzs, agyar

Ezt nevezhetjük olyan szolgáltatáskészletnek, amelyet a képzés céljára használunk. Ez a funkciókészlet hatással lesz a végső célváltozóra. Ezek a változók néven ismertek prediktor változók , mert segítenek nekünk a végső célváltozó . A végső változó címkének is nevezhető. A végső változó itt van Elefánt / Oroszlán.



table-word

Ebben a példában a kategóriák, méret, szín, magasság, fülméret, törzs és agyar kategóriák mindegyike prediktív változó, míg az Elephant és az Oroszlán a célváltozó. Ezek a változók képzési példaként és képzési adatkészletként kezelhetők.

Így a felügyelt tanulás egy olyan módszer, amelyen keresztül a címkékkel együtt edz, és megkéri az algoritmust, hogy vonjon ki belőle bizonyos funkciókat, és ez alapján, amikor lát egy nem látott példát, az algoritmus képes lesz osztályozni a megfelelő osztályba.

Van egy kérdésünk? Említse meg őket a megjegyzések részben, és mi kapcsolatba lépünk Önnel.

Kapcsolódó hozzászólások: