FUZZY K-FÜRTÖZÉS MAHOUT-BAN

Ez a blog bemutatja a Fuzzy K-Means csoportosítását az Apache Mahout-ban.

A Fuzzy K-Means pontosan ugyanaz az algoritmus, mint a K-mean, ami egy népszerű egyszerű klaszterezési technika. Az egyetlen különbség az, hogy ahelyett, hogy csak egy klaszterhez rendelne pontot, valamiféle homályosság vagy átfedés lehet két vagy több fürt között. Az alábbiakban bemutatjuk a Fuzzy K-Means leírását:

A kemény fürtöt kereső K-Means-szal ellentétben, ahol az egyes pontok egy-egy klaszterhez tartoznak, a Fuzzy K-Means a puhább klasztereket keresi az átfedés érdekében.
Egy puha klaszter egyetlen pontja több klaszterhez is tartozhat, bizonyos affinitási értékkel az egyes pontok felé.
Az affinitás arányos az adott pont és a klaszter centroid távolságával.
Hasonlóan a K-Means-hoz, a Fuzzy K-Means olyan objektumokon is működik, amelyeknek meg van határozva a távolságméret, és amelyek a n- dimenziós vektortér.

Fuzzy K-Means Map Csökkentse az áramlást

Nincs sok különbség a MapReduce K-Means és a Fuzzy K-Means áramlása között. Mindkettő megvalósítása Mahout-ban hasonló.

php mysql_fetch_

Következik a alapvető paraméterek a Fuzzy K-Means megvalósításához:

A bevitelhez vektoradat-készletre van szükség.
A kezdeti k klaszterek beágyazásához a RandomSeedGeneratornak kell lennie.
A távolságméréshez a SquaredEuclideanDistanceMeasure szükséges.
A konvergenciaküszöb nagy értéke, például –cd 1.0, ha a távolságmérés négyzetértékét használták
A maxIterations értéke alapértelmezett értéke -x 10.
A normalizációs együttható vagy a fuzziness factor, -m 1,0-nél nagyobb értékkel

Van egy kérdésünk? Említse meg őket a megjegyzések részben, és mi kapcsolatba lépünk Önnel.

különbség a felülbírálás és a túlterhelés között a java-ban

Kapcsolódó hozzászólások

java-nak van egy kapcsolata

Felügyelt tanulás az Apache Mahout-ban

Ez a blog bemutatja a Fuzzy K-Means csoportosítását az Apache Mahout-ban.

Fuzzy K-Means Map Csökkentse az áramlást

Kategóriák

Popular Articles

Hogyan lehet a Python CGI-t legjobban kihasználni a napi kódolásban?

A Bitcoin Blockchain magyarázata: A Bitcoin és a Blockchain megértése

Tudja, hogyan kell elvégezni az adatbázis-tesztelést a szelén használatával - lépésről lépésre

Minden, amit tudnia kell az alkalmazás terheléselosztóról

A R 10 megtanulásának 10 legfontosabb oka

Ez a megfelelő alkalom arra, hogy megtanuljam a Hadoopot?

Az első gépi tanulási osztályozó elkészítése a Pythonban

Selejtezési útmutató: Hogyan készítsünk webrobotot a selejt használatával?

Hogyan lehet előrehaladási sávot létrehozni a HTML-ben?

Az OpenCV Python telepítése a Windows rendszerre

MySQL Workbench oktatóanyag - Átfogó útmutató az RDBMS eszközhöz

DevOps mérnök karrierút: Útmutató a legjobb DevOps munkák összeszedéséhez