A Python számos rendkívül hatékony könyvtár és keretrendszer tárháza. Köztük az Tengeren született, ami domináns adatmegjelenítés könyvtár, ami újabb okot ad a programozók számára a befejezésre . Ebben a Python Seaborn oktatóanyagban az adatok vizualizálásának minden tudását kihasználja a Seaborn segítségével.
Mielőtt továbblépnénk, nézzük át a cikk összes vitatémáját:
- Miért érdemes használni a Seaborn-ot?
- Hogyan telepítsük a Seaborn-t?
- A Python Seaborn Dependencies telepítése
- Tengeri születésű rajzolási funkciók
- Több telekből álló rácsok
- Plot-esztétika
Kezdjük tehát először azzal, hogy megalapozzuk a Python Seaborn fontosságát.
Miért használja a Python Seaborn-ot?
Mint korábban említettük, a Python Seaborn könyvtárat használják az adatmegjelenítés kihívást jelentő feladatának megkönnyítésére, és ez az alapja . A Seaborn lehetővé teszi statisztikai grafikák készítését a következő funkciók révén:
Adatkészleteken alapuló API, amely lehetővé teszi a többszörös összehasonlítását változók
Támogatja a több telekből álló rácsokat, amelyek megkönnyítik a komplex vizualizációk elkészítését
Egy- és kétváltozós vizualizációk állnak rendelkezésre az adatok részhalmazainak összehasonlításához
Különböző színpaletták elérhetősége a különféle minták megjelenítéséhez
Becslések és ábrák automatikusan
Tehát, ha arra kíváncsi, miért használja a Seaborn-ot, amikor már rendelkezik a Matplotlib-lel, itt van a válasz erre.
Python Seaborn vs Matplotlib:
„Ha Matplotlib„ megpróbálja a könnyű dolgokat könnyűvé és nehezebbé tenni ”, a Seaborn megpróbálja megkönnyíteni a jól definiált nehéz dolgok halmazát is - Michael Waskom (Seaborn alkotója).
Valójában a Matplotlib jó, de a Seaborn jobb. A Matplotlibnek alapvetően két hiányossága van, amelyet Seaborn orvosol:
A Matplotlib személyre szabható, de nehéz kitalálni, hogy milyen beállításokra van szükség a cselekmények vonzóbbá tételéhez. Másrészt a Seaborn számos testreszabott témával és magas szintű interfészekkel érkezik a probléma megoldására.
Amikor dolgozik Pandák , A Matplotlib nem szolgál jól, ha a DataFrames-kel foglalkozunk, míg a Seaborn funkciók valójában a DataFrames-en működnek.
Hogyan telepítsük a Seaborn-t?
A Python Seaborn könyvtár telepítéséhez a következő parancsokat használhatja a használt platform alapján:
pip telepíteni tengeri születésű
vagy
conda telepíteni tengeri
Miután ezt telepítette, csak feltétlenül telepítse azokat a csomagokat és könyvtárakat, amelyekre a tengeri születés függ.
A Python Seaborn Dependencies telepítése:
A tengeri születés kötelező függőségei:
Van egy ajánlott függőség is:
- állami modellek
Ezeknek a könyvtáraknak a telepítéséhez ugyanazokat a parancsokat használhatja, mint korábban a Seaborn esetében, a megfelelő nevekkel. A telepítés után könnyen importálhatók. A Seaborn lehetővé teszi, hogy bármilyen adatkészletet betöltsön innen használni a load_dataset () funkció. Az összes rendelkezésre álló adatkészletet megtekintheti a get_dataset_names () függvény használatával az alábbiak szerint:
PÉLDA:
tengeri születésű importálása sns-ként sns.get_dataset_names ()
Ez visszaadja az összes rendelkezésre álló adatállomány listáját.
Most, hogy beállította a környezetét a tengeri születéssel való együttműködéshez, lépjünk tovább, hogy lássuk, hogyan kell használni a .
Tengeri születésű rajzolási funkciók
A statisztikai kapcsolatok megjelenítése:
Az adatkészlet változói közötti kapcsolatok megértésének folyamatát és azt, hogy ezek a kapcsolatok hogyan függnek más változóktól, statisztikai elemzésnek nevezzük. Vizsgáljuk meg most mélyebben az ehhez szükséges funkciókat:
relplot ():
Ez egy ábra-szintű függvény, amely két másik tengelyfüggvényt használ a statisztikai kapcsolatok megjelenítéséhez, amelyek:
- szórvány ()
- vonalvonal ()
Ezeket a függvényeket a relplot () 'kind' paraméterével lehet megadni. Abban az esetben, ha ez a paraméter meg van adva, akkor az alapértelmezett érték a scatterplot (). Mielőtt elkezdené írni a kódot, győződjön meg arról, hogy importálja a szükséges könyvtárakat az alábbiak szerint:
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set (style = 'darkgrid')
Felhívjuk figyelmét, hogy a style attribútum szintén testreszabható, és bármilyen értéket vehet fel, például darkgridet, kullancsokat stb., Amelyeket később a cselekmény-esztétika részben tárgyalok. Most nézzünk meg egy kis példát:
PÉLDA:
f = sns.load_dataset ('járatok') sns.relplot (x = 'utasok', y = 'hónap', adatok = f)
KIMENET:
Amint láthatja, a pontok 2 dimenzióban vannak ábrázolva. A „színárnyalat” szemantikával azonban felvehet egy másik dimenziót. Vessünk egy pillantást ugyanerre:
PÉLDA:
f = sns.load_dataset ('járatok') sns.relplot (x = 'utasok', y = 'hónap', színárnyalat = 'év', adatok = f)
A következő kimenetet fogja látni:
KIMENET:
Van azonban még sok olyan testreszabás, amelyet kipróbálhat, például színek, stílusok, méret stb. Hadd mutassam be, hogyan változtathatja meg a színt a következő példában:
PÉLDA:
sns.set (style = 'darkgrid') f = sns.load_dataset ('járatok') sns.relplot (x = 'utasok', y = 'hónap', színárnyalat = 'év', paletta = 'ch: r = - .5, l = .75 ', adatok = f)
KIMENET:
vonalvonal ():
Ez a funkció lehetővé teszi, hogy folytonos vonalat rajzoljon az adataihoz. Ezt a funkciót a „fajta” paraméter megváltoztatásával használhatja az alábbiak szerint:
PÉLDA:
a = pd.DataFrame ({'Nap': [1,2,3,4,5,6,7], 'Élelmiszerbolt': [30,80,45,23,51,46,76], 'Ruházat' : [13,40,34,23,54,67,98], „Edények”: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Nap', y = 'Ruházat', kedves = 'vonal', adatok = a) g.fig.autofmt_xdate ()
KIMENET:
A vonalas rajz alapértelmezett értéke y x függvényében. Ez azonban megváltoztatható, ha szeretné. Sokkal több lehetőség van, amelyeket kipróbálhat.
Most vessünk egy pillantást a kategorikus adatok ábrázolására.
Ábrázolás kategorikus adatokkal:
Ez a megközelítés akkor jön a képbe, amikor fő változónkat diszkrét csoportokra osztjuk (kategorikus). Ez a catplot () függvény segítségével érhető el.
catplot ():
Ez egy figura szintű függvény, mint a relplot (). Három tengelyszintű függvénycsaláddal jellemezhető:
Scatterplots - Ide tartoznak a stripplot (), swarmplot ()
Elosztási ábrák - amelyek boxplot (), violinplot (), boxenplot ()
Becsült táblák - nevezetesen pointplot (), barplot (), countplot ()
Vegyünk néhány példát ennek bemutatására:
PÉLDA:
import seaborn mint sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'nap', y = 'teljes_számla', adatok = a)
KIMENET:
Mint látható, a fenti példában nem állítottam be a „kedves” paramétert. Ezért a grafikont alapértelmezett scatterplotként adta vissza. Bármelyik tengelyszint függvény megadható a grafikon szükség szerinti megváltoztatásához. Vegyünk példát erre is:
PÉLDA:
import seaborn mint sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'nap', y = 'teljes_számla', kind = 'hegedű', data = a)
KIMENET:
A fenti kimenet a hegedűsávot mutatja a tippek adatkészletéhez. Most próbáljuk meg megtalálni, hogyan lehet megjeleníteni egy adatkészlet eloszlását.
Az adatkészlet terjesztésének megjelenítése:
Ez alapvetően az adatkészletek megértésével foglalkozik, kontextusban egy- vagy kétváltozósá. Mielőtt ezzel kezdené, egyszerűen importálja a következőket:
import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy import stats sns.set (color_codes = True)
Ha ez megtörtént, folytathatja az egy- és kétváltozós eloszlások ábrázolását.
Egyváltozós eloszlások ábrázolása:
Az ábrázoláshoz használhatja a distplot () függvényt az alábbiak szerint:
PÉLDA:
a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)
KIMENET:
Amint a fenti példában láthatja, ábrázoltunk egy grafikont az a változó számára, amelynek értékeit a normál () függvény generálja a distplot segítségével.
Kétváltozós eloszlások ábrázolása:
Ez akkor jön képbe, amikor két véletlenszerű független változója van, amelyek valamilyen valószínű eseményt eredményeznek. Az ilyen típusú grafikonok ábrázolásának legjobb funkciója a jointplot (). Most ábrázoljunk kétváltozós gráfot a jointplot () segítségével.
PÉLDA:
x = pd.DataFrame ({'Nap': [1,2,3,4,5,6,7], 'Élelmiszerbolt': [30,80,45,23,51,46,76], 'Ruházat' : [13,40,34,23,54,67,98], „Edények”: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Nap': [8,9,10,11,12,13,14], 'Élelmiszerbolt': [30,80,45,23,51,46, 76], „Ruházat”: [13,40,34,23,54,67,98], „Edények”: [12,32,27,56,87,54,34]}, index = [8,9 , 10,11,12,13,14]) átlag, cov = [0, 1], [(1, .5), (.5, 1)] adatok = np.véletlen.változó_normális (átlag, cov, 200 ) az sns.axes_style ('fehér') segítségével: sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')
KIMENET:
Most, hogy megértette a Python Seaborn különféle funkcióit, folytassuk strukturált, több sávos rácsok felépítését.
Több telekből álló rácsok:
A Python Seaborn lehetővé teszi több rács egymás melletti ábrázolását. Ezek alapvetően diagramok vagy grafikonok, amelyeket ugyanazon skála és tengelyek segítségével ábrázolnak, hogy megkönnyítsék a közöttük történő összehasonlítást. Ez pedig segít a programozónak abban, hogy gyorsan különbséget tegyen a cselekmények között, és nagy mennyiségű információt szerezzen.
Tekintsük a következő példa facetgrid () függvényét e grafikonok ábrázolásához.
PÉLDA:
sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'faj') b.map (plt.hist, 'sepal_length')
KIMENET:
A fenti kimenet világosan mutatja az ebéd és vacsora során adott tippek összehasonlítását. Akkor is ábrázolhat a PairGrid függvény használatával, ha van pár változója az összehasonlításhoz. Tekintsük a következő példát.
PÉLDA:
sns.set (style = 'ticks') a = sns.load_dataset ('járatok') b = sns.PairGrid (a) b.map (plt.scatter)
KIMENET:
Amint láthatja, a fenti kimenet különböző módon egyértelműen összehasonlítja az évet és az utasok számát.
Seaborn az esztétika testreszabását is lehetővé teszi, amelyet tovább tárgyalunk.
Plot-Esztétika:
A Python Seaborn oktatóanyag ezen része azzal foglalkozik, hogy vonzóbbá és elragadóbbá tegyük a cselekményeinket.
Python Seaborn ábra-esztétika:
Az első függvény, amelyet megvitatni fogok, be van állítva (). Korábban már használtam ennek a függvénynek a „stílus” paraméterét. Ez a paraméter alapvetően tengeri témákkal foglalkozik. Jelenleg öt közülük kapható, nevezetesen sötétrács, kullancsok, fehérrács, fehér és sötét.
Tekintsük az alábbi példát, amely bemutatja a fehér témát.
PÉLDA:
import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'nap', y = 'teljes_számla', adatok = a)
KIMENET:
mi a sztring a java-ban
A fenti kimenetben észreveheti, hogy a téma fehérre változik. A többi témát is felhasználhatja. Ha az előző kimenetben észreveszi, akkor a grafikon körül tengelyek vannak. Ez azonban a despine () függvény segítségével is testreszabható. Nézze meg az alábbi példát.
PÉLDA:
import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'nap', y = 'teljes_számla', adatok = a) sns.despine (offset = 10, trim = True)
KIMENET:
Vegye figyelembe az előző két kimenet közötti különbséget. Van azonban még sok más lehetőség, amelyet saját maga fedezhet fel.
Python Seaborn színpaletták:
A szín alapvetően az a jellemző, amely az emberi szemet megközelíti minden más vonáson túl. A Seaborn lehetővé teszi, hogy különböző funkciókkal játsszon a színekkel, például a color_palette (), a hls_palette (), a husl_palette () stb. Segítségével.
PÉLDA:
import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)
KIMENET:
A fenti képen láthatók azok a színek, amelyek a tengeri születésben vannak. A palplot () függvény segítségével tettem meg. A mélyebb variációkhoz használhatja a hls_palette (), a husl_palette () stb.
Ezzel elérkeztünk a Python Seaborn Tutorial végéhez. Remélem, mindent tisztán megértett. Győződjön meg arról, hogy a lehető legtöbbet gyakorolja .
Van egy kérdésünk? Kérjük, említse meg a „Python Seaborn Tutorial” blog megjegyzés rovatában, és a lehető leghamarabb kapcsolatba lépünk Önnel.
Ha mélyreható ismereteket szeretne szerezni a Pythonról és a különböző alkalmazásokról, regisztrálhat élőben 24/7 támogatással és élethosszig tartó hozzáféréssel.