Python Seaborn oktatóanyag: Mi a Seaborn és hogyan kell használni?



Python Seaborn oktatóanyag a seaborn és a matplotlib közötti különbség mentén. Ismerje meg a seaborn különféle funkcióit és testreszabásait.

A Python számos rendkívül hatékony könyvtár és keretrendszer tárháza. Köztük az Tengeren született, ami domináns adatmegjelenítés könyvtár, ami újabb okot ad a programozók számára a befejezésre . Ebben a Python Seaborn oktatóanyagban az adatok vizualizálásának minden tudását kihasználja a Seaborn segítségével.

Mielőtt továbblépnénk, nézzük át a cikk összes vitatémáját:





Kezdjük tehát először azzal, hogy megalapozzuk a Python Seaborn fontosságát.

Miért használja a Python Seaborn-ot?

Mint korábban említettük, a Python Seaborn könyvtárat használják az adatmegjelenítés kihívást jelentő feladatának megkönnyítésére, és ez az alapja . A Seaborn lehetővé teszi statisztikai grafikák készítését a következő funkciók révén:



  • Adatkészleteken alapuló API, amely lehetővé teszi a többszörös összehasonlítását változók

  • Támogatja a több telekből álló rácsokat, amelyek megkönnyítik a komplex vizualizációk elkészítését

  • Egy- és kétváltozós vizualizációk állnak rendelkezésre az adatok részhalmazainak összehasonlításához



  • Különböző színpaletták elérhetősége a különféle minták megjelenítéséhez

  • Becslések és ábrák automatikusan

Tehát, ha arra kíváncsi, miért használja a Seaborn-ot, amikor már rendelkezik a Matplotlib-lel, itt van a válasz erre.

Python Seaborn vs Matplotlib:

„Ha Matplotlib„ megpróbálja a könnyű dolgokat könnyűvé és nehezebbé tenni ”, a Seaborn megpróbálja megkönnyíteni a jól definiált nehéz dolgok halmazát is - Michael Waskom (Seaborn alkotója).
Valójában a Matplotlib jó, de a Seaborn jobb. A Matplotlibnek alapvetően két hiányossága van, amelyet Seaborn orvosol:

  1. A Matplotlib személyre szabható, de nehéz kitalálni, hogy milyen beállításokra van szükség a cselekmények vonzóbbá tételéhez. Másrészt a Seaborn számos testreszabott témával és magas szintű interfészekkel érkezik a probléma megoldására.

  2. Amikor dolgozik Pandák , A Matplotlib nem szolgál jól, ha a DataFrames-kel foglalkozunk, míg a Seaborn funkciók valójában a DataFrames-en működnek.

Hogyan telepítsük a Seaborn-t?

A Python Seaborn könyvtár telepítéséhez a következő parancsokat használhatja a használt platform alapján:

pip telepíteni tengeri születésű

vagy

conda telepíteni tengeri

Miután ezt telepítette, csak feltétlenül telepítse azokat a csomagokat és könyvtárakat, amelyekre a tengeri születés függ.

A Python Seaborn Dependencies telepítése:

A tengeri születés kötelező függőségei:

Van egy ajánlott függőség is:

  • állami modellek

Ezeknek a könyvtáraknak a telepítéséhez ugyanazokat a parancsokat használhatja, mint korábban a Seaborn esetében, a megfelelő nevekkel. A telepítés után könnyen importálhatók. A Seaborn lehetővé teszi, hogy bármilyen adatkészletet betöltsön innen használni a load_dataset () funkció. Az összes rendelkezésre álló adatkészletet megtekintheti a get_dataset_names () függvény használatával az alábbiak szerint:

PÉLDA:

tengeri születésű importálása sns-ként sns.get_dataset_names ()

Ez visszaadja az összes rendelkezésre álló adatállomány listáját.
Most, hogy beállította a környezetét a tengeri születéssel való együttműködéshez, lépjünk tovább, hogy lássuk, hogyan kell használni a .

Tengeri születésű rajzolási funkciók

A statisztikai kapcsolatok megjelenítése:

Az adatkészlet változói közötti kapcsolatok megértésének folyamatát és azt, hogy ezek a kapcsolatok hogyan függnek más változóktól, statisztikai elemzésnek nevezzük. Vizsgáljuk meg most mélyebben az ehhez szükséges funkciókat:

relplot ():

Ez egy ábra-szintű függvény, amely két másik tengelyfüggvényt használ a statisztikai kapcsolatok megjelenítéséhez, amelyek:

  • szórvány ()
  • vonalvonal ()

Ezeket a függvényeket a relplot () 'kind' paraméterével lehet megadni. Abban az esetben, ha ez a paraméter meg van adva, akkor az alapértelmezett érték a scatterplot (). Mielőtt elkezdené írni a kódot, győződjön meg arról, hogy importálja a szükséges könyvtárakat az alábbiak szerint:

import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns sns.set (style = 'darkgrid')

Felhívjuk figyelmét, hogy a style attribútum szintén testreszabható, és bármilyen értéket vehet fel, például darkgridet, kullancsokat stb., Amelyeket később a cselekmény-esztétika részben tárgyalok. Most nézzünk meg egy kis példát:

PÉLDA:

f = sns.load_dataset ('járatok') sns.relplot (x = 'utasok', y = 'hónap', adatok = f)

KIMENET:

Járatok1-Python Seaborn bemutató-Edureka

Amint láthatja, a pontok 2 dimenzióban vannak ábrázolva. A „színárnyalat” szemantikával azonban felvehet egy másik dimenziót. Vessünk egy pillantást ugyanerre:

PÉLDA:

f = sns.load_dataset ('járatok') sns.relplot (x = 'utasok', y = 'hónap', színárnyalat = 'év', adatok = f)

A következő kimenetet fogja látni:

KIMENET:

Van azonban még sok olyan testreszabás, amelyet kipróbálhat, például színek, stílusok, méret stb. Hadd mutassam be, hogyan változtathatja meg a színt a következő példában:

PÉLDA:

sns.set (style = 'darkgrid') f = sns.load_dataset ('járatok') sns.relplot (x = 'utasok', y = 'hónap', színárnyalat = 'év', paletta = 'ch: r = - .5, l = .75 ', adatok = f)

KIMENET:

vonalvonal ():

Ez a funkció lehetővé teszi, hogy folytonos vonalat rajzoljon az adataihoz. Ezt a funkciót a „fajta” paraméter megváltoztatásával használhatja az alábbiak szerint:

PÉLDA:

a = pd.DataFrame ({'Nap': [1,2,3,4,5,6,7], 'Élelmiszerbolt': [30,80,45,23,51,46,76], 'Ruházat' : [13,40,34,23,54,67,98], „Edények”: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Nap', y = 'Ruházat', kedves = 'vonal', adatok = a) g.fig.autofmt_xdate ()

KIMENET:

A vonalas rajz alapértelmezett értéke y x függvényében. Ez azonban megváltoztatható, ha szeretné. Sokkal több lehetőség van, amelyeket kipróbálhat.

Most vessünk egy pillantást a kategorikus adatok ábrázolására.

Ábrázolás kategorikus adatokkal:

Ez a megközelítés akkor jön a képbe, amikor fő változónkat diszkrét csoportokra osztjuk (kategorikus). Ez a catplot () függvény segítségével érhető el.

catplot ():

Ez egy figura szintű függvény, mint a relplot (). Három tengelyszintű függvénycsaláddal jellemezhető:

  1. Scatterplots - Ide tartoznak a stripplot (), swarmplot ()

  2. Elosztási ábrák - amelyek boxplot (), violinplot (), boxenplot ()

  3. Becsült táblák - nevezetesen pointplot (), barplot (), countplot ()

Vegyünk néhány példát ennek bemutatására:

PÉLDA:

import seaborn mint sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'nap', y = 'teljes_számla', adatok = a)

KIMENET:

Mint látható, a fenti példában nem állítottam be a „kedves” paramétert. Ezért a grafikont alapértelmezett scatterplotként adta vissza. Bármelyik tengelyszint függvény megadható a grafikon szükség szerinti megváltoztatásához. Vegyünk példát erre is:

PÉLDA:

import seaborn mint sns import matplotlib.pyplot as plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'nap', y = 'teljes_számla', kind = 'hegedű', data = a)

KIMENET:

A fenti kimenet a hegedűsávot mutatja a tippek adatkészletéhez. Most próbáljuk meg megtalálni, hogyan lehet megjeleníteni egy adatkészlet eloszlását.

Az adatkészlet terjesztésének megjelenítése:

Ez alapvetően az adatkészletek megértésével foglalkozik, kontextusban egy- vagy kétváltozósá. Mielőtt ezzel kezdené, egyszerűen importálja a következőket:

import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from scipy import stats sns.set (color_codes = True)

Ha ez megtörtént, folytathatja az egy- és kétváltozós eloszlások ábrázolását.

Egyváltozós eloszlások ábrázolása:

Az ábrázoláshoz használhatja a distplot () függvényt az alábbiak szerint:

PÉLDA:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

KIMENET:

Amint a fenti példában láthatja, ábrázoltunk egy grafikont az a változó számára, amelynek értékeit a normál () függvény generálja a distplot segítségével.

Kétváltozós eloszlások ábrázolása:

Ez akkor jön képbe, amikor két véletlenszerű független változója van, amelyek valamilyen valószínű eseményt eredményeznek. Az ilyen típusú grafikonok ábrázolásának legjobb funkciója a jointplot (). Most ábrázoljunk kétváltozós gráfot a jointplot () segítségével.

PÉLDA:

x = pd.DataFrame ({'Nap': [1,2,3,4,5,6,7], 'Élelmiszerbolt': [30,80,45,23,51,46,76], 'Ruházat' : [13,40,34,23,54,67,98], „Edények”: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Nap': [8,9,10,11,12,13,14], 'Élelmiszerbolt': [30,80,45,23,51,46, 76], „Ruházat”: [13,40,34,23,54,67,98], „Edények”: [12,32,27,56,87,54,34]}, index = [8,9 , 10,11,12,13,14]) átlag, cov = [0, 1], [(1, .5), (.5, 1)] adatok = np.véletlen.változó_normális (átlag, cov, 200 ) az sns.axes_style ('fehér') segítségével: sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

KIMENET:

Most, hogy megértette a Python Seaborn különféle funkcióit, folytassuk strukturált, több sávos rácsok felépítését.

Több telekből álló rácsok:

A Python Seaborn lehetővé teszi több rács egymás melletti ábrázolását. Ezek alapvetően diagramok vagy grafikonok, amelyeket ugyanazon skála és tengelyek segítségével ábrázolnak, hogy megkönnyítsék a közöttük történő összehasonlítást. Ez pedig segít a programozónak abban, hogy gyorsan különbséget tegyen a cselekmények között, és nagy mennyiségű információt szerezzen.

Tekintsük a következő példa facetgrid () függvényét e grafikonok ábrázolásához.

PÉLDA:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'faj') b.map (plt.hist, 'sepal_length')

KIMENET:

A fenti kimenet világosan mutatja az ebéd és vacsora során adott tippek összehasonlítását. Akkor is ábrázolhat a PairGrid függvény használatával, ha van pár változója az összehasonlításhoz. Tekintsük a következő példát.

PÉLDA:

sns.set (style = 'ticks') a = sns.load_dataset ('járatok') b = sns.PairGrid (a) b.map (plt.scatter)

KIMENET:

Amint láthatja, a fenti kimenet különböző módon egyértelműen összehasonlítja az évet és az utasok számát.

Seaborn az esztétika testreszabását is lehetővé teszi, amelyet tovább tárgyalunk.

Plot-Esztétika:

A Python Seaborn oktatóanyag ezen része azzal foglalkozik, hogy vonzóbbá és elragadóbbá tegyük a cselekményeinket.

Python Seaborn ábra-esztétika:

Az első függvény, amelyet megvitatni fogok, be van állítva (). Korábban már használtam ennek a függvénynek a „stílus” paraméterét. Ez a paraméter alapvetően tengeri témákkal foglalkozik. Jelenleg öt közülük kapható, nevezetesen sötétrács, kullancsok, fehérrács, fehér és sötét.

Tekintsük az alábbi példát, amely bemutatja a fehér témát.

PÉLDA:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'nap', y = 'teljes_számla', adatok = a)

KIMENET:

mi a sztring a java-ban

A fenti kimenetben észreveheti, hogy a téma fehérre változik. A többi témát is felhasználhatja. Ha az előző kimenetben észreveszi, akkor a grafikon körül tengelyek vannak. Ez azonban a despine () függvény segítségével is testreszabható. Nézze meg az alábbi példát.

PÉLDA:

import seaborn as sns import matplotlib.pyplot as plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tips') sns.boxplot (x = 'nap', y = 'teljes_számla', adatok = a) sns.despine (offset = 10, trim = True)

KIMENET:



Vegye figyelembe az előző két kimenet közötti különbséget. Van azonban még sok más lehetőség, amelyet saját maga fedezhet fel.

Python Seaborn színpaletták:

A szín alapvetően az a jellemző, amely az emberi szemet megközelíti minden más vonáson túl. A Seaborn lehetővé teszi, hogy különböző funkciókkal játsszon a színekkel, például a color_palette (), a hls_palette (), a husl_palette () stb. Segítségével.

PÉLDA:

import numpy as np import seaborn as sns import matplotlib.pyplot as plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

KIMENET:

A fenti képen láthatók azok a színek, amelyek a tengeri születésben vannak. A palplot () függvény segítségével tettem meg. A mélyebb variációkhoz használhatja a hls_palette (), a husl_palette () stb.

Ezzel elérkeztünk a Python Seaborn Tutorial végéhez. Remélem, mindent tisztán megértett. Győződjön meg arról, hogy a lehető legtöbbet gyakorolja .

Van egy kérdésünk? Kérjük, említse meg a „Python Seaborn Tutorial” blog megjegyzés rovatában, és a lehető leghamarabb kapcsolatba lépünk Önnel.

Ha mélyreható ismereteket szeretne szerezni a Pythonról és a különböző alkalmazásokról, regisztrálhat élőben 24/7 támogatással és élethosszig tartó hozzáféréssel.