SQL For Data Science: Egyablakos megoldás kezdőknek



Ez az SQL for Data Science blogbejegyzés segít megérteni, hogy az SQL hogyan használható adatok tárolására, elérésére és visszakeresésére az adatok elemzéséhez.

Mivel a Data Science a korszak legígéretesebb munkájának számít az 1. helyen, mindannyian megpróbálunk csatlakozni a . Ez az SQL for Data Science blogbejegyzés segít megérteni, hogy az SQL hogyan használható adatok tárolására, elérésére és visszakeresésére az adatok elemzéséhez.

Íme egy lista azokról a témákról, amelyekre sor kerül ez a blog foglalkozik:





    1. Miért van szükség az SQL-re az adattudomány számára?
    2. Mi az SQL?
    3. Az SQL alapjai
    4. A MySQL telepítése
    5. Hands-On

Miért van szükség az SQL-re az adattudomány számára?

Tudta, hogy naponta több mint 2,5 billió bájt adatot generálunk? Az ilyen adatgyártási ütem okozza az olyan csúcstechnológiák népszerűségét, mint pl Adattudomány , , stb.

Az adatokból hasznos betekintést nyerünk Data Science néven. Az Adattudomány rengeteg adat kinyerését, feldolgozását és elemzését foglalja magában. Jelenleg amire szükségünk van amelyek felhasználhatók a hatalmas mennyiségű adat tárolására és kezelésére.



Mi az adattudomány - Edureka

Ez az, ahol Bejön az SQL.

Az SQL felhasználható hatalmas mennyiségű adat tárolására, elérésére és kinyerésére az egész Data Science folyamat gördülékenyebb elvégzése érdekében.



Mi az SQL?

SQL amely a Strukturált lekérdezési nyelv rövidítése a Relációs adatbázisok kezelésére irányuló lekérdező nyelv.

De mi is pontosan a relációs adatbázis?

A relációs adatbázis egy jól definiált táblák csoportja, amelyekből az adatok hozzáférhetők, szerkeszthetők, frissíthetők és így tovább, az adatbázis-táblák módosítása nélkül. Az SQL a relációs adatbázisok szabványa (API).

Visszatérve az SQL-re, az SQL programozás felhasználható több művelet végrehajtására olyan adatokkal, mint például lekérdezés, beszúrás, frissítés és adatbázis-rekordok törlése. Az SQL-t használó relációs adatbázisok például a MySQL Database, az Oracle stb.

Ha többet szeretne megtudni az SQL-ről, áttekintheti az következő blogok:

  1. Az SQL adattípusok megértése - minden, amit tudnia kell az SQL adattípusokról
  2. TÁBLÁZAT LÉTREHOZÁSA SQL-ben - Minden, amit tudnia kell a táblázatok létrehozásáról SQL-ben

Mielőtt nekilátnánk az SQL bemutatójának, ismerkedjünk meg az alapvető SQL parancsokkal.

Az SQL alapjai

Az SQL egyszerű parancsok sorozatát kínálja az adattáblák módosításához. Menjünk át néhány alapvető SQL parancsra:

  • ADATBÁZIS LÉTREHOZÁSA - új adatbázist hoz létre
  • TÁBLÁZAT LÉTREHOZÁSA - új táblázatot hoz létre
  • INSERT INTO - új adatokat szúr be egy adatbázisba
  • SELECT - adatokat von ki egy adatbázisból
  • FRISSÍTÉS - frissíti az adatokat egy adatbázisban
  • TÖRLÉS - adatokat töröl egy adatbázisból
  • ALTER ADATBÁZIS - módosít egy adatbázist
  • ALTER TÁBLÁZAT - módosít egy táblázatot
  • DROP TÁBLÁZAT - táblázatot töröl
  • INDEX létrehozása - indexet hoz létre egy elem keresésére
  • DROP INDEX - törli egy index

Az SQL jobb megértése érdekében telepítsük a MySQL-t, és nézzük meg, hogyan játszhatunk az adatokkal.

A MySQL telepítése

A MySQL telepítése egyszerű feladat. Itt van egy lépésről lépésre útmutató ez segít telepíteni a MySQL-t a rendszerére.

Miután befejezte a telepítést MySQL, kövesse az alábbi részt egy egyszerű bemutatóért, amely megmutatja, hogyan lehet adatokat beilleszteni, kezelni és módosítani.

SQL az adatok számára - MySQL bemutató

Ebben a bemutatóban meglátjuk, hogyan lehet adatbázisokat létrehozni és feldolgozni. Ez egy kezdő szintű bemutató, amellyel megkezdheti az SQL adatelemzését.

használja a python-t a vizuális stúdióban

Kezdjük tehát!

1. lépés: Hozzon létre egy SQL-adatbázist

Az SQL adatbázis egy tároló raktár, ahol az adatok strukturált formátumban tárolhatók. Most hozzunk létre egy adatbázist a használatával MySQL :

LÉTREHOZ DATABÁZIS edureka HASZNÁLJA edureka

A fenti kódban két SQL parancs található:

jegyzet : Az SQL parancsok nagybetűkkel vannak meghatározva, és az SQL parancsok befejezéséhez pontosvesszőt kell használni.

  1. CREATE DATABASE: Ez a parancs létrehoz egy „edureka” nevű adatbázist

  2. HASZNÁLAT: Ez a parancs az adatbázis aktiválására szolgál. Itt aktiváljuk az „edureka” adatbázist.

2. lépés: Hozzon létre egy táblázatot a szükséges adatfunkciókkal

A táblázat létrehozása ugyanolyan egyszerű, mint egy adatbázis létrehozása. Csak meg kell határoznia a változókat vagy a táblázat jellemzőit a megfelelő adattípusokkal. Nézzük meg, hogyan lehet ezt megtenni:

TÁBLÁZATI JÁTÉKOK LÉTREHOZÁSA (TID INTEGER NOT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Price INTEGER, mennyiség INTEGER)

A fenti kódrészletben a következő dolgok történnek:

  1. A ‘CREATE TABLE’ paranccsal hozzon létre egy játék nevű táblázatot.
  2. A játékasztal 4 funkciót tartalmaz, nevezetesen: TID (Tranzakcióazonosító), Tételnév, Ár és Mennyiség.
  3. Minden változó a megfelelő adattípusokkal van meghatározva.
  4. A TID változó elsődleges kulcsként van deklarálva. Az elsődleges kulcs alapvetően egy olyan változót jelöl, amely egyedi értéket képes tárolni.

A megadott parancs részleteit a következő paranccsal ellenőrizheti:

DESCRIBE játékok

3. lépés: Adatok beszúrása a táblázatba

Most, hogy létrehoztunk egy táblázatot, töltsük fel néhány értékkel. Korábban ebben a blogban említettem, hogyan adhat hozzá adatokat egy táblához egyetlen parancs, azaz az INSERT INTO használatával.

Lássuk, hogyan történik ez:

Beszúrás játékértékekbe (NULL, 'Vonat', 550, 88) Beszúrás játékértékekbe (NULL, 'Hotwheels_car', 350, 80) Beszúrás játékértékekbe (NULL, 'Magic_Pencil', 70, 100) Beszúrás játékértékekbe ( NULL, 'Dog_house', 120, 54) INSERT IN TO toys VALUES (NULL, 'Gördeszka', 700, 42)

A fenti kódrészletben egyszerűen 6 megfigyelést illesztettünk be a „játékok” táblázatunkba az INSERT INTO parancs segítségével. Minden megfigyeléshez, a zárójelben, megadtam minden változó vagy szolgáltatás értékét, amelyet a táblázat létrehozása során definiáltunk.

A TID változó értéke NULL, mivel automatikusan növekszik 1-től.

Most jelenítsük meg a táblázatunkban található összes adatot. Ezt az alábbi paranccsal teheti meg:

SELECT * FROM játékok


4. lépés: Módosítsa az adatbeviteleket

Tegyük fel, hogy úgy döntött, hogy megemeli a G.I. Joe, mivel ez sok ügyfelet szerez. Hogyan frissítené a változó árát egy adatbázisban?

Ez egyszerű, csak használja az alábbi parancsot:

A játékok frissítése BEÁLLÍTÁS = 350 HOL TID = 6

Az UPDATE parancs lehetővé teszi a táblázatban tárolt értékek / változók módosítását. A SET paraméter lehetővé teszi egy adott szolgáltatás kiválasztását, a WHERE paraméter pedig a változtatni kívánt változó / érték azonosítására szolgál. A fenti parancsban frissítettem annak az adatbevitelnek az árát, amelynek TID értéke 6 (G.I. Joe).

Most nézzük meg a frissített táblázatot:

SELECT * FROM játékok

Azt is módosíthatja, hogy mit szeretne megjeleníteni, csupán a megtekinteni kívánt oszlopokra hivatkozva. Például az alábbi parancs csak a játék nevét és annak árát jeleníti meg:

SELECT Tétel_név, Ár FROM játékokból

5. lépés: Adatok lekérése

Tehát az adatok beillesztése és módosítása után végre ideje kinyerni és visszakeresni az adatokat az üzleti követelményeknek megfelelően. Itt lehet adatokat kinyerni további adatelemzéshez és adatmodellezéshez.

Ne feledje, hogy ez egy egyszerű példa az SQL használatának megkezdésére, azonban valós körülmények között az adatok sokkal bonyolultabbak és nagyobb méretűek. Ennek ellenére az SQL parancsok továbbra is változatlanok, és ez teszi az SQL-t ilyen egyszerűvé és érthetővé. Összetett adatkészleteket képes feldolgozni egyszerű SQL parancsok halmazával.

Most kérjük le az adatokat néhány módosítással. Olvassa el az alábbi kódot, és próbálja megérteni, hogy mit csinál, anélkül, hogy megnézné a kimenetet:

KIVÁLASZT * A játékok közül HATÁRÉRTÉK

Kitaláltad! Megjeleníti a táblázatomban található első két megfigyelést.

Próbáljunk ki valami érdekesebbet.

KIVÁLASZT * A JÁTÉKOKBÓL RENDELÉS ÁRON ÁT

Az ábrán látható módon az értékeket az árváltozó növekvő sorrendjéhez viszonyítva rendezzük el. Ha meg szeretné keresni a három leggyakrabban vásárolt elemet, mit tenne?

Tényleg nagyon egyszerű!

KIVÁLASZT * A JÁTÉKOKBÓL RENDELÉS MÉRET MEGADÁSI KORLÁTO

Próbálkozzunk még egyet.

KIVÁLASZT * A JÁTÉKOKBÓL, HOL Ár> 400 RENDELÉS ÁRON ÁT


Ez a lekérdezés azoknak a játékoknak a részleteit vonja le, amelyek ára meghaladja a 400-at, és az árat növekvő sorrendbe rendezi.

Tehát így tudja feldolgozni az adatokat az SQL használatával. Most, hogy ismeri az SQL for Data Science alapjait, biztos vagyok benne, hogy kíváncsi további információkra. Íme néhány blog a kezdéshez:

  1. Mi az adattudomány? Beginner's Guide to Data Science
  2. MySQL oktatóanyag - Kezdő útmutató a MySQL elsajátításához

Ha be akar jelentkezni a mesterséges intelligencia és a gépi tanulás teljes tanfolyamára, az Edureka speciálisan kurátora van amellyel jártas lesz az olyan technikákban, mint a felügyelt tanulás, a felügyelet nélküli tanulás és a természetes nyelv feldolgozása. Képzést tartalmaz a mesterséges intelligencia és a gépi tanulás legújabb fejleményeiről és technikai megközelítéseiről, mint például a mély tanulás, a grafikus modellek és a megerősítő tanulás.