A LinkedIn két elemzője 2008-ban hozta létre az „adatkutató” kifejezést. Éppen azt próbálták leírni, hogy mit csinálnak, vagyis üzleti értéket nyernek a weboldaluk által generált hatalmas adatokból. Ennek során végül megnevezték azt a munkakört, amely hihetetlen keresletnek örvendene az elkövetkező években, és még annak is fogják nevezni ’A 21 legszexisebb munkájautcaszázad.'
Azok a szervezetek, amelyek az „adatokat” értékes eszköznek tekintik, ezeket az adatszakértőket vagy „tudósokat” keresik, akik a jövőbe vezethetik őket.
Szóval, mi kell ahhoz, hogy nagy adattudós legyünk? Különféle készségkészletek!
Röviden áttekintjük az adatkutató alapvető készségeit.
Az adattudomány folyamata 3 szakaszból áll.
- Data Capture
- Adatelemzés
- Bemutatás
Vizsgáljuk meg közelebbről az adatkutató szerepét e szakaszok mindegyikében.
Data Capture
- Programozási és adatbázis-készségek
Az adatbányászat első lépése a megfelelő adatok rögzítése. Tehát ahhoz, hogy adattudós legyünk, nagyon fontos ismerni az eszközöket és technológiákat, különösen a nyílt forráskódúakat, mint a Hadoop, a Java, a Python, a C ++, és az olyan adatbázis-technológiákat, mint az SQL, NoSQL, HBase és így tovább.
- Üzleti tartomány és szakértelem
Az adatok üzletenként eltérőek. Ezért az üzleti adatok megértéséhez szakértelemre van szükség, amely csak egy adott adattartományban végzett munkával jár.
Például: Az orvosi területről összegyűjtött adatok teljesen eltérnek a kiskereskedelmi ruházati üzlet adataitól.
- Adatmodellezés, raktár és strukturálatlan adatkészségek
A szervezetek hatalmas mennyiségű adatot gyűjtenek különböző forrásokon keresztül. Az így rögzített adatok strukturálatlanok, és az elemzés előtt rendszerezni kell őket. Ezért egy adatkutatónak jártasnak kell lennie a strukturálatlan adatok modellezésében.
Adatelemzés
- Statisztikai eszköz készségek
Az adattudós alapvető készsége az, hogy tudja használni a statisztikai eszközöket, mint például az R, az Excel, az SAS és így tovább. Ezekre az eszközökre van szükség a rögzített adatok őrléséhez és elemzéséhez.
- Matematikai készségek
A számítástechnika ismerete önmagában nem elegendő ahhoz, hogy adattudós legyen. Az adatkutatói profilhoz olyan személyre van szükség, aki képes megérteni a nagyszabású gépi tanulási algoritmusokat és programozásokat, ugyanakkor jártas statisztikus. Ehhez a számítógépes nyelveken kívül más tudományos és matematikai tudományterületekre is szükség van.
Bemutatás
- Vizualizációs eszköz készségek
Lehet, hogy képes bányászni és modellezni az összegyűjtött adatokat, de képes-e ezeket megjeleníteni?
Ha sikeres adatkutató akar lenni, akkor képesnek kell lennie arra, hogy működjön együtt néhány adatmegjelenítő eszközzel az adatelemzések vizuális megjelenítéséhez. Néhány ilyen az R, a Flare, a HighCharts, az AmCharts, a D3.js, a Processing és a Google Visualization API stb.
De ez még nem a vége! Ha nagyon szeretne adatkutatóvá válni, akkor a következő képességekkel kell rendelkeznie:
- Kommunikációs képességek: A statisztikák és az Excel a trükkös. Az adatkutatóknak képesnek kell lenniük az adatok bemutatására úgy, hogy az eredményeket közöljék az üzleti felhasználókkal.
- Üzleti készségek : Az adatkutatóknak több szerepet kell játszaniuk. Szükségük lenne kommunikálni a szervezet különböző embereivel. Ezért nagy segítség lesz az erős üzleti ismeretek birtokában, amelyek magukban foglalják a kommunikációt, a tervezést, a szervezést és a menedzsmentet. Ez magában foglalja az üzleti és alkalmazási követelmények megértését és az információk ennek megfelelő értelmezését. Emellett átfogóan meg kell ismernie az ipar legfontosabb kihívásait, és tisztában kell lennie a jobb döntéshozatal pénzügyi mutatóival. Lényeg: egy adattudós, aki a „Business” -re is gondol.
- Problémamegoldó képesség: Ez nyilvánvalónak tűnik, mivel az adattudomány a problémamegoldásról szól. A hatékony adatkutatónak időt kell szánnia, és alaposan meg kell vizsgálnia a problémát, és a felhasználónak megfelelő megvalósítható megoldást kell találnia.
- Jóslati készségek: Az adattudósnak is hatékony előrejelzőnek kell lennie. Széles körű ismeretekkel kell rendelkeznie az algoritmusokról, hogy kiválassza a megfelelőt, amely megfelel az adatmodellnek. Ez bizonyos mértékű kreativitással jár az adatok ésszerű felhasználása és ábrázolása érdekében.
- Hackelés: Tudom, hogy ijesztően hangzik, de az olyan hackelési képességek, mint a szövegfájlok parancssoros kezelése, a vektorizált műveletek megértése és az algoritmikus gondolkodás jobb adatkutatóvá tesznek.
A fenti készségeket tekintve egyértelmű, hogy Data Scientistnek lenni nem csak az adatokról mindent tudni kell. Ez egy olyan munkaprofil, amely egyesíti az adatkészségeket, a matematikai készségeket, az üzleti és a kommunikációs készségeket. Mindezen készségek együttes alkalmazásával az adatkutatót joggal nevezhetjük az informatikai terület rocksztárjának.
ssis bemutató lépésről lépésre
Ellenőrző lista, hogy félelmetes és hatékony tudós legyen belőle:
Áttekintettük azokat a készségeket, amelyekre szükség van az adatkutatóvá váláshoz. Óriási különbség van abban, ha csak adatkutatóvá válunk, és félelmetes és hatékony adattudóvá válunk. A következő készségek a fent említett képességekkel együtt megkülönböztetnek téged attól, hogy normális vagy akár közepes adatkutató vagy.
- Matematikai készségek - Számítások, mátrix műveletek, numerikus optimalizálás, sztochasztikus módszerek stb.
- Statisztikai készségek - Regressziós modellek, tress, osztályozások, diagnosztika, alkalmazott statisztikák stb.
- Kommunikáció - Megjelenítés, bemutatás és írás.
- Adatbázis - A CouchDB mellett ismeretek olyan nem hagyományos adatbázisokban, mint a MongoDB és a Vertica.
- Programozási nyelvek - Pig, Hive, Java, Python stb.
- Természetes nyelv feldolgozása és Adatbányászat.
Az Edurekának van egy speciálisan kurátora amely segít szaktudást szerezni olyan gépi tanulási algoritmusokban, mint a K-Means klaszterezés, a döntési fák, a Random Forest, a Naive Bayes. Megtanulja a statisztika, az idősor, a szövegbányászat és a mély tanulás bevezetését. Hamarosan új tételek kezdődnek erre a tanfolyamra !!