Mivel az Adache Warehousing csomag a Hadoop tetejére épül, az Apache Hive egyre inkább adatelemzésre, adatbányászatra és prediktív modellezésre használják. A szervezetek határozottan ragaszkodó szakembereket keresnek . Ebben a bejegyzésben nézzük meg, hogyan kell futtatni a Hive Scripteket. Általánosságban elmondható, hogy a parancsfájlok segítségével egyszerre hajtunk végre egy sor állítást. A Hive Scripteket nagyjából ugyanúgy használják. Csökkenti az egyes parancsok kézi írásához és végrehajtásához szükséges időt és erőfeszítést.
mik a csomagok a java-ban
A Hive szkripteket a Hive 0.10.0 és újabb verziói támogatják. Mivel a Hive 0.90 verzió telepítve van a CDH3-ra, nem tudjuk futtatni a Hive Scripteket a CDH3-ban. A CDH4 alábbi lépéseit kipróbálhatja, mivel a Hive 0.10.0 verziója van telepítve. Tudja, hogyan hozhat létre Hive parancsfájlt? Ha nem, kattintson a gombra hogy további tisztázást nyerjek.
Most nézzük meg, hogyan kell a szkripteket írni a Hive-be, és futtatni őket a CDH4-ben:
1. lépés: Hive parancsfájl írása.
A Hive Script megírásához a fájlt .sql kiterjesztéssel kell menteni. Nyisson meg egy terminált a Cloudera CDH4 terjesztésében, és adja meg a következő parancsot a Hive parancsfájl létrehozásához.
Parancs: sudo gedit minta.sql
A fenti parancs végrehajtásakor megnyílik a fájl, amely tartalmazza az összes végrehajtandó Hive parancsot.
Ebben a szkriptben egy táblát hoznak létre, leírnak, és az adatokat betöltik és lekérik a táblából.
1. A táblázat létrehozása a kaptárban:
Parancs: tábla termék létrehozása (termékazonosító: int, terméknév: karakterlánc, ár: úszó, kategória: karakterlánc) sorok formázása elválasztott mezők, végződés ’,’
Itt a termék a táblázat neve, a {productid, terméknév, ár, kategória} pedig a táblázat oszlopai.
A „,” betűvel végződő mezők azt jelzik, hogy a bemeneti fájl oszlopait a „,” szimbólum választja el.
Alapértelmezés szerint a bemeneti fájl rekordjait egy új sor választja el.
2. A táblázat ismertetése:
Parancs: termék leírása
3. Az adatok betöltése a táblázatba.
Az adatoknak a táblába történő betöltéséhez először létre kell hoznunk egy bemeneti fájlt, amely tartalmazza a táblázatba beillesztendő rekordokat.
hogyan lehet kilépni egy módszerből a java-ban
Hozzunk létre egy bemeneti fájlt.
Parancs: sudo gedit input.txt
Szerkessze a fájl tartalmát az ábra szerint.
4. Az adatok lekérése:
Az adatok lekéréséhez a select parancsot kell használni.
Parancs: Válassza a * terméket
A fenti parancs a táblázatban található összes oszlop értékének lekérésére szolgál. A szkriptnek olyannak kell lennie, mint az alábbi képen látható.
Most elkészültünk a Hive szkript megírásával. A sample.sql fájl most elmenthető.
2. lépés: A Hive Script futtatása
A következő parancs a Hive parancsfájl futtatására szolgál:
Parancs: kaptár –f /home/cloudera/sample.sql
git és github ugyanaz
A parancsfájl végrehajtása közben ellenőrizze, hogy a parancsfájl helyének teljes elérési útja megvan-e.
Láthatjuk, hogy az összes parancs sikeresen végrehajtásra kerül.
Így futtatják és futtatják a Hive parancsfájlokat a CDH4-ben.
A Hive a Hadoop kritikus eleme, és a Hive-ban szerzett szakértelme el tudja juttatni a legjobban fizető Hadoop-munkákat! Az Edureka rendelkezik egy speciálisan kurált Hadoop tanfolyammal, amely segít olyan fogalmak elsajátításában, mint a MapReduce, a fonal, a disznó, a kaptár, a HBase, az Oozie, a Flume és a Sqoop. A kezdéshez kattintson az alábbi gombra.
Van egy kérdésünk? Kérjük, említse meg őket a megjegyzések részben, és mi kapcsolatba lépünk Önnel.
Kapcsolódó hozzászólások: