Az Apache Drill, a New-Age Query Engine fúrása



Ez az Apache Drill oktatóanyag minden szükséges információt megad Önnek az Apache Drill lekérdező motor használatának megkezdéséhez, a Hadoop használatához, a Big Data & Apache Sparkhoz.

Az Apache Drill az iparág első séma nélküli SQL motorja. A Drill nem a világ első lekérdező motorja, de ez az első, amely megteremti a finom egyensúlyt a rugalmasság és a sebesség között. A Drill úgy lett kialakítva, hogy több ezer csomópontra méretezhesse és petabájtnyi adatot kérdezzen le olyan interaktív sebességgel, amelyre a BI / Analytics környezeteknek szüksége van.





Integrálható számos adatforrással, például Hive, HBase, MongoDB, fájlrendszer, RDBMS. A bemeneti formátumok, például az Avro, a CSV, a TSV, a PSV, a parketta, a Hadoop Sequence fájlok és még sok más, könnyedén használhatók a Drill-ben.

Miért éppen Apache Drill?

Az Apache Drill legnagyobb előnye, hogy menet közben felfedezheti a sémát, miközben bármilyen adatot lekérdez. Ezenkívül a jobb elemzés érdekében együttműködhet a BI eszközeivel, például a Tableau, a Qlikview, a MicroStrategy stb.



Íme egy iparági elemző idézete, amely összefoglalja az Apache Drill értékét:

„A Drill nem csak az SQL-on-Hadoop-ról szól. Az SQL-ről szinte mindenre szól, azonnal és formalitás nélkül. '

- Andrew Burst, Gigaom Research, 2015. január



A Drillbit az Apache Drill démonja, amely a fürt minden csomópontján fut. A ZooKeeper programot használja a fürt összes kommunikációjához és a fürt tagság fenntartásához. Feladata az ügyféltől érkező kérések elfogadása, a lekérdezések feldolgozása és az eredmények visszaadása az ügyfélnek. Az ügyfeletől érkező kérést „művezetőnek” hívják. Generálja a végrehajtási tervet, a végrehajtási töredékeket elküldi a fürtben futó többi fúrólyuknak.

Drillbits-Apache-Drill

Még egy előnye, hogy a fúró telepítése és beállítása nagyon egyszerű. Tanuljuk meg az Apache Drill telepítését.

Az első lépés a fúrócsomag letöltése.

java system.exit (1)

Parancs: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz

Parancs: tar -xvf apache-drill-1.5.0.tar.gz

Parancs: ls

Ezután állítsa be a környezeti változókat a .bashrc fájlban.

Parancs: sudo gedit .bashrc

export DRILL_HOME = / home / edureka / apache-drill-1.5.0

export PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin

Ez a parancs frissíti a módosításokat:

Parancs: forrás .bashrc

Most keresse meg a conf könyvtár könyvtárát, és szerkessze a drill-override.conf fájlt a fürt azonosítójával és a zookeeper gazdagéppel és porttal, majd egy helyi fürtön futtatjuk.

Parancs: cd apache-drill-1.5.0

Parancs: sudo gedit conf / drill-override.conf

Alapértelmezés szerint a DRILL_MAX_DIRECT_MEMORY fájl mérete 8 GB lesz a drill-env.sh fájlban, és azt a meglévő memória szerint kell megőriznünk.

Parancs: sudo gedit conf / drill-env.sh

A fúró csak egyetlen csomópontban történő telepítéséhez használhatja a beágyazott módot, ahol az helyben fog futni. A parancs futtatásakor automatikusan elindítja a drillbit szolgáltatást.

Parancs: ./bin/drill-embedded

Egy egyszerű lekérdezéssel futtathatja a telepítést.

Parancs: válassza a * lehetőséget a sys.options közül WHERE type = ‘SYSTEM’ és nevezze meg, mint például: „security%”

Az Apache Drill webkonzoljának ellenőrzéséhez a webböngészőben a localhost: 8047 webhelyre kell lépnünk.

A lekérdezést a Lekérdezés fülről is futtathatja.

A fúrás elosztott módban történő futtatásához szerkesztenie kell a fürt azonosítóját, és hozzá kell adnia a ZooKeeper információkat a drill-override.conf fájlban az alábbiak szerint.

Ezután el kell indítanunk a ZooKeeper szolgáltatást minden csomóponton. Ezt követően minden csomóponton el kell indítania a drillbit szolgáltatást ezzel a paranccsal.

fibonacci sorozat c ++ -ban

Parancs: ./bin/drillbit.sh kezdés

Parancs: jps

Most a lenti paranccsal indíthatjuk a fúróhéjat.

Most végre tudjuk hajtani lekérdezéseinket a fürtön elosztott módban.

Ez egy kétrészes Apache Drill blogsorozat első blogbejegyzése. Hamarosan megjelenik a sorozat második blogja.

Van egy kérdésünk? Említse meg őket a megjegyzés rovatban, és kapcsolatba lépünk Önnel.

Kapcsolódó hozzászólások:

Az Apache Drill 2. részének lefúrása

Apache Spark Vs Hadoop MapReduce