Az Apache Drill az iparág első séma nélküli SQL motorja. A Drill nem a világ első lekérdező motorja, de ez az első, amely megteremti a finom egyensúlyt a rugalmasság és a sebesség között. A Drill úgy lett kialakítva, hogy több ezer csomópontra méretezhesse és petabájtnyi adatot kérdezzen le olyan interaktív sebességgel, amelyre a BI / Analytics környezeteknek szüksége van.
Integrálható számos adatforrással, például Hive, HBase, MongoDB, fájlrendszer, RDBMS. A bemeneti formátumok, például az Avro, a CSV, a TSV, a PSV, a parketta, a Hadoop Sequence fájlok és még sok más, könnyedén használhatók a Drill-ben.
Miért éppen Apache Drill?
Az Apache Drill legnagyobb előnye, hogy menet közben felfedezheti a sémát, miközben bármilyen adatot lekérdez. Ezenkívül a jobb elemzés érdekében együttműködhet a BI eszközeivel, például a Tableau, a Qlikview, a MicroStrategy stb.
Íme egy iparági elemző idézete, amely összefoglalja az Apache Drill értékét:
„A Drill nem csak az SQL-on-Hadoop-ról szól. Az SQL-ről szinte mindenre szól, azonnal és formalitás nélkül. '
- Andrew Burst, Gigaom Research, 2015. január
A Drillbit az Apache Drill démonja, amely a fürt minden csomópontján fut. A ZooKeeper programot használja a fürt összes kommunikációjához és a fürt tagság fenntartásához. Feladata az ügyféltől érkező kérések elfogadása, a lekérdezések feldolgozása és az eredmények visszaadása az ügyfélnek. Az ügyfeletől érkező kérést „művezetőnek” hívják. Generálja a végrehajtási tervet, a végrehajtási töredékeket elküldi a fürtben futó többi fúrólyuknak.
Még egy előnye, hogy a fúró telepítése és beállítása nagyon egyszerű. Tanuljuk meg az Apache Drill telepítését.
Az első lépés a fúrócsomag letöltése.
java system.exit (1)
Parancs: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz
Parancs: tar -xvf apache-drill-1.5.0.tar.gz
Parancs: ls
Ezután állítsa be a környezeti változókat a .bashrc fájlban.
Parancs: sudo gedit .bashrc
export DRILL_HOME = / home / edureka / apache-drill-1.5.0
export PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin
Ez a parancs frissíti a módosításokat:
Parancs: forrás .bashrc
Most keresse meg a conf könyvtár könyvtárát, és szerkessze a drill-override.conf fájlt a fürt azonosítójával és a zookeeper gazdagéppel és porttal, majd egy helyi fürtön futtatjuk.
Parancs: cd apache-drill-1.5.0
Parancs: sudo gedit conf / drill-override.conf
Alapértelmezés szerint a DRILL_MAX_DIRECT_MEMORY fájl mérete 8 GB lesz a drill-env.sh fájlban, és azt a meglévő memória szerint kell megőriznünk.
Parancs: sudo gedit conf / drill-env.sh
A fúró csak egyetlen csomópontban történő telepítéséhez használhatja a beágyazott módot, ahol az helyben fog futni. A parancs futtatásakor automatikusan elindítja a drillbit szolgáltatást.
Parancs: ./bin/drill-embedded
Egy egyszerű lekérdezéssel futtathatja a telepítést.
Parancs: válassza a * lehetőséget a sys.options közül WHERE type = ‘SYSTEM’ és nevezze meg, mint például: „security%”
Az Apache Drill webkonzoljának ellenőrzéséhez a webböngészőben a localhost: 8047 webhelyre kell lépnünk.
A lekérdezést a Lekérdezés fülről is futtathatja.
A fúrás elosztott módban történő futtatásához szerkesztenie kell a fürt azonosítóját, és hozzá kell adnia a ZooKeeper információkat a drill-override.conf fájlban az alábbiak szerint.
Ezután el kell indítanunk a ZooKeeper szolgáltatást minden csomóponton. Ezt követően minden csomóponton el kell indítania a drillbit szolgáltatást ezzel a paranccsal.
fibonacci sorozat c ++ -ban
Parancs: ./bin/drillbit.sh kezdés
Parancs: jps
Most a lenti paranccsal indíthatjuk a fúróhéjat.
Most végre tudjuk hajtani lekérdezéseinket a fürtön elosztott módban.
Ez egy kétrészes Apache Drill blogsorozat első blogbejegyzése. Hamarosan megjelenik a sorozat második blogja.
Van egy kérdésünk? Említse meg őket a megjegyzés rovatban, és kapcsolatba lépünk Önnel.
Kapcsolódó hozzászólások: