آپاچی هادوپ مجموعه ای از الگوریتم هایی است که در ارتباط با یکدیگرند و در قالب یک فریم ورک نرم افزاری منبع باز طراحی شده است.این پروژه از پروژه های مهم آپاچی می باشد که بسیاری از بزرگان این زمینه هم در آن مشارکت دارند و یاهو بزرگترین آنهاست.Hadoop از استفاده از دادهها برای برنامههای توزیعشده تحت نرمافزار آزاد حمایت می کند و قابلیت کار با هزاران گره و چندین پتابایت از داده را داراست.در این دوره آموزشی از شرکت لیندا شما با این قالب نرم افزاری و ویژگی های آن آشنا می شوید.
عناوین آموزشی: – آشنایی کامپوننت های اصلی Hadoop مانند HDFS و MapReduce – تنظیم محیط توسعه Hadoop – کار با Hadoop file system – اجرا و پیگیری Hadoop job – آشنایی با Hive و HBase – بررسی ابزارهای Pig – ایجاد گردش کاری – استفاده از کتابخانه های دیگر مانند Impala, Mahout و Storm – آشنایی با Spark – مصورسازی خروجی Hadoop – و … |
Topics include: – Understanding Hadoop core components: HDFS and MapReduce – Setting up your Hadoop development environment – Working with the Hadoop file system – Running and tracking Hadoop jobs – Tuning MapReduce – Understanding Hive and HBase – Exploring Pig tools – Building workflows – Using other libraries, such as Impala, Mahout, and Storm – Understanding Spark – Visualizing Hadoop output |