หลักสูตรอบรมการจัดการข้อมูลขนาดใหญ่ (Big Data) ด้วย Hadoop และ RapidMIner Radoop (Introduction to Cloudera Hadoop & Radoop)

ในการจัดการข้อมูลขนาดใหญ่ๆ หรือ Big Data จะไม่สามารถใช้เครื่องคอมพิวเตอร์เพียงเครื่องเดียวในการจัดเก็บข้อมูลได้ จึงต้องใช้คอมพิวเตอร์หลายๆ เครื่องช่วยในการจัดเก็บและประมวลผลจึงมีเทคโนโลยี Hadoop ขึ้นมา concept การทำงานของ Hadoop คือการแบ่งข้อมูลให้มีขนาดเล็กลงและส่งไปประมวลผลในเตรื่องคอมพิวเตอร์ต่างๆ ที่เชื่อมต่อกันได้ ในการใช้งาน Hadoop จะต้องเขียนโปรแกรมเพื่อสั่งให้ทำงาน

เพื่อให้การทำงารได้ง่ายขึ้น RapidMiner จึงพัฒนา RapidMiner Radoop (Rapidminer on haDOOP) ขึ้นมา ทำให้ใช้งานได้ขึ้นโดยที่ไม่ต้องเขียน code เลย

ในหลักสูตรนี้มี 2 วันโดยวันแรกจะได้เรียนเรื่องเกี่ยวกับเทคโนโลยีของ Hadoop ไม่ว่าจะเป็น Hadoop Map Reduce, Hive, Spark และวันที่สองจะเป็นการใช้งาน RapidMiner Radoop เพื่อดึงและวิเคราะห์ข้อมูลขนาดใหญ่ที่เก็บไว้บน Hadoop

ท่านใดสนใจหรือ #เรียนMOOCแล้วทำตามไม่สำเร็จ ดูรายละเอียดเพิ่มเติมและสำรองที่นั่งได้ที่ด้านล่างได้เลยครับ

 

วันที่ 1 Introduction to Cloudera Hadoop

Introduction to Big Data Hadoop

  • Hadoop Overview and History
  • Exploring Hadoop Ecosystem
  • Introduction to Cloudera Manager and CDH

Introduction to Hadoop Core Components: HDFS and YARN

  • HDFS – Distributed File System
    • Understanding HDFS Architecture and Components
    • Hands-on HDFS basics shell commands
  • YARN – Resource Management
  • Understanding YARN Architecture and Components
  • Exploring Hadoop file formats (Which file format is better?)

Using relational data stores with Hadoop

  • Introduction to Hive (Hive Architecture and how it works)
  • Overview of Hive supported file formats and Hive partition
  • Hands-on HiveQL through Hue interface & Hive Client
  • Integrating MySQL with Hive using Sqoop
  • Use Sqoop to import data from MySQL to HDFS/Hive
  • Use Sqoop to export data from Hadoop to MySQL

Large-Scale Data Processing Frameworks

  • Introduction to Hadoop MapReduce
    • What is it & How it works?
    • Practical MapReduce example
  • Introduction to Apache Spark
    • Overview of Spark Core Concepts and Architecture
      • Spark Clusters and the Resource Management System
      • Spark Application
      • Spark Driver and Executor
    • Introducing to Spark data structures: The Resilient Distributed Dataset (RDD) & RDD Operations
    • Hands-On simple Spark jobs

วันที่ 2 Big Data Analytics with RapidMiner Radoop

What will you learn?

  • Understand Hadoop infrastructure
  • Connect to a Hadoop cluster
  • Explore large data stores
  • Perform data extraction and loading tasks
  • Integrate in-cluster analyses into RapidMiner processes

Course Outline

  • What is Big Data?
  • How does Big Data fit into modern analytics?
  • Introduction to Hadoop
    • Distributions
    • General Infrastructure
  • Hadoop Integration with RapidMiner: Radoop
  • Introduction to the Radoop GUI
  • Connecting to a Hadoop Cluster
  • Data Exploration
    • Browsing Tables
    • Viewing Statistics and High-Level Information
  • Data Extraction and Loading
    • Formulation of Queries
    • Pushing Data into Hadoop
  • Integration of In-cluster Analyses into RapidMiner Processes
    • Modeling Algorithms
    • Natural Aggregation
    • In-memory Training, in-Hadoop Scoring
  • Beyond Natural Aggregation:
    • Chunking
    • Voting
    • In-Hadoop Modeling
    • Clustering

วันและเวลาจัดอบรม

  • วันจันทร์ที่ 17 มิถุนายน 2562 – วันอังคารที่ 18 มิถุนายน 2562
  • ระยะเวลาการอบรม 09:00 – 17:00 น.

สถานที่จัดอบรมและค่าใช้จ่าย

  • The Connecion (MRT ลาดพร้าว)
  • ค่าใช้จ่าย 10,486 บาท (ราคารวมภาษีมูลค่าเพิ่มแล้ว สามารถหักภาษี ณ ที่จ่าย 3% ได้ครับ)
  • อบรมเป็นภาษาอังกฤษ (แต่มีผู้ช่วยวิทยากรคนไทยช่วยสอนด้วยครับ)

รายละเอียดเพิ่มเติมสอบถามได้ที่ chutimon@quandatics.com หรือ eakasit@datacubeth.ai

มีผู้สนใจสำรองที่นั่ง จำนวน 12 ท่าน (รับจำนวนจำกัดไม่เกิน 20 ท่านครับ)

  1. คุณ Kittisak
  2. คุณ Wanrudee
  3. คุณ วิศรุต
  4. คุณ วรฉัตร
  5. คุณ ณัชชา
  6. คุณ ชินวัฒน์
  7. คุณ วิริยสิษฐ์
  8. คุณ ธีราภรณ์
  9. คุณ Pavariss
  10. คุณ สุนิสา
  11. คุณ สุรภา
  12. คุณ ปฐมภัทร