หลักสูตร Text and Web Mining with RapidMiner

บริษัท ควอนเดติกส์ จำกัด ร่วมมือกับดาต้า คิวบ์จัดอบรมหัวข้อ Text and Web Mining with RapidMiner โดยเป็นหลักสูตรสำหรับผู้สนใจดึงข้อมูลจากเว็บ (crawl) และทำการวิเคราะห์ข้อความ (text mining) หลักสูตรนี้เป็น 1 ใน 3 หลักสูตรเพื่อเตรียมพร้อมสำหรับการสอบ Certified RapidMiner Expert ครับ

หมายเหตุ: ผู้เข้าร่วมอบรมควรใช้โปรแกรม RapidMiner Studio มาก่อนหรือผ่านการอบรมหลักสูตร Practical Data Mining with RapidMiner Studio 9 มาก่อนครับ

วัตถุประสงค์ของการอบรม

  • Identify techniques for processing unstructured data
  • Transform textual data into a structured format
  • Apply different statistical text-processing method
  • Perform text classification and text clustering
  • Work on popular tasks like sentiment analysis or opinion mining

รายละเอียดโดยสรุป

This two days course is an introduction into knowledge discovery using unstructured data like text documents, web and social media contents. It focuses on the necessary preprocessing steps and the most successful methods for automatic text classification including: Naive Bayes, Support Vector Machines (SVM), and clustering. Upon completion of this course, participants will have a solid understanding of typical text mining workflows and be able to identify techniques for processing unstructured data, apply different statistical text-processing methods, and perform conte classification & clustering.

หัวข้อการอบรม

Introduction to RapidMiner Studio

Loading of Texts

  • Loading from Flat Files
  • Loading from Data Sets
  • Loading from Web Sources (e.g. URL crawling, Twitter)

Concepts

  • Text
  • Processing Documents
  • Tokens

Visualization

  • Visualizing Documents and Tokens
  • Multi-Dimensional Visualizations

Handling Unstructured Data

  • Preprocessing of Textual Data
  • Tokenizing
  • Stemming
  • Filtering of Tokens
  • Term Frequencies Document Frequencies TF-IDF
  • Advanced Modeling
  • Support Vector Machines
  • Naïve Bayes
  • K-NN
  • Text Clustering

Web Mining

  • Crawling the Web
  • Extracting Information from Web Sites
  • Transforming Web Sites to Documents
  • Retrieving Structured Web Data
  • Data ETL and Pre-processing for Web Sourced Data
  • Enriching Data via Web Services
  • Using Third Party Web Mining Extensions

เพิ่มเนื้อหาการทำ Text Mining ภาษาไทยครับ

ช่วงเวลาการอบรม

  • ระยะเวลาการอบรม 2 วันระหว่างวันที่ 25 และ 26 มีนาคม 2562

ค่าลงทะเบียน

  • ค่าลงทะเบียน 10,500 บาท (รวมเอกสารประกอบการอบรม อาหารว่าง อาหารกลางวันแบบ Buffet)

รายละเอียดเพิ่มเติมสอบถามได้ที่ contact@quandatics.com หรือ eakasit@datacubeth.ai

มีผู้สนใจสำรองที่นั่ง จำนวน 5 ท่าน (รับจำนวนจำกัด 20 ท่านเท่านั้น)

  1. คุณ ชัยศิริ
  2. คุณ พรประพันธ์
  3. คุณ ขาคริต
  4. คุณ Peerapong
  5. คุณ ปัทมา