หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 7 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 16 (วันที่ 27,28 ก.พ. – 1 มี.ค. 2560)

ภาพรวมของหลักสูตร

Screen Shot 2559-01-28 at 12.47.49 PM

โลกในยุคปัจจุบันได้ก้าวเข้าไปสู่ยุคที่เรียกว่า “Big Data” หรือ “ข้อมูลอภิมหาศาล” เนื่องจากในแต่ละวันมีข้อมูลเกิดขึ้นมากมาย อาทิเช่น ข้อมูลสมาชิกของ Facebook ข้อมูลการซื้อสินค้าจากในซุปเปอร์มาร์เกตต่างๆ และเพื่อให้เกิดประโยชน์มากที่สุดเราจำเป็นต้องนำข้อมูลอภิมหาศาลเหล่านี้มาทำการวิเคราะห์ (analyze) ซึ่งเทคนิคหนึ่งที่ได้รับการนิยมอย่างสูงในปัจจุบัน คือ เทคนิค Data Mining ซึ่งเป็นเทคนิคที่ค้นหาความสัมพันธ์ในข้อมูล เช่น ถ้าลูกค้าซื้อเบียร์แล้วลูกค้าจะซื้อผ้าอ้อมร่วมไปด้วย หรือถ้าเรากด Like หน้า Facebook page เราจะเห็นว่า Facebook มีระบบแนะนำ page อื่นๆ ที่เกี่ยวข้องมาให้ด้วย หรือ การสร้างโมเดลเพื่อทำนายสิ่งที่จะเกิดขึ้นในอนาคต เช่น ทำนายยอดขายในไตรมาสถัดไป หรือ การทำนายว่าพนักงานคนไหนที่จะลาออกจากบริษัทในช่วง 3 เดือนข้างหน้า ตัวอย่างเหล่านี้ล้วนเป็นผลมาจากการวิเคราะห์ข้อมูลทางด้าน Data Mining

การวิเคราะห์ข้อมูลด้วย Data Mining นี้กำลังเป็นที่นิยมไปทั่วโลกด้วยแรงขับเคลื่อนอย่างหนึ่งคือ การมีซอฟต์แวร์ที่ช่วยให้ทำการวิเคราะห์ได้ง่ายขึ้น แต่ซอฟต์แวร์ส่วนใหญ่จะเป็นซอฟต์แวร์เชิงพาณิชย์ (commercial software) เช่น SAS Enterprise Miner หรือ IBM Intelligent Miner ทว่าการลงทุนซื้อซอฟต์แวร์เชิงธุรกิจเหล่านี้มาใช้งานอาจจะไม่คุ้มค่าในการลงทุนสำหรับผู้ประกอบการวิสาหกิจขนาดกลางและขนาดย่อม (SMEs) หรืออาจารย์ นักวิจัย และ นักศึกษาระดับปริญญาโทและเอก ในมหาวิทยาลัยต่างๆ ดังนั้นวิธีการหนึ่งที่จะทำให้เราสามารถวิเคราะห์ข้อมูลเหล่านี้ได้คือการใช้ open source software ที่สามารถดาวน์โหลดมาใช้งานได้โดยไม่เสียค่าใช้จ่าย (ฟรี !!!) เช่น ซอฟต์แวร์ Weka ผมคลุกคลีกับ Weka มาเป็นเวลาหลายปี เคยเขียนคู่มือการใช้งาน Weka Explorer ลงในนิตยสาร OpenSource2Day สร้างหลักสูตรการอบรมการใช้งาน Weka Explorer และอบรมการใช้งานซอฟต์แวร์ตัวนี้มาเป็นจำนวนเกือบยี่สิบรุ่น แม้ว่าซอฟต์แวร์นี้จะใช้งานได้ง่ายสำหรับผู้เริ่มต้นและสะดวกที่จะนำไปใช้ในการพัฒนา Web Application แต่ในหลายๆ ครั้งผมมักจะพบข้อจำกัดหรือความยากในการแสดงผลจากซอฟต์แวร์ตัวนี้ ดังนั้นผมจึงหันมาสนใจซอฟต์แวร์ตัวอื่นที่สามารถทดแทนหรือดีกว่าซอฟต์แวร์ Weka Explorer และผมก็พบกับซอฟต์แวร์ RapidMiner Studio 6 ซึ่งเป็นซอฟต์แวร์ทาง Data Mining ที่ได้รับการโหวตว่ามีผู้ใช้งานมากที่สุดจากเว็บไซต์ KDnuggets.com เมื่อปี 2013 ในหลักสูตรนี้ผมจะแนะนำให้คุณรู้จักการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining ตั้งแต่ระดับต้นจน (basic) จนถึงระดับกลาง (intermediate) ด้วยการใช้ซอฟต์แวร์ RapidMiner Studio 7 ซึ่งเป็นเวอร์ชันล่าสุด ถ้าคุณยังลังเลว่าคุณควรจะมาเข้าร่วมอบรมหลักสูตรนี้กับผมหรือไม่ ผมขอถาม 8 คำถามสั้นๆ ดังนี้ครับ

  • สนใจการวิเคราะห์ข้อมูลด้วย Data Mining แต่ไม่รู้จะเริ่มยังไงดี
  • อยากรู้ว่าลูกค้าซื้อสินค้าอะไรเป็นส่วนใหญ่
  • อยากเข้าใจพฤติกรรมการบริโภทของลูกค้า
  • อยากหยั่งรู้อนาคต (บางส่วน)
  • อยากทำงานวิจัยทางด้าน text mining
  • อยากทำงานวิจัยทางด้าน image processing
  • ไม่ชอบการเขียนโปรแกรมแต่อยากวิเคราะห์ข้อมูลที่ซับซ้อนได้
  • เคยเข้าร่วมการอบรมการใช้งาน Weka Explorer มาแล้วและอยาก update ความรู้ทาง Data Mining ใหม่ๆ ด้วยซอฟต์แวร์ใหม่ๆ

ถ้าคุณตอบว่า “ใช่” ในคำถามข้อใดข้อหนึ่ง ผมขอแนะนำว่าคุณควรจะมาเข้าร่วมอบรมกับผมครับ และคุณจะรู้ว่าทำไมผมถึงเปลี่ยนใจจาก Weka Explorer มาตกหลุมรักซอฟต์แวร์ที่ชื่อว่า RapidMiner Studio 7 ครับ ^^

อ่านรายละเอียดหลักสูตรได้ที่ http://dataminingtrend.com/2014/training/rapidminer-training-16/

หนังสือ Introduction to Business Analytics with RapidMiner Studio 6 (ภาษาไทย)

สารบัญ

  • บทที่ 1 แนะนำส่วนต่างๆ ของ RapidMiner Studio 6
    • การติดตั้งซอฟต์แวร์
    • ส่วนประกอบต่างๆ ของ RapidMiner Studio 6
  • บทที่ 2 การเตรียมข้อมูล (preprocess)
    • แนะนำข้อมูล Sales data
    • การสร้าง Repository ใหม่
    • การ import ข้อมูลเข้ามาใช้งาน
    • การดูข้อมูลในรูปแบบต่างๆ (data exploration)
    • โอเปอเรเตอร์ที่ใช้งานในบทที่ 2
    • การคัดเลือกข้อมูล
    • การคำนวณราคา
    • แนะนำการแบ่งกลุ่มด้วยวิธี RFM (Recency, Frequency, Monetary)
    • การเตรียมข้อมูลสำหรับการแบ่งกลุ่มด้วยวิธี RFM
    • แบบฝึกท้ายบท
  • บทที่ 3 การแบ่งกลุ่มข้อมูล (segmentation)
    • การแบ่งกลุ่มลูกค้าตามพฤติกรรมการบริโภคด้วยวิธี RFM
    • โอเปอเรเตอร์ที่ใช้งานในบทที่ 3
    • การแบ่งกลุ่มข้อมูลด้วยวิธี RFM ใน RapidMiner Studio 6
    • แบบฝึกท้ายบท
  • บทที่ 4 การหาความสัมพันธ์ของข้อมูล (Product Association)
    • แนะนำการหากฏความสัมพันธ์ (Association Rules)
    • โอเปอเรเตอร์ที่ใช้งานในบทที่ 4
    • การเตรียมข้อมูลก่อนหาความสัมพันธ์
    • การหารูปแบบของสินค้าที่เกิดขึ้นบ่อย (frequent itemset)
    • การหากฏความสัมพันธ์
    • แบบฝึกท้ายบท
  • ภาคผนวก A การสร้างข้อมูล
  • ภาคผนวก B โอเปอเรเตอร์ที่ใช้งานทั้งหมด

ท่านใดสนใจหนังสือการวิเคราะห์ข้อมูลในเชิงธุรกิจ (business analytics) ราคาเล่มละ 269 บาทเท่านั้นครับ

ถ้าต้องการเป็นแบบจัดพิมพ์สามารถสั่งชื้อได้โดยการโอนเงินมายัง 1 ในบัญชีเหล่านี้ และส่งหลักฐานพร้อมที่อยู่สำหรับการจัดส่งมาที่ sit.ake@gmail.com หรือกรอกแบบฟอร์มด้านล่างครับ

  • นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารทหารไทย สาขาฟิวเจอร์พาร์ค รังสิต หมายเลขบัญชี 215-2-30624-3
  • นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารกสิกรไทย สาขาฟิวเจอร์พาร์ค รังสิต หมายเลขบัญชี 003-1-96614-0
  • นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารกรุงเทพ สาขาบิ๊กซี นวนคร หมายเลขบัญชี 947-006194-7
  • หสม. ดาต้า คิวบ์ กระทำการแทนโดย นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารไทยพาณิชย์ สาขาเดอะวอล์ค ราชพฤกษ์ หมายเลขบัญชี 404-524725-5

สอบถามรายละเอียดเพิ่มเติมได้ที่ sit.ake@gmail.com หรือ lineID: eakasitp หรือสั่งจองได้จากฟอร์มด้านล่างครับ ^^