สไลด์บางส่วนจากการอบรม Practical Data Mining with RapidMiner Studio 7

ตัวอย่างสไลด์การอบรม Practical Data Mining with RapidMiner Studio 7 รุ่นที่ 17 ครับ ท่านใดสนใจดูรายละเอียดการอบรมรุ่นถัดไปได้ที่ http://dataminingtrend.com/2014/training/rapidminer-training-18/

แจกฟรี E-book บน Ookbee เรื่อง Introduction to Business Analytics with RapidMiner Studio 6

ดาต้า คิวบ์แจก E-book ฟรี จำนวน 99 เล่ม ท่านใดสนใจ รบกวนกรอกข้อมูลในฟอร์มด้านล่างเพื่อรับ Promotion Code และวิธีการกรอกเพื่อดาวน์โหลดฟรีใน Ookbee application ได้เลยครับ (Update 01/04/2017)

Capture356


หมายเหตุ เนื่องจากโปรโมชันนี้มีจำนวนจำกัดหลังจากได้รับ Promotion Code แล้วกรุณากรอกทันทีครับ ไม่เช่นนั้นอาจจะหมดก่อนครับ

ส่วนท่านใดต้องการหนังสือเล่มนี้ในรูปแบบเล่ม (hard copy) สามารถสั่งจองได้ที่หน้า “สั่งจองหนังสือ Introduction to Business Analytics with RapidMiner Studio 6 (ฉบับภาษาไทย)” ครับ

การจัดการข้อมูลจากฐานข้อมูลด้วย RapidMiner Studio 7

นอกจากการใช้ RapidMiner Studio 7 ในการวิเคราะห์ข้อมูลแล้วเรายังสามารถเอานำมาใช้จัดการข้อมูลได้แบบง่ายๆ โดยที่ไม่ต้องเขียน SQL เลยครับ สไลด์นี้แสดงการจัดการข้อมูลแบบเบื้องต้นโดยแสดงตัวอย่างการจัดการดังนี้ (คลิกที่ภาพเพื่ออ่านไฟล์ PDF ได้เลยครับ)

rapidminer_ads9

  • แสดงข้อมูลทั้งหมดของนักศึกษาจากตาราง Student
  • แสดงข้อมูลชื่อ (First) ของนักศึกษาจากตาราง Student
  • แสดงข้อมูลนามสกุล (Last) ของนักศึกษาจากตาราง Student
  • แสดงข้อมูลชื่อ (First) และ นามสกุล (Last) ของนักศึกษาจากตาราง Student
  • แสดงข้อมูลนามสกุล (Last) ของนักศึกษาที่แตกต่างกันจากตาราง Student
  • แสดงข้อมูลทั้งหมดของนักศึกษาจากตาราง Student ซึ่งมีชื่อว่า John
  • แสดงข้อมูลทั้งหมดของนักศึกษาจากตาราง Student ยกเว้นนักศึกษาที่ชื่อ John
  • แสดงข้อมูลทั้งหมดของนักศึกษาจากตาราง Grade ที่มีคะแนนมากกว่าหรือเท่ากับ 60 คะแนน
  • แสดงเฉพาะข้อมูลชื่อ (First) นามสกุล (Last) และคะแนน (Mark) จากตาราง Grade ที่มีคะแนนน้อยกว่าหรือเท่ากับ 60 คะแนน
  • แสดงเฉพาะข้อมูลชื่อ (First) นามสกุล (Last) คะแนน (Mark) และชื่อวิชา (Title) จากตาราง Grade ที่มีคะแนนระหว่าง 40-60 คะแนน
  • แสดงข้อมูลคะแนน (Mark) จากตาราง Grade โดยเรียงลำดับคะแนนจากน้อยไปมาก
  • แสดงข้อมูลคะแนน (Mark) จากตาราง Grade โดยเรียงลำดับจากมากไปน้อย
  • แสดงข้อมูลชื่อ (First) นามสกุล (Last) และคะแนน (Mark) ของนักศึกษาที่มีสนามสกุลว่า Jones
  • แสดงข้อมูลชื่อ (First) นามสกุล (Last) และคะแนน (Mark) ของนักศึกษาที่ไม่มีมีสนามสกุลว่า Jones
  • นักศึกษาที่ลงทะเบียนเรียนวิชา Intro to AI มีคะแนนน้อยสุดเท่าไร
  • นักศึกษาที่ลงทะเบียนเรียนวิชา Intro to AI มีคะแนนมากสุดเท่าไร
  • แสดงข้อมูลชื่อ (First) นามสกุล (Last) และคะแนน (Mark) ของนักศึกษาที่ลงทะเบียนเรียนวิชา Programming (รวมทั้ง 1 และ 2)
  • นักศึกษาที่ลงทะเบียนเรียนวิชา Programming 2 มีคะแนนมากสุดเท่าไร

ท่านใดสนใจดูรายละเอียดได้จากไฟล์ PDF นี้ครับ

การจัดการข้อมูลด้วย RapidMiner Studio 6

[เอกสารนี้เป็นบทที่ 2 ของหนังสือ Introduction to Bussiness Analytics with RapidMiner Studio 6 ซึ่งลดราคาพิเศษครับ ซื้อพร้อมหนังสือ An Introduction to Data Mining Techniques (ฉบับภาษาไทย)​ ราคารวม 500 บาทครับ ดูรายละเอียดได้ที่นี่ครับ]

 

สไลด์การดึงข้อมูลจาก Twitter ด้วย RapidMiner Studio 7

ตอนนี้ท่านใดที่สนใจดึงข้อมูลจาก Twitter สามารถทำได้ง่ายด้วยซอฟต์แวร์ RapidMiner Studio 7 ครับ รายละเอียดการทำงานดูได้จาก slide ด้านล่างได้เลยครับ ^^

แจกฟรี E-book บน Ookbee เรื่อง Introduction to Business Analytics with RapidMiner Studio 6

Capture70

ท่านใดสนใจหนังสือ Introduction to Business Analytics with RapidMiner Studio 6 รบกวนกรอกข้อมูลในฟอร์มด้านล่างเพื่อรับ Promotion Code และวิธีการกรอกเพื่อดาวน์โหลดฟรีใน Ookbee application ได้เลยครับ


หมายเหตุ เนื่องจากโปรโมชันนี้มีจำนวนจำกัดหลังจากได้รับ Promotion Code แล้วกรุณากรอกทันทีครับ ไม่เช่นนั้นอาจจะหมดก่อนครับ

ส่วนท่านใดต้องการหนังสือเล่มนี้ในรูปแบบเล่ม (hard copy) สามารถสั่งจองได้ที่หน้า “สั่งจองหนังสือ Introduction to Business Analytics with RapidMiner Studio 6 (ฉบับภาษาไทย)” ครับ

หลักสูตรการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining โดยซอฟต์แวร์ RapidMiner Studio 7 (ขั้นพื้นฐานและปานกลาง) รุ่นที่ 19 (วันที่ 3-5 สิงหาคม 2560)

ภาพรวมของหลักสูตร

Screen Shot 2559-01-28 at 12.47.49 PM

โลกในยุคปัจจุบันได้ก้าวเข้าไปสู่ยุคที่เรียกว่า “Big Data” หรือ “ข้อมูลอภิมหาศาล” เนื่องจากในแต่ละวันมีข้อมูลเกิดขึ้นมากมาย อาทิเช่น ข้อมูลสมาชิกของ Facebook ข้อมูลการซื้อสินค้าจากในซุปเปอร์มาร์เกตต่างๆ และเพื่อให้เกิดประโยชน์มากที่สุดเราจำเป็นต้องนำข้อมูลอภิมหาศาลเหล่านี้มาทำการวิเคราะห์ (analyze) ซึ่งเทคนิคหนึ่งที่ได้รับการนิยมอย่างสูงในปัจจุบัน คือ เทคนิค Data Mining ซึ่งเป็นเทคนิคที่ค้นหาความสัมพันธ์ในข้อมูล เช่น ถ้าลูกค้าซื้อเบียร์แล้วลูกค้าจะซื้อผ้าอ้อมร่วมไปด้วย หรือถ้าเรากด Like หน้า Facebook page เราจะเห็นว่า Facebook มีระบบแนะนำ page อื่นๆ ที่เกี่ยวข้องมาให้ด้วย หรือ การสร้างโมเดลเพื่อทำนายสิ่งที่จะเกิดขึ้นในอนาคต เช่น ทำนายยอดขายในไตรมาสถัดไป หรือ การทำนายว่าพนักงานคนไหนที่จะลาออกจากบริษัทในช่วง 3 เดือนข้างหน้า ตัวอย่างเหล่านี้ล้วนเป็นผลมาจากการวิเคราะห์ข้อมูลทางด้าน Data Mining

การวิเคราะห์ข้อมูลด้วย Data Mining นี้กำลังเป็นที่นิยมไปทั่วโลกด้วยแรงขับเคลื่อนอย่างหนึ่งคือ การมีซอฟต์แวร์ที่ช่วยให้ทำการวิเคราะห์ได้ง่ายขึ้น แต่ซอฟต์แวร์ส่วนใหญ่จะเป็นซอฟต์แวร์เชิงพาณิชย์ (commercial software) เช่น SAS Enterprise Miner หรือ IBM Intelligent Miner ทว่าการลงทุนซื้อซอฟต์แวร์เชิงธุรกิจเหล่านี้มาใช้งานอาจจะไม่คุ้มค่าในการลงทุนสำหรับผู้ประกอบการวิสาหกิจขนาดกลางและขนาดย่อม (SMEs) หรืออาจารย์ นักวิจัย และ นักศึกษาระดับปริญญาโทและเอก ในมหาวิทยาลัยต่างๆ ดังนั้นวิธีการหนึ่งที่จะทำให้เราสามารถวิเคราะห์ข้อมูลเหล่านี้ได้คือการใช้ open source software ที่สามารถดาวน์โหลดมาใช้งานได้โดยไม่เสียค่าใช้จ่าย (ฟรี !!!) เช่น ซอฟต์แวร์ Weka ผมคลุกคลีกับ Weka มาเป็นเวลาหลายปี เคยเขียนคู่มือการใช้งาน Weka Explorer ลงในนิตยสาร OpenSource2Day สร้างหลักสูตรการอบรมการใช้งาน Weka Explorer และอบรมการใช้งานซอฟต์แวร์ตัวนี้มาเป็นจำนวนเกือบยี่สิบรุ่น แม้ว่าซอฟต์แวร์นี้จะใช้งานได้ง่ายสำหรับผู้เริ่มต้นและสะดวกที่จะนำไปใช้ในการพัฒนา Web Application แต่ในหลายๆ ครั้งผมมักจะพบข้อจำกัดหรือความยากในการแสดงผลจากซอฟต์แวร์ตัวนี้ ดังนั้นผมจึงหันมาสนใจซอฟต์แวร์ตัวอื่นที่สามารถทดแทนหรือดีกว่าซอฟต์แวร์ Weka Explorer และผมก็พบกับซอฟต์แวร์ RapidMiner Studio 6 ซึ่งเป็นซอฟต์แวร์ทาง Data Mining ที่ได้รับการโหวตว่ามีผู้ใช้งานมากที่สุดจากเว็บไซต์ KDnuggets.com เมื่อปี 2013 ในหลักสูตรนี้ผมจะแนะนำให้คุณรู้จักการวิเคราะห์ข้อมูลด้วยเทคนิค Data Mining ตั้งแต่ระดับต้นจน (basic) จนถึงระดับกลาง (intermediate) ด้วยการใช้ซอฟต์แวร์ RapidMiner Studio 7 ซึ่งเป็นเวอร์ชันล่าสุด ถ้าคุณยังลังเลว่าคุณควรจะมาเข้าร่วมอบรมหลักสูตรนี้กับผมหรือไม่ ผมขอถาม 8 คำถามสั้นๆ ดังนี้ครับ

  • สนใจการวิเคราะห์ข้อมูลด้วย Data Mining แต่ไม่รู้จะเริ่มยังไงดี
  • อยากรู้ว่าลูกค้าซื้อสินค้าอะไรเป็นส่วนใหญ่
  • อยากเข้าใจพฤติกรรมการบริโภทของลูกค้า
  • อยากหยั่งรู้อนาคต (บางส่วน)
  • อยากทำงานวิจัยทางด้าน text mining
  • อยากทำงานวิจัยทางด้าน image processing
  • ไม่ชอบการเขียนโปรแกรมแต่อยากวิเคราะห์ข้อมูลที่ซับซ้อนได้
  • เคยเข้าร่วมการอบรมการใช้งาน Weka Explorer มาแล้วและอยาก update ความรู้ทาง Data Mining ใหม่ๆ ด้วยซอฟต์แวร์ใหม่ๆ

ถ้าคุณตอบว่า “ใช่” ในคำถามข้อใดข้อหนึ่ง ผมขอแนะนำว่าคุณควรจะมาเข้าร่วมอบรมกับผมครับ และคุณจะรู้ว่าทำไมผมถึงเปลี่ยนใจจาก Weka Explorer มาตกหลุมรักซอฟต์แวร์ที่ชื่อว่า RapidMiner Studio 7 ครับ ^^

อ่านรายละเอียดหลักสูตรได้ที่ http://dataminingtrend.com/2014/training/rapidminer-training-19/

หนังสือ Introduction to Business Analytics with RapidMiner Studio 6 (ภาษาไทย)

สารบัญ

  • บทที่ 1 แนะนำส่วนต่างๆ ของ RapidMiner Studio 6
    • การติดตั้งซอฟต์แวร์
    • ส่วนประกอบต่างๆ ของ RapidMiner Studio 6
  • บทที่ 2 การเตรียมข้อมูล (preprocess)
    • แนะนำข้อมูล Sales data
    • การสร้าง Repository ใหม่
    • การ import ข้อมูลเข้ามาใช้งาน
    • การดูข้อมูลในรูปแบบต่างๆ (data exploration)
    • โอเปอเรเตอร์ที่ใช้งานในบทที่ 2
    • การคัดเลือกข้อมูล
    • การคำนวณราคา
    • แนะนำการแบ่งกลุ่มด้วยวิธี RFM (Recency, Frequency, Monetary)
    • การเตรียมข้อมูลสำหรับการแบ่งกลุ่มด้วยวิธี RFM
    • แบบฝึกท้ายบท
  • บทที่ 3 การแบ่งกลุ่มข้อมูล (segmentation)
    • การแบ่งกลุ่มลูกค้าตามพฤติกรรมการบริโภคด้วยวิธี RFM
    • โอเปอเรเตอร์ที่ใช้งานในบทที่ 3
    • การแบ่งกลุ่มข้อมูลด้วยวิธี RFM ใน RapidMiner Studio 6
    • แบบฝึกท้ายบท
  • บทที่ 4 การหาความสัมพันธ์ของข้อมูล (Product Association)
    • แนะนำการหากฏความสัมพันธ์ (Association Rules)
    • โอเปอเรเตอร์ที่ใช้งานในบทที่ 4
    • การเตรียมข้อมูลก่อนหาความสัมพันธ์
    • การหารูปแบบของสินค้าที่เกิดขึ้นบ่อย (frequent itemset)
    • การหากฏความสัมพันธ์
    • แบบฝึกท้ายบท
  • ภาคผนวก A การสร้างข้อมูล
  • ภาคผนวก B โอเปอเรเตอร์ที่ใช้งานทั้งหมด

ท่านใดสนใจหนังสือการวิเคราะห์ข้อมูลในเชิงธุรกิจ (business analytics) ราคาเล่มละ 269 บาทเท่านั้นครับ

ถ้าต้องการเป็นแบบจัดพิมพ์สามารถสั่งชื้อได้โดยการโอนเงินมายัง 1 ในบัญชีเหล่านี้ และส่งหลักฐานพร้อมที่อยู่สำหรับการจัดส่งมาที่ sit.ake@gmail.com หรือกรอกแบบฟอร์มด้านล่างครับ

  • นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารทหารไทย สาขาฟิวเจอร์พาร์ค รังสิต หมายเลขบัญชี 215-2-30624-3
  • นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารกสิกรไทย สาขาฟิวเจอร์พาร์ค รังสิต หมายเลขบัญชี 003-1-96614-0
  • นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารกรุงเทพ สาขาบิ๊กซี นวนคร หมายเลขบัญชี 947-006194-7
  • หสม. ดาต้า คิวบ์ กระทำการแทนโดย นายเอกสิทธิ์ พัชรวงศ์ศักดา ธนาคารไทยพาณิชย์ สาขาเดอะวอล์ค ราชพฤกษ์ หมายเลขบัญชี 404-524725-5

สอบถามรายละเอียดเพิ่มเติมได้ที่ sit.ake@gmail.com หรือ lineID: eakasitp หรือสั่งจองได้จากฟอร์มด้านล่างครับ ^^

การใช้งาน Workflow จาก myExperiment

ข้อดีอย่างหนึ่งของ RapidMiner Studio คือการสร้าง process ในการทำงานที่ยืดหยุ่นและแก้ไขได้ในภายหลัง หรือส่งไปให้กับเพื่อนร่วมงานเพื่อประหยัดเวลาในการพัฒนา หลายท่านอาจจะรู้จักกับเว็บไซต์ myExperiment ที่ได้ทำการรวบรวม process ต่างๆ ไว้รวมทั้ง process ของ RapidMiner Studio เองด้วย แต่ทว่าการดาวน์โหลดไฟล์จากเว็บไซต์มาใช้ก็ไม่สามารถเปิดได้โดยตรงครับ ต้องมีการติดตั้ง Extension ของ RapidMiner Studio ก่อนโดยมีขั้นตอนดังนี้ครับ (ในตัวอย่างนี้ใชเ

1. เปิดซอฟต์แวร์ RapidMiner Studio 6 และไปที่เมนู Help > Marketplace (Updates and Extensions…) จะปรากฏหน้าต่างดังรูปที่ 1 และในช่องค้นหาให้ใส่คำว่า myExperiment ซอฟต์แวร์จะแสดง Community Extension ขึ้นมา

Screen Shot 2558-07-21 at 1.41.39 PM

 

รูปที่ 1 แสดงหน้าต่าง RapidMiner Marketplace

2. double click ที่หัวข้อ Community Extension 6.4.0 จะเห็นว่าปุ่ม Select for installation จะถูกเลือก คลิกที่ปุ่ม Install 1 packages เพื่อเข้าสู่ขั้นตอนถัดไป

3. หน้าต่างเกี่ยวกับ Confirm Licenses จะปรากฏขึ้นมาดังในรูปที่ 2 คลิกที่เมนู I accept the terms of all license agreements และคลิกที่ปุ่ม Install 1 Packages

Screen Shot 2558-07-21 at 1.41.56 PM

รูปที่ 2 แสดงหน้าต่าง Confirm Licenses

4. หลังจากนั้นซอฟต์แวร์จะทำการดาวน์โหลด Extension เพิ่มเติมมาติดตั้งให้ดังในรูปที่ 3 ครับ

Screen Shot 2558-07-21 at 1.41.59 PM

 

รูปที่ 3 แสดงหน้าต่าง Progress

5. หลังจากติดตั้งเรียบร้อยแล้ว ซอฟต์แวร์จะให้ restart RapidMiner Studio 6 เพื่อให้ Community Extension ทำงาน ดังแสดงในรูปที่ 4

Screen Shot 2558-07-21 at 1.42.04 PM

รูปที่ 4 แสดงการติดตั้งเรียบร้อยแล้วจำเป็นจะต้อง restart RapidMiner Studio เพื่อให้ Extension ตัวใหม่ทำงาน

6. เมื่อซอฟต์แวร์ได้เปิดขึ้นมาจะมี icon ของ Community Extension แสดงอยู่ด้านบนขวาดังในรูปที่ 5

Screen Shot 2558-07-21 at 2.04.03 PM

รูปที่ 5 เปิดใช้งาน RapidMiner Studio 6 จะเห็นว่ามี icon ของ Community Extension ปรากฏอยู่ด้านขวาบน

7. หลังจากนั้นเราจะต้องเปิดหน้าต่างของ myExperiment ขึ้นมาก่อนครับ ถึงจะเลือกและค้นหา process ต่างๆ ได้ โดยการเลือกเมนู View > Show View > MyExperiment Browser หน้าต่างของ MyExperiment Browser จะแสดงขึ้นมาด้านซ้ายล่างดังรูปที่ 6

Screen Shot 2558-07-21 at 2.08.01 PM

รูปที่ 6 หน้าต่าง MyExperiment Browser จะปรากฏขึ้นมาด้านซ้ายล่าง

8. ในส่วนของ MyExperiment Browser คลิกที่ไอคอน Untitled เพื่อขยายหน้าต่างนี้ออกมาให้เต็มหน้าจอ ดังแสดงในรูปที่ 7

Screen Shot 2558-07-21 at 1.43.19 PM

รูปที่ 7 แสดงหน้าต่าง MyExperiment Browser แบบขยายเต็มหน้าจอ

9. จากรูปที่ 7 สามารถเลือก process ที่มีอยู่ใน list หรือค้นหาจากช่อง Search ได้ ในตัวอย่างนี้ผมเลือก process ที่ชื่อว่า Looping over Examples for doing de-aggregation และคลิกที่ปุ่ม Untitled2 เพื่อดาวน์โหลด process จากอินเตอร์เน็ตครับ ซึ่งจะแสดงในส่วน Process ของ RapidMiner Studio 6 ดังแสดงในรูปที่ 8 และสามารถกดปุ่ม Untitled3 เพื่อให้ process ทำงานได้ครับ

Screen Shot 2558-07-21 at 1.43.36 PM

รูปที่ 8 แสดง process ที่ดาวน์โหลดมาจากเว็บไซต์ myExperiment

หมายเหตุ ท่านใดสนใจดูรายละเอียดการใช้งานซอฟต์แวร์ RapidMiner Studio 6 ดูได้จาก คู่มือการใช้งาน RapidMiner Studio 6 ครับ

Capture31

การใช้งาน R ใน RapidMiner Studio 6.4

ก่อนหน้านี้ผมได้แสดงวิธีการติดตั้ง R เพื่อใช้งานใน RapidMiner Studio เวอร์ชันที่ต่ำกว่า 6.4 ไปแล้วตาม link นี้ครับ ซึ่งค่อนข้างซับซ้อนพอควรครับ เมื่อไม่นานมานี้ (04/05/2015) RapidMiner ได้ออกเวอร์ชันใหม่คือ 6.4 ซึ่งมี feature เพิ่มในการเพิ่ม Note ใน  Process ได้และมี extension ที่ทำให้ RapidMiner Studio 6 สามารถใช้งาน R และ Python script ได้ง่ายขึ้น ใน post นี้ผมจะแสดงวิธีการติดตั้ง R Extension และการตั้งค่าต่างๆ เพื่อให้ใช้งาน R ใน RapidMiner Studio 6.4 ได้ครับ ขั้นตอนต่างๆ มีดังนี้

1. Update RapidMiner Studio 6 ให้เป็นเวอร์ชัน 6.4 ก่อนครับ โดยการคลิกที่เมนู​ Help > Marketplace (Update and Extensions…) จะปรากฏหน้าต่างดังในรูป

Capture1

  • ในช่อง Search พิมพ์คำว่า R และกดปุ่ม Search
  • เลือก Extension ที่ชื่อว่า R Scripting 6.4.0
  • คลิกที่ปุ่ม Select for Installation
  • คลิกที่ปุ่ม Install 1 packages

2. หลังจากนั้นหน้าต่าง Confirm Licenses จะแสดงขึ้นมาในรูป

Capture2

  • คลิกที่เมนู I accept the terms of all license agreements เพื่อ accept license agreement
  • คลิกที่ปุ่ม Install 1 packages

3. ซอฟต์แวร์จะดาวน์โหลด Extension มาจากอินเตอร์เน็ตและเมื่อดาวน์โหลดเสร็จเรียบร้อยแล้วจะปรากฏหน้าต่างดังในรูปเพื่อให้ทำการ restart RapidMiner Studio 6.4 อีกครั้ง ให้ทำการคลิกที่ปุ่ม Yes

Capture3

4. RapidMiner Studio 6.4 จะ restart ขึ้นมาใหม่และจะมี icon ของ R Scripting แสดงขึ้นมาด้านขวาบนดังในรูป

Capture4

Continue reading