การใช้ Auto Model ใน RapidMiner Studio 8.1

วันนี้ (07/02/2018) เมื่อช่วงเย็น RapidMiner ได้ปล่อยซอฟต์แวร์ RapidMiner Studo 8.1 ซึ่งเป็นเวอร์ชันล่าสุดออกมาครับ ส่วนที่ดีมากๆ เลยสำหรับเวอร์ชันนี้คือ Auto Model ที่ทำให้เราสามารถรันโมเดล classification หลายๆ แบบและเปรียบเทียบประสิทธิภาพ (performance) กันได้ครับ ลักษณะแบบนี้คล้ายๆ กับซอฟต์แวร์ Data Robot (ซึ่งมีราคาค่อนข้างสูงมาก) ในบทความนี้ผมจะแสดงวิธีการใช้งาน Auto Model เพื่อสร้างโมเดลที่เหมาะสมสำหรับเรื่อง Churn Prediction หรือการคาดการณ์ว่าลูกค้าคนใดบ้างจะเลิกใช้บริการของเราบ้าง โดยข้อมูลมาจากหลักสูตร RapidMiner & DataScience: Foundations & Advance

เริ่มต้นเรามาดูข้อมูลของเราก่อนดีกว่าครับว่าคืออะไรและมีแอตทริบิวต์หรือตัวแปรอะไรบ้าง

Screen Shot 2561-02-08 at 1.23.12 AM

Screen Shot 2561-02-08 at 1.23.39 AM

ข้อมูลที่ใช้เป็นตัวอย่างเป็นการเก็บข้อมูลการใช้งาน app บนมือถือว่าผู้ใช้แต่ละคนใช้งานอยู่หรือไม่ และเวลาซื้อสินค้าใน app ใช้จ่ายด้วยวิธีการแบบไหน จากทั้ง 2 รูปด้านบนมีแอตทริบิวต์ดังนี้ครับ

  • CustomerId รหัสของลูกค้าแต่ละราย แอตทริบิวต์นี้กำหนด role ให้เป็น ID เพื่อไม่ให้นำไปสร้างโมเดลด้วย
  • Churn แอตทริบิวต์ที่บอกว่าลูกค้ายกเลิกการใข้บริการ (churn) หรือยังใช้บริการอยู่ (loyal) แอตทริบิวต์นี้กำหนด role ให้เป็น label ซึ่งเป็นคำตอบที่เราต้องการ predict
  • Firstname ชื่อของลูกค้าแต่ละราย
  • Gender เพศของลูกค้าแต่ละราย
  • sum(TransactionValue) ค่าใช้จ่ายรวมของลูกค้าแต่ละราย
  • average(TransactionValue) ค่าใช้จ่ายเฉลี่ยของลูกค้าแต่ละราย
  • PreferedPaymentMethod วิธีการชำระเงินที่ลูกค้าใช้บ่อยที่สุด
  • LastTransaction วันที่ใช้งานล่าสุดของลูกค้าแต่ละราย
  • TotalCount จำนวนครั้ง (transaction) ที่ใช้งานของลูกค้าแต่ละราย
  • Payments with cash จำนวน % ที่ลูกค้าชำระเงินด้วยเงินสด
  • Payments with cheque จำนวน % ที่ลูกค้าชำระเงินด้วยเช็ค
  • Payments with credit card จำนวน % ที่ลูกค้าชำระเงินด้วยบัตรเครดิต
  • Age อายุของลูกค้าแต่ละราย
  • PostalCode รหัสไปรษณีย์ของลูกค้าแต่ละราย

Continue reading

แจกฟรีสไลด์ส่วนการจัดการข้อมูลด้วย R จากการอบรม Advanced Predictive Modeling with R & RapidMiner Studio

สไลด์เรื่องการจัดการข้อมูลด้วย R จากการอบรม Advanced Predictive Modeling with R & RapidMiner Studio โดยมีหัวข้อดังนี้

  • แนะนำ R และ RStudio
  • โครงสร้างข้อมูลพื้นฐานใน R
  • การอ่านไฟล์ข้อมูล
  • การเขียนโปรแกรมภาษา R เบื้องต้น
    • การเลือกเงื่อนไข (IF)
    • การวนรอบ (loop)
    • การเขียนฟังก์ชัน
  • การสร้างกราฟด้วย R เบื้องต้น
  • การสร้างโมเดล classification ด้วย R เบื้องต้น
  • การติดตั้ง R Extension ใน RapidMiner เพื่อให้ใช้งานร่วมกันได้

Screen Shot 2561-02-03 at 1.21.19 PM

ท่านใดสนใจดาวน์โหลดได้จาก ที่นี่เลยครับ