การใช้ Auto Model ใน RapidMiner Studio 8.1

วันนี้ (07/02/2018) เมื่อช่วงเย็น RapidMiner ได้ปล่อยซอฟต์แวร์ RapidMiner Studo 8.1 ซึ่งเป็นเวอร์ชันล่าสุดออกมาครับ ส่วนที่ดีมากๆ เลยสำหรับเวอร์ชันนี้คือ Auto Model ที่ทำให้เราสามารถรันโมเดล classification หลายๆ แบบและเปรียบเทียบประสิทธิภาพ (performance) กันได้ครับ ลักษณะแบบนี้คล้ายๆ กับซอฟต์แวร์ Data Robot (ซึ่งมีราคาค่อนข้างสูงมาก) ในบทความนี้ผมจะแสดงวิธีการใช้งาน Auto Model เพื่อสร้างโมเดลที่เหมาะสมสำหรับเรื่อง Churn Prediction หรือการคาดการณ์ว่าลูกค้าคนใดบ้างจะเลิกใช้บริการของเราบ้าง โดยข้อมูลมาจากหลักสูตร RapidMiner & DataScience: Foundations & Advance

เริ่มต้นเรามาดูข้อมูลของเราก่อนดีกว่าครับว่าคืออะไรและมีแอตทริบิวต์หรือตัวแปรอะไรบ้าง

Screen Shot 2561-02-08 at 1.23.12 AM

Screen Shot 2561-02-08 at 1.23.39 AM

ข้อมูลที่ใช้เป็นตัวอย่างเป็นการเก็บข้อมูลการใช้งาน app บนมือถือว่าผู้ใช้แต่ละคนใช้งานอยู่หรือไม่ และเวลาซื้อสินค้าใน app ใช้จ่ายด้วยวิธีการแบบไหน จากทั้ง 2 รูปด้านบนมีแอตทริบิวต์ดังนี้ครับ

  • CustomerId รหัสของลูกค้าแต่ละราย แอตทริบิวต์นี้กำหนด role ให้เป็น ID เพื่อไม่ให้นำไปสร้างโมเดลด้วย
  • Churn แอตทริบิวต์ที่บอกว่าลูกค้ายกเลิกการใข้บริการ (churn) หรือยังใช้บริการอยู่ (loyal) แอตทริบิวต์นี้กำหนด role ให้เป็น label ซึ่งเป็นคำตอบที่เราต้องการ predict
  • Firstname ชื่อของลูกค้าแต่ละราย
  • Gender เพศของลูกค้าแต่ละราย
  • sum(TransactionValue) ค่าใช้จ่ายรวมของลูกค้าแต่ละราย
  • average(TransactionValue) ค่าใช้จ่ายเฉลี่ยของลูกค้าแต่ละราย
  • PreferedPaymentMethod วิธีการชำระเงินที่ลูกค้าใช้บ่อยที่สุด
  • LastTransaction วันที่ใช้งานล่าสุดของลูกค้าแต่ละราย
  • TotalCount จำนวนครั้ง (transaction) ที่ใช้งานของลูกค้าแต่ละราย
  • Payments with cash จำนวน % ที่ลูกค้าชำระเงินด้วยเงินสด
  • Payments with cheque จำนวน % ที่ลูกค้าชำระเงินด้วยเช็ค
  • Payments with credit card จำนวน % ที่ลูกค้าชำระเงินด้วยบัตรเครดิต
  • Age อายุของลูกค้าแต่ละราย
  • PostalCode รหัสไปรษณีย์ของลูกค้าแต่ละราย

Continue reading

10 เรื่องที่มีจำนวนผู้ชม (Reach), Like และ Share มากที่สุดในปี 2015 จาก Facebook ของดาต้า คิวบ์

ช่วงนี้ก็ใกล้จะปีใหม่ 2016 แล้วครับ เห็นหลายๆ เว็บได้ทำการสรุปเรื่องต่างๆ ในปี 2015 ทางดาต้า คิวบ์เลยขอสรุป post ของเราที่เกี่ยวข้องกับ Data Mining, Big Data และ Data Science ซึ่งมีผู้กด Like และ Share มากที่สุด 10 อันดับ ดังนี้ครับ (กดดูรายละเอียดที่รูปภาพได้เลยครับ)

  1. ท่านใดที่สนใจงานวิจัยภายของจุฬาลงกรณ์มหาวิทยาลัย (CU) สามารถค้นหาและดาวน์โหลดไฟล์แบบเต็ม (full text) ได้แล้วครับ รายละเอียดดูได้จาก link ด้านล่างได้เลยครับ ^^
    ขอขอบคุณคุณ Kieng Kub ที่แชร์มาครับ
    Screen Shot 2558-12-31 at 2.54.45 AM
  2. ท่านใดเขียน paper หรือเขียนเล่มวิทยานิพนธ์แล้วไม่ได้ใช้ Latex ของดู Endnote เพื่อจัดการ reference ก็ดีนะครับ ^^

    credit: ขอขอบคุณอ. Suthanya Doung In ที่แนะนำครับ
    Screen Shot 2558-12-31 at 3.02.34 AM
  3. ท่านใดที่ใช้ SPSS อยู่ลองดูซอฟต์แวร์ opensource ที่ช่วยวิเคราะห์ข้อมูลทางสถิติได้คล้ายๆ กันครับ ซอฟต์แวร์นี้ชื่อ PSPP (อักษรสลับกับ SPSS) ท่านใดสนใจดูรายละเอียดได้จาก link ด้านล่างเลยครับ ^^
    Screen Shot 2558-12-31 at 3.03.55 AM
  4. สไลด์การบรรยายเรื่อง Introduction to Data Mining & Big Data Analytics แบบง่ายๆ ครับ ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ ^^
    Screen Shot 2558-12-31 at 3.05.40 AM
  5. กระบวนการหนึ่งที่นิยมในการวิเคราะห์ข้อมูลด้วย Data Mining คือ CRISP-DM บทความนี้อธิบาย 6 ขั้นตอนของ CRISP-DM และการประยุกต์ใช้งานในด้านการศึกษา ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ ^^
    ‪#‎ILikeDataMining‬
    Screen Shot 2558-12-31 at 3.06.47 AM
  6. สวัสดีเราคือโอเปอเรเตอร์ K-Means มาดูว่าเราทำงานยังไงบ้างนะครับ ^^
    Screen Shot 2558-12-31 at 3.08.13 AM
  7. นอกจาก R, Python, RapidMiner แล้วยังมี Weka ด้วยนะครับ ดาต้า คิวบ์แจกหนังสือการใช้งาน Weka ฟรี (แบบ PDF) ท่านใดสนใจดูรายละเอียดได้จาก link ด้านล่างได้เลยครับ ^^
    Screen Shot 2558-12-31 at 3.10.36 AM
  8. ลองมาดูวิธีการสร้าง Decision Tree ด้วย Information Gain กันอีกครั้งนะครับ ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ ^^

    Note: เนื่องในโอกาสวันพ่อแห่งชาติ 5 ธันวาคม 2558 ดาค้า คิวบ์ขอมอบ E-book เรื่อง An Introduction to Data Mining Techniques (ฉบับภาษาไทย) (จำนวน 300 เล่ม) ซึ่งสามารถเปิดอ่านได้ใน Ookbee ท่านใดสนใจดูรายละเอียดการขอ Promotion Code ได้จาก http://dataminingtrend.com/2014/free-data-mining-ebook/ ครับ
    Screen Shot 2558-12-31 at 3.12.46 AM
  9. [repost]
    เอกสารการใช้งาน R ฉบับภาษาไทยของ รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล ท่านใดสนใจอ่านได้จาก link ได้เลยครับ ^^

    Note: เพราะเราเชื่อว่าการเรียนรู้เริ่มต้นจากการอ่านและการแบ่งปันครับ
    Screen Shot 2558-12-31 at 3.14.23 AM
  10. ดาวน์โหลดฟรีหนังสือเรื่อง Understanding Machine Learning: From Theory to Algorithms ท่านใดสนใจดาวน์โหลดได้จาก http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/copy.html ได้เลยครับ
    Screen Shot 2558-12-31 at 3.15.18 AM

นอกจากทั้ง 10 อันดับที่ได้สรุปมาแล้ว Page ดาต้า คิวบ์ยังมีเนื้อหาดีๆ ที่เกี่ยวข้องกับ Data Mining, Big Data และ Data Science อีกมากครับ ท่านใดสนใจดูรายละเอียดเพิ่มได้ที่ https://www.facebook.com/datacube.th นะครับ 🙂

ภาพบรรยากาศการอบรมเชิงปฏิบัติการพัฒนา WEB APPLICATION ด้วย WEKA และ PHP รุ่นที่ 2

ภาพบรรยากาศการอบรม Web Application Development using Weka and PHP รุ่นที่ 2 ซึ่งยังคงได้รับการตอบรับที่ดีเหมือนเช่นเคย ทีมงาน data cube ขอขอบคุณผู้เข้าร่วมอบรมทุกท่านที่ให้ความไว้วางใจและมาอบรมกับทางเราครับ ทางเราจะปรับปรุงมาตรฐานให้ดีขึ้นไปอีกครับ ^^

IMG_7316 IMG_7195 IMG_7194  IMG_7217 IMG_7211

ดูภาพบรรยากาศทั้งหมดได้ที่นี่

ทุนศึกษาต่อระดับปริญาเอกแบบ Dual Degree

วันนี้ขอแนะนำทุนศึกษาต่อระดับปริญญาเอกแบบ Dual Degree ครับเรียนจบจะได้ปริญญาเอก 2 ใบครับโดยได้รับจาก

  • สถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) มหาวิทยาลัยธรรมศาสตร์
  • สถาบัน Japan Advanced Institute of Science and Technology (JAIST) ประเทศญี่ปุ่น

หลักสูตรนี้เป็นหลักสูตร 4 ปีครับ นักศึกษาจะได้มีโอกาสเดินทางไปศึกษาที่ประเทศญี่ปุ่นเป็นเวลา 2 ปี โดยมีรายละเอียดดังนี้

  • ปีที่ 1 และ 3 เรียนที่ประเทศไทย
  • ปีที่ 2 และ 4 เรียนที่ประเทศญี่ปุ่น

ทุนนี้เปิดรับสมัครทุกปี ปีนี้เปิดรับสมัครตั้งแต่วันนี้ถึงวันที่ 16 พฤษภาคม 2557 รายละเอียดเพิ่มเติมดูได้จาก http://www2.siit.tu.ac.th/ictprojects/siitjaist/