การสร้างโมเดล classification ด้วย Weka Explorer

บทความตอนนี้ผมจะอธิบายการสร้างโมเดล classification ด้วยซอฟต์แวร์ Weka Explorer ครับ โดยมีขั้นตอนต่างๆ ดังนี้ครับ

1. เปิดซอฟต์แวร์ Weka ขึ้นมาใช้งานจะเห็นหน้าต่างดังในรูปที่ 1 ซึ่งจะมีเมนูให้เลือก 4 อัน ในขั้นนี้เราจะเลือกที่เมนู Explorer ครับ

weka_explorer1
รูปที่ 1 เลือก Weka Explorer เพื่อเริ่มทำงาน

2. หลังจากนั้นหน้าต่าง Weka Explorer ก็จะปรากฏขึ้นมาให้เราเห็นครับ ขั้นถัดมาเราจะต้องเลือกไฟล์สำหรับใช้ในการสร้างโมเดลโดยใน blog นี้ เราจะเลือกใช้ไฟล์ที่ชื่อว่า weather.numeric.arff ซึ่งอยู่ในโฟลเดอร์ data ภายใน path ของ Weka อีกทีครับ ดังนั้นเลือกเมนู Open ครับและเลือกไฟล์ดังกล่าว

weka_explorer2

รูปที่ 2 คลิกปุ่ม Open File และเลือกไฟล์ที่ต้องการใช้ในการสร้างโมเดล

3. หลังจากเลือกไฟล์ที่จะใช้ในการสร้างโมเดลแล้ว หน้าจอของ Weka Explorer จะเปลี่ยนไปดังแสดงในรูปที่ 3 โดยจะแสดงรายชื่อของแอตทริบิวต์ต่างๆ ในไฟล์ที่โหลดเข้ามา จากในตัวอย่างนี้มี 5 แอตทริบิวต์ คือ outlook, temperature, humidity, windy และ play

weka_explorer3

รูปที่ 3 แสดงรายละเอียดของข้อมูลที่โหลดเข้ามาใช้งาน

4. คลิกที่แท็บ Classify เพื่อเปลี่ยนไปใช้งานเทคนิคการทำ classification เพื่อสร้างโมเดลไว้ใช้งาน ในตัวอย่างนี้เราจะใช้เทคนิคที่ชื่อว่า K-Nearest Neighbors (kNN) หรือใน Weka จะเรียกว่า IBk เป็นเทคนิคที่จะทำการทำนายข้อมูลใหม่โดยการดูความคล้ายคลึงกับข้อมูล training ในขั้นนี้มีขั้นตอนย่อยดังนี้

  • คลิกที่ปุ่ม Choose
  • เลือกเทคนิค IBk ที่อยู่ภายใต้หมวด classifiers > lazy ดังแสดงในรูปที่ 4

weka_explorer4

 

รูปที่ 4 เลือกใช้เทคนิค K-Nearest Neighbors (หรือ IBk)

5. ขั้นตอนนี้เราจะเริ่มสร้างโมเดลด้วยเทคนิค IBk กันแล้วครับ ให้เราเช็คสักนิดนึงก่อนว่า

  • ในส่วน Test Options เลือกอยู่ที่ Cross-validation และเป็น 10 folds (รายละเอียดของการแบ่งทดสอบโมเดลแบบ Cross-validation จะอธิบายใน blog ถัดไปครับ)
  • ส่วนที่เป็น list box ด้านล่าง Test Options เลือกเป็น (Nom) Play หมายความว่าเลือกแอตทริบิวต์ Play เพื่อเป็นคลาสคำตอบ

หลังจากนั้นก็กดปุ่ม Start ได้เลยครับ หลังจากการทำงานเสร็จสิ้นผลลัพธ์จะปรากฏขึ้น 2 ที่ คือ

  • ภายใต้ Result list จะแสดงเวลาและชื่อเทคนิคที่ใช้งานอยู่
  • ข้อมูลโมเดลและประสิทธิภาพการทำงานของโมเดลจะอยู่ภายใต้ส่วน Classifier Output

weka_explorer5

 

รูปที่ 5 ผลการสร้างโมเดลด้วยเทคนิค IBk

6. หลังจากเราสร้างโมเดล classification เสร็จเรียบร้อยแล้ว เราควรจะทำการบันทึกโมเดลเก็บไว้ ไม่เช่นนั้นโมเดลที่เราสร้างได้ก็จะหายไปเมื่อเราทำการปิดโปรแกรมไป การบันทึกโมเดลทำได้โดยการคลิกขวาในส่วนของ Result list และเลือกเมนู Save Model ดังในรูปที่ 6 หลังจากนั้นเราจะต้องตั้งชื่อไฟล์โมเดลและสถานที่เก็บไฟล์โมเดลเพื่อนำไปใช้ต่อในบทความเรื่อง “การนำโมเดล classification มาใช้งานใน Weka Explorer

weka_explorer6

 รูปที่ 6 บันทึกโมเดลที่สร้างได้เพื่อเก็บไว้ใช้งานในครั้งต่อไป

ผู้สนใจการใช้งาน Weka Explorer สามารถลงทะเบียนอบรมได้ที่นี่

Posted in data mining, machine learning, weka and tagged , , , .

Leave a Reply

Your email address will not be published. Required fields are marked *