ซอฟต์แวร์ในการทำ Data Mining

ในปัจจุบันการวิเคราะห์ข้อมูลด้วย data mining ไม่ได้อยากเหมือนแต่ก่อนแล้วครับ เพราะมีซอฟต์แวร์ฟรีหลายๆ ตัวที่ดาวน์โหลดมาใช้งานได้ทันที วันนี้ขอแนะนำ 3 โปรแกรมครับ คือ

images-71. Weka 

  • เป็นซอฟต์แวร์ที่นิยมใช้มากที่สุดในการทำ data mining 
  • ใช้งานง่ายเหมาะสำหรับผู้เริ่มต้นที่สนใจการวิเคราะห์ข้อมูล
  • ดาวน์โหลดซอฟต์แวร์ได้จาก http://www.cs.waikato.ac.nz/ml/weka/downloading.html

 

1461827_665498610168724_1864900532_a2. RapidMiner 

  • รองรับทำงานการวิเคราะห์ข้อมูลที่ซ้ำซ้อนได้ดี
  • การแสดงผลทำได้หลากหลายรูปแบบ
  • ดาวน์โหลดได้จาก http://rapid-i.com/content/view/26/201/

 

image-23. R

  • ใช้การเขียนโปรแกรมเป็นหลัก ลักษณะคล้ายๆ Matlab แต่เป็นของฟรี
  • มีเทคนิคการวิเคราะห์ข้อมูลที่หลากหลายและสามารถดาวน์โหลดเพิ่มเติมได้
  • ดาวน์โหลดได้จาก http://mirrors.psu.ac.th/pub/cran/

ซอฟต์แวร์ทั้ง 3 มีลักษณะการใช้งานที่ต่างกัน สุดท้ายก็ต้องเลือกแล้วล่ะครับว่าชอบโปรแกรมไหนมากกว่ากัน

เทคนิคหลักใน Data Mining

1150948_618256828207714_1281704321_n

data mining มีการวิเคราะห์อยู่ 3 เทคนิคใหญ่ๆ คือ

1. Classification
  • สร้างโมเดลจากข้อมูลที่มีอยู่
  • เพื่อทำนายเหตุการณ์ที่จะเกิดขึ้นในอนาคต
2. Clustering
  • แบ่งข้อมูลเป็นหลายๆ กลุ่ม
  • อาศัยความคล้ายคลึงกันของข้อมูล
3. Association rules
  • อาศัยความสัมพันธ์ของข้อมูลที่เกิดร่วมกัน
  • สร้างเป็นกฎความสัมพันธ์ เช่น “ซื้อเบียร์แล้วจะซื้อผ้าอ้อมไปด้วย”
934675_618255601541170_1885389966_n

Data Mining คือ อะไร ?

วันนี้ผมขอแนะนำให้รู้จักกับ Data Mining ครับหรือภาษาไทยเราจะเรียกว่าการทำเหมืองข้อมูล เรามาดูความหมายจากหนังสือยอดนิยม 2 เล่มนี้กันครับ

51TkI+ejUqL-2Data Mining เป็นการวิเคราะห์ข้อมูลเพื่อหารูปแบบ (patterns) หรือความสัมพันธ์ (relation) ระหว่างข้อมูลในฐานข้อมูลขนาดใหญ่
— source: Data Mining Techniques for Marketing, Sales and CRM (3rd Edition)

 

 

fdb8a77b9a0500cad7eac5d49ebb8c98Data Mining เป็นกระบวนการดึงข่าวสารที่น่าสนใจ และมีประโยชน์แต่ไม่เคยรู้มาก่อนจากฐานข้อมูลขนาดใหญ่
— source: Data Mining Concepts & Techniques (3rd Edition)