สรุปหัวข้อ Retail Analytics จาก Deloitte

ในปัจจุบันข้อมูลมีปริมาณเพิ่มมากขึ้นอย่างมากและรวดเร็วจนทำให้เกิดคำว่า Big Data ขึ้นมา เมื่อปี 2017 บริษัท Deloitte The Netherlands ได้นำเสนอรูปด้านล่างที่แสดงการได้ข้อมูลต่างๆ จากลูกค้า

ดูสรุปได้จากภาพด้านล่างนี้ครับ เมื่อกดที่ภาพจะได้ภาพที่ใหญ่ขึ้นครับ

บริษัทจะได้รับข้อมูลตามลำดับดังนี้

 • เมื่อลูกค้าชำระเงินที่แคชเชียร์ ร้านค้าจะได้ข้อมูลการซื้อสินค้า (Market basket) ซึ่งจะรู้ว่าลูกค้าซื้อสินค้าอะไร จำนวนสินค้า ราคาสินค้า วันและเวลาที่ซื้อสินค้า
 • เมื่อลูกค้ามีบัตรสมาชิก (Loyalty cards) สิ่งที่ร้านค้าจะได้เพิ่มเติมคือข้อมูลเชิงประชากร (Customer demographics) ของลูกค้า เช่น เพศ อายุ รายได้
 • เมื่อบริษัทได้ข้อมูล social media ของลูกค้า ร้านค้าจะได้ข้อมูลเครือข่าย (Social networks) ของลูกค้าคนนั้นมาด้วย
 • เมื่อลูกค้าใช้การแสกนราคาสินค้าจะทำให้ร้านค้าได้ข้อมูลลำดับการซื้อสินค้า (order of shopping)
 • ในกรณีที่ร้านค้ามีการติดตั้งอุปกรณ์ Beacons ต่างๆ ไว้ บริษัทจะทราบข้อมูลเส้นทางการเดินเลือกซื้อสินค้าภายในร้าน (In-store movements)
 • เมื่อลูกค้าซื้อสินค้าผ่านทางช่องทางออนไลน์จะทำให้ร้านค้าทราบพฤติกรรมทางออนไลน์ของลูกค้า (on-line behavior) เพิ่มเติม
 • ในกรณีที่ร้านค้ามีการติดตั้งกล้องวงจรปิดหรือกล้องวิดีโอไว้จะทำให้ทราบว่าความหนาแน่นของการเข้าชมร้าน (In-store traffic) ในช่วงเวลาต่างๆ ได้เพิ่มเติม
 • ในกรณีที่มีการใช้งาน Mobile Wallet จะทำร้านค้าสามารถทราบได้ว่าลูกค้ามีพฤติกรรมการซื้อสินค้าที่ร้านอื่นใดบ้าง (Cross-store behavior) ปริมาณมากน้อย ความถี่เท่าไร

จากข้อมูลเหล่านี้สามารถนำมาวิเคราะห์ข้อมูลในแง่ต่างๆ ได้ โดยรายงานนี้สรุปแนวทางการวิเคราะห์ข้อมูลในร้านค้าปลีก (retail) ไว้ดังนี้

 • Customer Segmentation เป็นการแบ่งกลุ่มลูกค้าตามความคล้ายคลึงกันในด้านต่างๆ เช่น พฤติกรรมการใช้บริการ หรือ สถานที่ตั้ง หรือ ช่วงอายุ การแบ่งกลุ่มนี้จะทำให้บริษัทเข้าใจลูกค้าได้มากขึ้น ซึ่งอาจจะพบลูกค้า กลุ่มดังนี้
  • ลูกค้ากลุ่มที่ชอบซื้อสินค้าที่ลดราคา
  • ลูกค้าที่ชอบซื้อสินค้าที่วางจำหน่ายใหม่
  • ลูกค้าที่ชอบซื้อสินค้าประเภทอาหารอย่างเดียว
 • Cross Selling/Recommendation เป็นการวิเคราะห์พฤติกรรมการซื้อสินค้าของลูกค้าและแนะนำสินค้าที่เกี่ยวข้องและคาดว่าลูกค้าจะซื้อเพิ่มไปด้วย
 • Campaign/ Promotion Effectiveness Analysis หลังจากที่ได้มีการจัดโปรโมชันหรือแคมเปญเสร็จเรียบร้อยแล้ว บริษัทควรทำการวิเคราะห์ข้อมูลผลการตอบรับโปรโมชันในช่องทาง (channel) ต่างๆ หรือสาขาต่างๆ เพื่อให้เข้าใจสาเหตุที่ทำให้ประสบผลสำเร็จ ซึ่งอาจจะมีคำถามดังนี้
  • การสื่อสารทางช่องทางใดที่ทำให้ลูกค้ารับรู้มากที่สุด หรือ ทำให้ลูกค้ากลับมาซื้อสินค้ามากที่สุด
  • สาขาใดที่ทำยอดจำหน่ายได้มากที่สุด หรือน้อยที่สุด
  • การทำโปรโมชันหรือแคมเปญนี้กำไรหรือขาดทุน
 • Customer Lifetime Value (CLV) เนื่องจากว่าลูกค้าแต่ละรายสร้างมูลค่าให้กับบริษัทต่างกัน การทำ CLV เพื่อให้ทราบว่าลูกค้าคนไหนที่เป็นลูกค้าที่ดีสำหรับบริษัท การคำนวณCLV อาจจะคำนวณจากมูลค่าที่ลูกค้าใช้บริการไป (Historical Lifetime Value) หรือ สร้างโมเดล (model) เพื่อคาดการณ์CLV ในอนาคต(Predicted Lifetime Value) ก็ได้
 • Customer Churn Prediction เป็นการสร้างโมเดลเพื่อคาดการณ์ว่าลูกค้าคนใดบ้างที่มีโอกาสไม่กลับมาซื้อสินค้าอีก(churn) หลังจากที่ทราบผลการคาดการณ์แล้วอาจจะต้องพิจารณาค่าCLV เพิ่มเติมเพื่อดูว่าควรจะดำเนินการกับลูกค้าต่างๆ อย่างไร เช่น ลูกค้าที่มีค่า CLV สูงอาจจะได้รับการดูแลเป็นพิเศษมากกว่าลูกค้าที่มีค่าCLV น้อยกว่า
 • Target Marketing/Response Modeling ในการนำเสนอโปรโมชันหรือแคมเปญต่างๆ บริษัทควรจะเลือกที่จะส่งไปยังลูกค้าที่สนใจโปรโมชันหรือแคมเปญนั้นเพื่อช่วยลดต้นทุนและไม่ทำให้ลูกค้ารำคาญ การทำเช่นนี้อาจจะทำได้โดยการพิจารณาพฤติกรรมการซื้อสินค้าที่ผ่านมา
 • Store Segmentation เป็นการจัดกลุ่มสาขาตามข้อมูลต่างๆ เช่น ประเภทของสินค้าที่ขายได้ ลักษณะของลูกค้า ทำเลที่ตั้ง เช่น ห่างจากตลาดเป็นระยะทางเท่าใด ห่างจากโรงเรียนเป็นระยะทางเท่าใด
 • Demand Forecasting เป็นการคาดการณ์ยอดจำหน่ายสินค้าแต่ละประเภทโดยการดูจากพฤติกรรมของข้อมูลในอดีต โดยการใช้ตัวแปรต่างๆ เช่น ยอดขาย สภาพแวดล้อม วันและเวลาต่างๆ 
 • Category Management เป็นการจัดการประเภทของสินค้าให้เหมาะสม ถ้ามีสินค้าที่ไม่หลากหลายอาจจะทำให้ไม่ตอบสนองความต้องการของลูกค้า แต่ถ้ามีสินค้าหลากหลายมากเกินไปอาจจะทำให้เกิดปัญหาการแข่งกันเองของสินค้า (cannibalization)
 • Channel Profitability การขายสินค้านั้นมีการจำหน่ายได้หลายช่องทางและแต่ละช่องทางก็สร้างรายได้ที่ต่างกันไป การวิเคราะห์ลักษณะนี้เป็นการสรุปว่าช่องทางใดบ้างที่สร้างรายได้ให้และรายได้มากน้อยเพียงใด
 • Product – Channel Affinity สินค้าบางประเภทจำหน่ายได้ดีในบางช่องทาง การวิเคราะห์ในลักษณะนี้เพื่อทำการหาความสัมพันธ์ระหว่างช่องทางการจัดจำหน่ายและสินค้า เพื่อหาว่าสินค้าใดควรจะจำหน่ายในช่องทางใด
 • Product – Store Affinity มีลักษณะคล้ายกันกับ Product – Channel Affinityแต่เปลี่ยนเป็นการหาความสัมพันธ์ระหว่างสาขาที่จำหน่ายและสินค้า เพื่อหาว่าสินค้าใดควรจะจำหน่ายในสาขาใดบ้าง
 • Vendor Performance Analysis เป็นการวิเคราะห์ผู้ขาย(Vendor) ในมุมมองต่างๆ และอาจจะนำไปกำหนดเกรดให้กับผู้ขายต่างๆ ได้ การวิเคราะห์ลักษณะนี้ใช้ข้อมูลหลายประเภท เช่น 
  • ค่าใช้จ่าย (cost)
  • ระยะเวลาการจัดส่ง (delivery time)
  • จำนวนสินค้าและความหลากหลายของสินค้าที่ส่ง
  • เครดิตการชำระเงิน

การใช้ Auto Model ใน RapidMiner Studio 8.1

วันนี้ (07/02/2018) เมื่อช่วงเย็น RapidMiner ได้ปล่อยซอฟต์แวร์ RapidMiner Studo 8.1 ซึ่งเป็นเวอร์ชันล่าสุดออกมาครับ ส่วนที่ดีมากๆ เลยสำหรับเวอร์ชันนี้คือ Auto Model ที่ทำให้เราสามารถรันโมเดล classification หลายๆ แบบและเปรียบเทียบประสิทธิภาพ (performance) กันได้ครับ ลักษณะแบบนี้คล้ายๆ กับซอฟต์แวร์ Data Robot (ซึ่งมีราคาค่อนข้างสูงมาก) ในบทความนี้ผมจะแสดงวิธีการใช้งาน Auto Model เพื่อสร้างโมเดลที่เหมาะสมสำหรับเรื่อง Churn Prediction หรือการคาดการณ์ว่าลูกค้าคนใดบ้างจะเลิกใช้บริการของเราบ้าง โดยข้อมูลมาจากหลักสูตร RapidMiner & DataScience: Foundations & Advance

เริ่มต้นเรามาดูข้อมูลของเราก่อนดีกว่าครับว่าคืออะไรและมีแอตทริบิวต์หรือตัวแปรอะไรบ้าง

Screen Shot 2561-02-08 at 1.23.12 AM

Screen Shot 2561-02-08 at 1.23.39 AM

ข้อมูลที่ใช้เป็นตัวอย่างเป็นการเก็บข้อมูลการใช้งาน app บนมือถือว่าผู้ใช้แต่ละคนใช้งานอยู่หรือไม่ และเวลาซื้อสินค้าใน app ใช้จ่ายด้วยวิธีการแบบไหน จากทั้ง 2 รูปด้านบนมีแอตทริบิวต์ดังนี้ครับ

 • CustomerId รหัสของลูกค้าแต่ละราย แอตทริบิวต์นี้กำหนด role ให้เป็น ID เพื่อไม่ให้นำไปสร้างโมเดลด้วย
 • Churn แอตทริบิวต์ที่บอกว่าลูกค้ายกเลิกการใข้บริการ (churn) หรือยังใช้บริการอยู่ (loyal) แอตทริบิวต์นี้กำหนด role ให้เป็น label ซึ่งเป็นคำตอบที่เราต้องการ predict
 • Firstname ชื่อของลูกค้าแต่ละราย
 • Gender เพศของลูกค้าแต่ละราย
 • sum(TransactionValue) ค่าใช้จ่ายรวมของลูกค้าแต่ละราย
 • average(TransactionValue) ค่าใช้จ่ายเฉลี่ยของลูกค้าแต่ละราย
 • PreferedPaymentMethod วิธีการชำระเงินที่ลูกค้าใช้บ่อยที่สุด
 • LastTransaction วันที่ใช้งานล่าสุดของลูกค้าแต่ละราย
 • TotalCount จำนวนครั้ง (transaction) ที่ใช้งานของลูกค้าแต่ละราย
 • Payments with cash จำนวน % ที่ลูกค้าชำระเงินด้วยเงินสด
 • Payments with cheque จำนวน % ที่ลูกค้าชำระเงินด้วยเช็ค
 • Payments with credit card จำนวน % ที่ลูกค้าชำระเงินด้วยบัตรเครดิต
 • Age อายุของลูกค้าแต่ละราย
 • PostalCode รหัสไปรษณีย์ของลูกค้าแต่ละราย

Continue reading

10 เรื่องที่มีจำนวนผู้ชม (Reach), Like และ Share มากที่สุดในปี 2015 จาก Facebook ของดาต้า คิวบ์

ช่วงนี้ก็ใกล้จะปีใหม่ 2016 แล้วครับ เห็นหลายๆ เว็บได้ทำการสรุปเรื่องต่างๆ ในปี 2015 ทางดาต้า คิวบ์เลยขอสรุป post ของเราที่เกี่ยวข้องกับ Data Mining, Big Data และ Data Science ซึ่งมีผู้กด Like และ Share มากที่สุด 10 อันดับ ดังนี้ครับ (กดดูรายละเอียดที่รูปภาพได้เลยครับ)

 1. ท่านใดที่สนใจงานวิจัยภายของจุฬาลงกรณ์มหาวิทยาลัย (CU) สามารถค้นหาและดาวน์โหลดไฟล์แบบเต็ม (full text) ได้แล้วครับ รายละเอียดดูได้จาก link ด้านล่างได้เลยครับ ^^
  ขอขอบคุณคุณ Kieng Kub ที่แชร์มาครับ
  Screen Shot 2558-12-31 at 2.54.45 AM
 2. ท่านใดเขียน paper หรือเขียนเล่มวิทยานิพนธ์แล้วไม่ได้ใช้ Latex ของดู Endnote เพื่อจัดการ reference ก็ดีนะครับ ^^

  credit: ขอขอบคุณอ. Suthanya Doung In ที่แนะนำครับ
  Screen Shot 2558-12-31 at 3.02.34 AM
 3. ท่านใดที่ใช้ SPSS อยู่ลองดูซอฟต์แวร์ opensource ที่ช่วยวิเคราะห์ข้อมูลทางสถิติได้คล้ายๆ กันครับ ซอฟต์แวร์นี้ชื่อ PSPP (อักษรสลับกับ SPSS) ท่านใดสนใจดูรายละเอียดได้จาก link ด้านล่างเลยครับ ^^
  Screen Shot 2558-12-31 at 3.03.55 AM
 4. สไลด์การบรรยายเรื่อง Introduction to Data Mining & Big Data Analytics แบบง่ายๆ ครับ ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ ^^
  Screen Shot 2558-12-31 at 3.05.40 AM
 5. กระบวนการหนึ่งที่นิยมในการวิเคราะห์ข้อมูลด้วย Data Mining คือ CRISP-DM บทความนี้อธิบาย 6 ขั้นตอนของ CRISP-DM และการประยุกต์ใช้งานในด้านการศึกษา ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ ^^
  ‪#‎ILikeDataMining‬
  Screen Shot 2558-12-31 at 3.06.47 AM
 6. สวัสดีเราคือโอเปอเรเตอร์ K-Means มาดูว่าเราทำงานยังไงบ้างนะครับ ^^
  Screen Shot 2558-12-31 at 3.08.13 AM
 7. นอกจาก R, Python, RapidMiner แล้วยังมี Weka ด้วยนะครับ ดาต้า คิวบ์แจกหนังสือการใช้งาน Weka ฟรี (แบบ PDF) ท่านใดสนใจดูรายละเอียดได้จาก link ด้านล่างได้เลยครับ ^^
  Screen Shot 2558-12-31 at 3.10.36 AM
 8. ลองมาดูวิธีการสร้าง Decision Tree ด้วย Information Gain กันอีกครั้งนะครับ ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ ^^

  Note: เนื่องในโอกาสวันพ่อแห่งชาติ 5 ธันวาคม 2558 ดาค้า คิวบ์ขอมอบ E-book เรื่อง An Introduction to Data Mining Techniques (ฉบับภาษาไทย) (จำนวน 300 เล่ม) ซึ่งสามารถเปิดอ่านได้ใน Ookbee ท่านใดสนใจดูรายละเอียดการขอ Promotion Code ได้จาก http://dataminingtrend.com/2014/free-data-mining-ebook/ ครับ
  Screen Shot 2558-12-31 at 3.12.46 AM
 9. [repost]
  เอกสารการใช้งาน R ฉบับภาษาไทยของ รองศาสตราจารย์ ดร.วิโรจน์ อรุณมานะกุล ท่านใดสนใจอ่านได้จาก link ได้เลยครับ ^^

  Note: เพราะเราเชื่อว่าการเรียนรู้เริ่มต้นจากการอ่านและการแบ่งปันครับ
  Screen Shot 2558-12-31 at 3.14.23 AM
 10. ดาวน์โหลดฟรีหนังสือเรื่อง Understanding Machine Learning: From Theory to Algorithms ท่านใดสนใจดาวน์โหลดได้จาก http://www.cs.huji.ac.il/~shais/UnderstandingMachineLearning/copy.html ได้เลยครับ
  Screen Shot 2558-12-31 at 3.15.18 AM

นอกจากทั้ง 10 อันดับที่ได้สรุปมาแล้ว Page ดาต้า คิวบ์ยังมีเนื้อหาดีๆ ที่เกี่ยวข้องกับ Data Mining, Big Data และ Data Science อีกมากครับ ท่านใดสนใจดูรายละเอียดเพิ่มได้ที่ https://www.facebook.com/datacube.th นะครับ 🙂

ภาพบรรยากาศการอบรมเชิงปฏิบัติการพัฒนา WEB APPLICATION ด้วย WEKA และ PHP รุ่นที่ 2

ภาพบรรยากาศการอบรม Web Application Development using Weka and PHP รุ่นที่ 2 ซึ่งยังคงได้รับการตอบรับที่ดีเหมือนเช่นเคย ทีมงาน data cube ขอขอบคุณผู้เข้าร่วมอบรมทุกท่านที่ให้ความไว้วางใจและมาอบรมกับทางเราครับ ทางเราจะปรับปรุงมาตรฐานให้ดีขึ้นไปอีกครับ ^^

IMG_7316 IMG_7195 IMG_7194  IMG_7217 IMG_7211

ดูภาพบรรยากาศทั้งหมดได้ที่นี่

ทุนศึกษาต่อระดับปริญาเอกแบบ Dual Degree

วันนี้ขอแนะนำทุนศึกษาต่อระดับปริญญาเอกแบบ Dual Degree ครับเรียนจบจะได้ปริญญาเอก 2 ใบครับโดยได้รับจาก

 • สถาบันเทคโนโลยีนานาชาติสิรินธร (SIIT) มหาวิทยาลัยธรรมศาสตร์
 • สถาบัน Japan Advanced Institute of Science and Technology (JAIST) ประเทศญี่ปุ่น

หลักสูตรนี้เป็นหลักสูตร 4 ปีครับ นักศึกษาจะได้มีโอกาสเดินทางไปศึกษาที่ประเทศญี่ปุ่นเป็นเวลา 2 ปี โดยมีรายละเอียดดังนี้

 • ปีที่ 1 และ 3 เรียนที่ประเทศไทย
 • ปีที่ 2 และ 4 เรียนที่ประเทศญี่ปุ่น

ทุนนี้เปิดรับสมัครทุกปี ปีนี้เปิดรับสมัครตั้งแต่วันนี้ถึงวันที่ 16 พฤษภาคม 2557 รายละเอียดเพิ่มเติมดูได้จาก http://www2.siit.tu.ac.th/ictprojects/siitjaist/