การทำ Text Mining ภาษาไทยด้วย RapidMiner Studio 9 และ Python

สไลด์อธิบายการทำ Text Mining ภาษาไทยด้วย RapidMiner Studio 9 และ Python ครับ ท่านใดสนใจดูได้จาก link ด้านล่างได้เลยครับ

การใช้ Auto Model ใน RapidMiner Studio 8.1

วันนี้ (07/02/2018) เมื่อช่วงเย็น RapidMiner ได้ปล่อยซอฟต์แวร์ RapidMiner Studo 8.1 ซึ่งเป็นเวอร์ชันล่าสุดออกมาครับ ส่วนที่ดีมากๆ เลยสำหรับเวอร์ชันนี้คือ Auto Model ที่ทำให้เราสามารถรันโมเดล classification หลายๆ แบบและเปรียบเทียบประสิทธิภาพ (performance) กันได้ครับ ลักษณะแบบนี้คล้ายๆ กับซอฟต์แวร์ Data Robot (ซึ่งมีราคาค่อนข้างสูงมาก) ในบทความนี้ผมจะแสดงวิธีการใช้งาน Auto Model เพื่อสร้างโมเดลที่เหมาะสมสำหรับเรื่อง Churn Prediction หรือการคาดการณ์ว่าลูกค้าคนใดบ้างจะเลิกใช้บริการของเราบ้าง โดยข้อมูลมาจากหลักสูตร RapidMiner & DataScience: Foundations & Advance

เริ่มต้นเรามาดูข้อมูลของเราก่อนดีกว่าครับว่าคืออะไรและมีแอตทริบิวต์หรือตัวแปรอะไรบ้าง

Screen Shot 2561-02-08 at 1.23.12 AM

Screen Shot 2561-02-08 at 1.23.39 AM

ข้อมูลที่ใช้เป็นตัวอย่างเป็นการเก็บข้อมูลการใช้งาน app บนมือถือว่าผู้ใช้แต่ละคนใช้งานอยู่หรือไม่ และเวลาซื้อสินค้าใน app ใช้จ่ายด้วยวิธีการแบบไหน จากทั้ง 2 รูปด้านบนมีแอตทริบิวต์ดังนี้ครับ

  • CustomerId รหัสของลูกค้าแต่ละราย แอตทริบิวต์นี้กำหนด role ให้เป็น ID เพื่อไม่ให้นำไปสร้างโมเดลด้วย
  • Churn แอตทริบิวต์ที่บอกว่าลูกค้ายกเลิกการใข้บริการ (churn) หรือยังใช้บริการอยู่ (loyal) แอตทริบิวต์นี้กำหนด role ให้เป็น label ซึ่งเป็นคำตอบที่เราต้องการ predict
  • Firstname ชื่อของลูกค้าแต่ละราย
  • Gender เพศของลูกค้าแต่ละราย
  • sum(TransactionValue) ค่าใช้จ่ายรวมของลูกค้าแต่ละราย
  • average(TransactionValue) ค่าใช้จ่ายเฉลี่ยของลูกค้าแต่ละราย
  • PreferedPaymentMethod วิธีการชำระเงินที่ลูกค้าใช้บ่อยที่สุด
  • LastTransaction วันที่ใช้งานล่าสุดของลูกค้าแต่ละราย
  • TotalCount จำนวนครั้ง (transaction) ที่ใช้งานของลูกค้าแต่ละราย
  • Payments with cash จำนวน % ที่ลูกค้าชำระเงินด้วยเงินสด
  • Payments with cheque จำนวน % ที่ลูกค้าชำระเงินด้วยเช็ค
  • Payments with credit card จำนวน % ที่ลูกค้าชำระเงินด้วยบัตรเครดิต
  • Age อายุของลูกค้าแต่ละราย
  • PostalCode รหัสไปรษณีย์ของลูกค้าแต่ละราย

Continue reading

แจกฟรีสไลด์ส่วนการจัดการข้อมูลด้วย R จากการอบรม Advanced Predictive Modeling with R & RapidMiner Studio

สไลด์เรื่องการจัดการข้อมูลด้วย R จากการอบรม Advanced Predictive Modeling with R & RapidMiner Studio โดยมีหัวข้อดังนี้

  • แนะนำ R และ RStudio
  • โครงสร้างข้อมูลพื้นฐานใน R
  • การอ่านไฟล์ข้อมูล
  • การเขียนโปรแกรมภาษา R เบื้องต้น
    • การเลือกเงื่อนไข (IF)
    • การวนรอบ (loop)
    • การเขียนฟังก์ชัน
  • การสร้างกราฟด้วย R เบื้องต้น
  • การสร้างโมเดล classification ด้วย R เบื้องต้น
  • การติดตั้ง R Extension ใน RapidMiner เพื่อให้ใช้งานร่วมกันได้

Screen Shot 2561-02-03 at 1.21.19 PM

ท่านใดสนใจดาวน์โหลดได้จาก ที่นี่เลยครับ

แจกหนังสือ Introduction to Business Analytics with RapidMiner ฟรีแบบ PDF

เนื่องในวันแม่แห่งชาติปี 2560 ดาต้า คิวบ์ขอแจกหนังสือ Introduction to Business Analytics with RapidMiner ฟรีแบบ PDF

Screen Shot 2560-08-11 at 10.29.14 PM

ท่านใดสนใจรบกวนทำตามขั้นตอนนี้ครับ

  1. เพิ่มดาต้า คิวบ์เป็นเพื่อนใน LINE โดยค้นหาคำว่า @gza3072w
  2. หลังจากนั้นในช่อง chat ให้พิมพ์คำว่า free ebook แล้วท่านจะได้รับ link สำหรับดาวน์โหลดไฟล์หนังสือแบบ PDF ครับunnamed-2

สไลด์บางส่วนจากการอบรม Practical Data Mining with RapidMiner Studio 7

ตัวอย่างสไลด์การอบรม Practical Data Mining with RapidMiner Studio 7 รุ่นที่ 17 ครับ ท่านใดสนใจดูรายละเอียดการอบรมรุ่นถัดไปได้ที่ http://dataminingtrend.com/2014/training/rapidminer-training-18/

แจกฟรี E-book บน Ookbee เรื่อง An Introduction to Data Mining Techniques (ฉบับภาษาไทย)

IMG_25600413_103410

เนื่องในวันแม่แห่งชาติปี 2018 ดาค้า คิวบ์ขอมอง E-book เรื่อง An Introduction to Data Mining Techniques (ฉบับภาษาไทย) ซึ่งสามารถเปิดอ่านได้ใน App Ookbee

สารบัญ

  • บทที่ 1 การวิเคราะห์ข้อมูลด้วยเทคนิค ดาต้า ไมน์นิง (Data Mining)
    • 1.1 แนะนำการวิเคราะห์ข้อมูลด้วยเทคนิคดาต้า ไมน์นิง (Data Mining)
      • ความหมายของดาต้า ไมน์นิง
      • การประยุกต์ใช้งานดาต้า ไมน์นิง
    • 1.2 ข้อมูลในรูปแบบต่างๆ
      • ข้อมูลแบบมีโครงสร้าง (structured data)
      • ข้อมูลแบบไม่มีโครงสร้าง (unstructured data)
    • 1.3 เทคนิคในการวิเคราะห์ข้อมูลด้วยดาต้า ไมน์นิง
      • เทคนิคการเรียนรู้แบบไม่มีผู้สอน (unsupervised learning)
      • เทคนิคการเรียนรู้แบบมีผู้สอน (supervised learning)
  • บทที่ 2 การหากฎความสัมพันธ์ (Association Rules)
    • กฎความสัมพันธ์และการประยุกต์ใช้งาน
    • เทคนิคในการหากฎความสัมพันธ์ด้วยวิธี Apriori
  • บทที่ 3 การแบ่งกลุ่มข้อมูล (Clustering)
    • การแบ่งกลุ่มข้อมูลและการประยุกต์ใช้งาน
    • การหาระยะห่างระหว่างข้อมูล (distance function)
    • เทคนิคการแบ่งกลุ่มข้อมูลด้วยวิธี K-Means
    • เทคนิคการแบ่งกลุ่มข้อมูลด้วยวิธี Agglomerative Clustering
  • บทที่ 4 การจำแนกประเภทข้อมูล (Classification)
    • การจำแนกประเภทข้อมูลและการประยุกต์ใช้งาน
    • ตัววัดประสิทธิภาพของโมเดลการจำแนกประเภทข้อมูล
    • การแบ่งข้อมูลเพื่อการวัดประสิทธิภาพของโมเดลการจำแนกประเภทข้อมูล
    • เทคนิคการจำแนกประเภทข้อมูลด้วยวิธี Decision Tree
    • เทคนิคการจำแนกประเภทข้อมูลด้วยวิธี Naive Bayes
    • เทคนิคการจำแนกประเภทข้อมูลด้วยวิธี K-Nearest Neighbors (K-NN)
    • เทคนิคการจำแนกประเภทข้อมูลด้วยวิธี Neural Network
  • บทที่ 5 กระบวนการวิเคราะห์ข้อมูลด้วยCRISP-DM
    • แนะนำกระบวนการวิเคราะห์ข้อมูล CRISP-DM
      • Business Understanding
      • Data Understanding
      • Data Preparation
      • Modeling
      • Evaluation
      • Deployment
    • ตัวอย่างการใช้งาน CRISP-DM ในการแนะนำสาขาวิชาให้กับนักศึกษา

ท่านใดสนใจรบกวนกรอกข้อมูลในฟอร์มด้านล่างได้เลยครับ


หมายเหตุ เนื่องจากโปรโมชันนี้มีจำนวนจำกัดหลังจากได้รับ Promotion Code แล้วกรุณากรอกทันทีครับ ไม่เช่นนั้นอาจจะหมดก่อนครับ

ส่วนท่านใดต้องการหนังสือเล่มนี้ในรูปแบบเล่ม (hard copy) สามารถสั่งจองได้ที่หน้า “An Introduction to Data Mining Techniques (ฉบับภาษาไทย)” ครับ

สไลด์การบรรยายในงาน Big Data Analytics Tokyo 2017

16648985_10211455645409453_2225749924461860042_n

งาน Big Data Analytics Tokyo 2017 ที่จัดขึ้นที่ประเทศญี่ปุ่นในระหว่างวันที่ 7-8 กุมภาพันธ์มีการบรรยายที่น่าสนใจหลายงานครับ สามารถดาวน์โหลดสไลด์การบรรยายบางส่วนได้ดังนี้ครับ

  • Building Innovation Ecosystems: What Can Tokyo Learn from Cambridge? โดย Tim Rowe [slides] [Synopsis]
  • A Behind-the-Scenes Peek of an Analytics Startup โดย Takafumi Kusano [slides] [Synopsis]
  • The New Vanguard for Business Connectivity, Design, and the Internet of Things โดย David Rose  [slides] [Synopsis]
  • Encoding Discourse: Novel Interfaces for Collaborative Decision-making โดย Ira Winder [slides] [Synopsis]
  • Uncovering Team Performance Dynamics with Data & Analytics in Complex Engineering Projects โดย Dai Ike [slides] [Synopsis]
  • The Dirty Little Secret of Enterprise Data โดย Andy Palmer [slides]  [Synopsis]
  • Anomaly Detection with Deep Learning: Finding the Needle in the Haystack in the Enterprise โดย Adam Gibson [slides] [Synopsis]
  • From BI to Predictive Analytics: Should You Bring an Umbrella if Rain is Predicted? โดย Ingo Mierswa  [slides] [Synopsis]
  • The Investor’s View of Emerging Data Marketspace in Japan and the U.S. โดย Jonathan Epstein [slides] [Synopsis]
  • Artificial Intelligence Sparks the Fourth Industrial Revolution โดย Daniel Pitchford และ Clint Wheelock [slides] [Synopsis]
  • Data Science Initiatives at a FinTech Company โดย Tetsuro Ito [slides] [Synopsis]
  • ConceptNet: Teaching Machines Common Sense โดย Catherine Havasi, Ph.D. [slides] [Synopsis]
  • The Key Role Threat Intelligence Can Play in Your Security Strategy โดย Christopher Ahlberg [slides] [Synopsis]
  • Escaping ETL: The Journey to Information at the Speed of Thought โดย Nenshad Bardoliwalla [slides] [Synopsis]
  • Closing Keynote: Big Data Outlook for 2017 And Why You Should Care โดย Meri Rosich Ph.D. [slides] [Synopsis]

source: http://www.bigdatacon.jp/en/

แจกฟรี E-book บน Ookbee เรื่อง Introduction to Business Analytics with RapidMiner Studio 6

ดาต้า คิวบ์แจก E-book ฟรี จำนวน 99 เล่ม ท่านใดสนใจ รบกวนกรอกข้อมูลในฟอร์มด้านล่างเพื่อรับ Promotion Code และวิธีการกรอกเพื่อดาวน์โหลดฟรีใน Ookbee application ได้เลยครับ (Update 01/04/2017)

Capture356


หมายเหตุ เนื่องจากโปรโมชันนี้มีจำนวนจำกัดหลังจากได้รับ Promotion Code แล้วกรุณากรอกทันทีครับ ไม่เช่นนั้นอาจจะหมดก่อนครับ

ส่วนท่านใดต้องการหนังสือเล่มนี้ในรูปแบบเล่ม (hard copy) สามารถสั่งจองได้ที่หน้า “สั่งจองหนังสือ Introduction to Business Analytics with RapidMiner Studio 6 (ฉบับภาษาไทย)” ครับ

สไลด์การบรรยายเรื่อง Introduction to Data Mining and Big Data Analytics

เมื่อวันที่ 8 มีนาคม 2560 ดาต้า คิวบ์ได้รับโอกาสไปบรรยายเรื่อง Introduction to Data Mining and Big Data Analytics ณ คณะวิทยาศาสตร์และวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตเฉลิมพระเกียรติ จังหวัดสกลนคร

ท่านใดสนใจสไลด์การบรรยายดูได้จากรูปด้านล่างนี้ได้เลยครับ