Data Mining ตัวอย่าง – ทำความเข้าใจกับ Data Mining Process กันหน่อย
นี่เป็นเพียงชุดข้อมูลตัวอย่าง ในการทำงานจริงนั้นจะมีข้อมูลหรือปัจจัยอีกมากมายซึ่งการที่จะทำให้การทำนายมีประสิทธิภาพขึ้นอยู่กับว่าข้อมูลถูกต้องครบถ้วนมากแค่ใหนด้วย ขั้นตอนที่ 1 Load ข้อมูลโดยใช้ Operator "Read CSV" แล้วเลือกไฟลน์ ขั้นตอนที่ 2 ใช้ Operator Set Role เพื่อกำหนด column left ให้เป็นประเภท label ขั้นตอนที่ 3 ใช้ Operator Numerical to Binominal กำหนดให้ column left เป็นประเภท binominal หรือ true, false เมื่อทำการ รัน process แล้วดูที่ statistics จะพบว่าข้อมูลที่เป็นพนักงานลาออก หรือ false จะมีเพียง 3, 565 ตัวอย่างหรือคิดเป็น 23. 8% ขั้นตอนที่ 4 เลือก Operators double click ที่ operators Cross Validation แล้วเลือก operators ตามภาพ double click ที่ operators Vote แล้วเลือก Model Operators ตามภาพ ซึ่งในที่นี้จะใช้ k-NN, Decision Tree, Naive Bayes มาช่วยกันทำนาย แล้วทำการ Run Process ได้เลย ขั้นตอนที่ 5 ผลการทำงาน ถ้าดูจาก accuracy รวมถึง 97. 19% ซึ่งถือว่าสูงแล้วใช้ได้เลยทีเดียว แต่เดี๋ยวก่อน!!!!!!!!!!!!!!!!!!!!!!!!!!!! อย่างที่บอกว่าข้อมูลที่ใช้ตอนนี้มีจำนวนแตกต่างกันพอสมควร หรือที่เรียกว่า imbalance data ซึ่งเทคนิคในการจัดการข้อมูลลักษณะนี้ก็มีอยู่หลายวิธี เช่น Over Sampling Under Sampling Cost-Sensitive ซึ่งตัวอย่างนี้เราจะใช้วิธี Under Sampling ขั้นตอนที่ 6 กลับมาที่ Process ของ RapidMiner เลือก Operators Sample กำหนด parameter ของ Operators Sample ดังนี้ sample: relative balance data = true sample ratio per class true: 1, false: 0.
Solutions
Seafarmers bot {{count}} WAX {{}} {{}} {{}} ({{*100 | number:0}}%) Inventory {{()}} {{}} - {{}} {{()}} {{(? : 0)}} Config Bot โปรดตั้งค่า Api key เพื่อใช้งานระบบ อัตโนมัติ Credit ใช้ไปแล้ว Start / Stop Auto telegram notify ( แจ้งเตือน ข้อความไปทางบอท) Auto Sell
คำถาม ทำไมถึงไม่ได้สมัครเข้าเรียนล่ะ หรือ มหาวิทยาลัยนี้ไม่ดี? คำตอบ ถ้าเรามีความรู้ใน business domain ของการศึกษา จะพบว่าคนที่ไม่ได้รับอนุญาตให้สมัครเรียน จะไม่สามารถเข้ามายังกระบวนการนี้ได้เลย!! แสดงว่า column F นี้มันไร้ค่ามาก ๆ ไม่ควรเป็นข้อมูลที่ใช้ในการตัดสินใจใด ๆ เลย ดังนั้น จึงตัดทิ้งไปซะ นี่คือตัวอย่างที่คุณควรมีความเข้าใจใน business domain นั้น ๆ เป็นอย่างดี และการทำความเข้าใจก็ไม่จำเป็นต้องใช้เครื่องมือใด ๆ เลย วันนี้คุณเข้าใจกับ business domain ที่คุณทำอยู่หรือไม่? ลองตอบคำถามกับตัวเองก่อนนะ Article by Somkiat Puisungnoen To be Craftmanship
- Data mining ตัวอย่าง tool
- Dior cushion forever สี makeup
- Data mining ตัวอย่าง 2
ในปัจจุบันนั้น พบว่ามีการนำ Data Mining มาใช้เยอะขึ้นมาก ๆ แต่ส่วนใหญ่ที่พบเจอ มักจะคุยกันเฉพาะเครื่องมือที่ใช้งาน มากกว่าที่จะพยายามทำความเข้าใจกับข้อมูล และ business domain หรือความรู้ต่าง ๆ ที่จำเป็นต่อการวิเคราะห์ข้อมูล ซึ่งนี่คือปัญหาที่กำลังเกิดขึ้นอยู่ในปัจจุบัน ดังนั้น เรามาเรียนรู้ และ เข้าใจเกี่ยวกับ Data Mining Process กันหน่อย ว่ามันเป็นอย่างไรบ้าง?
Thursday, 4 August 2022
dewa138.xyz, 2024 | Sitemap