Abstract |
บทคัดย่อ
งานวิจัยนี้ได้เสนอการพยากรณ์โอกาสสำเร็จการศึกษาของนักศึกษา ด้วยเทคนิคการทำเหมืองข้อมูล กรณีศึกษาคณะบริหารธุรกิจ สาขาวิชาการบัญชี การตลาด การจัดการ และการเงินและการธนาคาร เทคนิคที่ใช้พัฒนาโมเดลประกอบด้วย 4 เทคนิค ได้แก่ ซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine : SVM) โครงข่ายประสาทเทียม (Artificial Neural Networks : ANN) โครงข่ายเบย์ (Bayesian Network : BNs) และต้นไม้ตัดสินใจ (Decision Tree : DT) โดยใช้ข้อมูล 1,963 ชุดข้อมูลจากคณะบริหารธุรกิจ ของมหาวิทยาลัยเอกชนแห่งหนึ่งในภาคตะวันออกเฉียงเหนือ ในการสร้างโมเดล จากการวิเคราะห์ชุดข้อมูลพบว่า ชุดข้อมูลนี้ไม่มีความสมดุลของข้อมูล ผู้วิจัยจึงได้ใช้วิธีการสังเคราะห์ข้อมูลใหม่ โดยใช้เทคนิค Oversampling แบบ Synthetic Minority Oversampling Technique (SMOTE) เพื่อปรับสมดุลของชุดข้อมูล จากนั้นทำการสร้างโมเดลซัพพอร์ตเวกเตอร์แมชชีน โมเดลโครงข่ายประสาทเทียม โมเดลโครงข่ายเบย์ โมเดลต้นไม้ตัดสินใจ และใช้ 10-fold cross-validation สำหรับทดสอบประสิทธิภาพของโมเดล โดยมีค่าความถูกต้องเท่ากับ 95.56% 95.62% 95.59% และ 94.77% ตามลำดับ ผลการศึกษาพบว่าโมเดลโครงข่ายประสาทเทียมมีค่าความถูกต้องสูงกว่าโมเดลอื่น
Abstract
This research presented the forecasting of graduation students status by using the data mining method. The case study was related to the faculty of business administration, which involved four programs, (accounting, marketing, management, and finance and banking). In this study, four techniques were applied to develop the models, they were Support Vector Machine (SVM), Artificial Neural Networks (ANN), Bayesian network (BN), and Decision Tree (DT). In order to construct the models, 1,936 data sets were used. From the Faculty of Business Administration of a private university in the northeast, The data analysis results indicated that the data sets were imbalanced. To solve the imbalance problem, we applied the new synthesis method, oversampling technique, and synthetic minority oversampling technique (SMOTE) to balance the data sets. The accuracy obtained by SVM, ANN, BN, DT techniques with 10-fold cross-validation, for testing the performance of the models are 95.56%, 95.62%, 95.59%, and 94.77% respectively. The experimental results showed that the ANN model has more accuracy than other models.
|