Perbandingan Akurasi Model Regresi Logistik umtuk Prediksi Kategori IP Mahasiswa Jalur Prestasi dengan Non Jalur Prestasi

Authors

  • R Gunawan Santosa
  • Antonius Rachmat Crismanto

Abstract

Abstrak
Penelitian ini membandingkan akurasi prediksi menggunakan regresi logistik terhadap kategori Indeks Prestasi (IP) semester pertama (IPS1) mahasiswa jalur prestasi dengan mahasiswa non jalur prestasi di Fakultas Teknologi Informasi (FTI) Universitas Kristen Duta Wacana (UKDW). Variabel dependen pada jalur prestasi adalah kategori IP semester pertama sedangkan variabel independen yang digunakan adalah lokasi, kategori, status SMA, dan level tes kemampuan bahasa Inggris. Variabel untuk model regresi logistik untuk non jalur prestasi adalah sama seperti jalur prestasi namun ditambah empat variabel lain, yaitu hasil tes nilai numerik, verbal, spasial, dan analogi. Sebagai dataset untuk membuat model regresi logistik digunakan data mahasiswa FTI angkatan 2008-2015, sedangkan data ujinya menggunakan data angkatan 2016. Ketepatan atau akurasi kedua model dalam memprediksi tersebut diukur dengan menggunakan tabel Crosstab. Penelitian ini menghasilkan delapan model regresi logistik, yaitu model A-H. Nilai akurasi tertinggi untuk jalur prestasi adalah model F (dataset 2008-2013) dengan akurasi prediksi 73,73%. Hasil akurasi tertinggi untuk jalur non prestasi adalah dengan model D (dataset 2008-2011) dan E (dataset 2008-2012) dengan akurasi prediksi 56,76%. Dilihat dari segi akurasinya, model yang dihasilkan lebih baik digunakan untuk memprediksi jalur prestasi daripada jalur non prestasi.
Kata Kunci: regresi logistik, prediksi, jalur prestasi, jalur non prestasi.
Abstract
This research compares accuracy of prediction of Grade Point Average (GPA) of the first semester students who were admitted through Achievement Admission (AA) and Regular Admission (RA) using logistic regression in Faculty of Information Technology, Universitas Kristen Duta Wacana (UKDW), Yogyakarta. The dependent variables of logistic regression on AA was the category of first semester GPA, meanwhile the independent variables were location, category, high school status, and level of English proficiency. The variables of logistic regression on RA were the same as on AA along with four additional variables: the results of numeric, verbal, spatial and analogy test. The dataset used to create logistic regression model were FTI students, 2008 – 2015 batch, while the testing data were FTI students 2016 batch. This research produced 8 logistics regression model for AA and RA, model A – H. The accuracy of prediction was measured by using Crosstab table. The Crosstab table showed that the highest accuracy of AA was model F (dataset 2008-2013 with accuracy 73.73%), while the highest accuracy of RA was model D (dataset 2008-2011) and E (dataset 2008-2012) with accuracy 56.76%. From these accuracy results, our model was better to predict AA rather than RA

Author Biographies

R Gunawan Santosa

Universitas Kristen Duta Wacana Yogyakarta

Antonius Rachmat Crismanto

Universitas Kristen Duta Wacana Yogyakarta

Downloads

Published

2018-01-03

Issue

Section

Articles