Apa Koefisien Determinasi?
Koefisien determinasi adalah ukuran yang digunakan dalam analisis statistik yang menilai seberapa baik model menjelaskan dan memprediksi hasil di masa depan. Ini merupakan indikasi tingkat variabilitas yang dijelaskan dalam kumpulan data. Koefisien determinasi, juga dikenal sebagai "R-squared, " digunakan sebagai pedoman untuk mengukur akurasi model.
Salah satu cara menafsirkan angka ini adalah dengan mengatakan bahwa variabel yang dimasukkan dalam model yang diberikan menjelaskan sekitar x% dari variasi yang diamati. Jadi, jika R 2 = 0, 50, maka sekitar setengah dari variasi yang diamati dapat dijelaskan oleh model.
R-Squared
Pengambilan Kunci
- Koefisien determinasi adalah ide kompleks yang berpusat pada analisis statistik dari model data masa depan. Koefisien determinasi digunakan untuk menjelaskan seberapa banyak variabilitas dari satu faktor dapat disebabkan oleh hubungannya dengan faktor lain.
Memahami Koefisien Determinasi
Koefisien determinasi digunakan untuk menjelaskan berapa banyak variabilitas dari satu faktor dapat disebabkan oleh hubungannya dengan faktor lain. Ini sangat bergantung pada analisis tren dan direpresentasikan sebagai nilai antara 0 dan 1.
Semakin dekat nilainya ke 1, semakin baik kecocokan, atau hubungan, antara kedua faktor tersebut. Koefisien determinasi adalah kuadrat dari koefisien korelasi, juga dikenal sebagai "R, " yang memungkinkannya untuk menampilkan tingkat korelasi linier antara dua variabel.
Korelasi ini dikenal sebagai "kebaikan sesuai." Nilai 1, 0 menunjukkan kesesuaian yang sempurna, dan karenanya merupakan model yang sangat andal untuk prakiraan masa depan, yang menunjukkan bahwa model tersebut menjelaskan semua variasi yang diamati. Nilai 0, di sisi lain, akan menunjukkan bahwa model gagal memodelkan data sama sekali. Untuk model dengan beberapa variabel, seperti model regresi berganda, R2 yang disesuaikan adalah koefisien determinasi yang lebih baik. Dalam bidang ekonomi, nilai R 2 di atas 0, 60 dipandang bermanfaat.
Keuntungan Menganalisis Koefisien Determinasi
Koefisien determinasi adalah kuadrat korelasi antara skor yang diprediksi dalam suatu set data versus set skor yang sebenarnya. Itu juga dapat dinyatakan sebagai kuadrat korelasi antara skor X dan Y, dengan X sebagai variabel independen dan Y sebagai variabel dependen.
Terlepas dari representasi, R-kuadrat sama dengan 0 berarti bahwa variabel dependen tidak dapat diprediksi menggunakan variabel independen. Sebaliknya, jika sama dengan 1, itu berarti bahwa ketergantungan suatu variabel selalu diprediksi oleh variabel independen.
Koefisien determinasi yang termasuk dalam rentang ini mengukur sejauh mana variabel dependen diprediksi oleh variabel independen. R-squared dari 0, 20, misalnya, berarti bahwa 20% dari variabel dependen diprediksi oleh variabel independen.
Goodness of fit, atau derajat korelasi linear, mengukur jarak antara garis yang dipasang pada grafik dan semua titik data yang tersebar di sekitar grafik. Set data yang ketat akan memiliki garis regresi yang sangat dekat dengan titik dan memiliki tingkat kecocokan yang tinggi, yang berarti bahwa jarak antara garis dan data sangat kecil. Yang cocok memiliki R-squared yang mendekati 1.
Namun, R-squared tidak dapat menentukan apakah titik data atau prediksi bias. Juga tidak memberi tahu analis atau pengguna apakah koefisien nilai determinasi baik atau tidak. Sebagai contoh, R-squared yang rendah tidak buruk, dan terserah orang untuk mengambil keputusan berdasarkan angka R-squared.
Koefisien determinasi tidak boleh ditafsirkan secara naif. Misalnya, jika model R-squared dilaporkan sebesar 75%, varians kesalahannya adalah 75% lebih kecil dari varians variabel dependen, dan standar deviasi kesalahannya adalah 50% lebih kecil dari standar deviasi dependen. variabel. Standar deviasi kesalahan model adalah sekitar sepertiga ukuran standar deviasi kesalahan yang akan Anda dapatkan dengan model konstan saja.
Akhirnya, bahkan jika nilai R-squared besar, mungkin tidak ada signifikansi statistik dari variabel penjelas dalam model, atau ukuran efektif dari variabel-variabel ini mungkin sangat kecil dalam hal praktis.