Apa itu Homoskedastic?
Homoskedastic (juga dieja "homoscedastic") mengacu pada suatu kondisi di mana varians dari residual, atau istilah kesalahan, dalam model regresi adalah konstan. Artinya, istilah kesalahan tidak bervariasi banyak karena nilai variabel prediktor berubah. Namun, kurangnya homoskedastisitas mungkin menunjukkan bahwa model regresi mungkin perlu memasukkan variabel prediktor tambahan untuk menjelaskan kinerja variabel dependen.
Pengambilan Kunci
- Homoskedastisitas terjadi ketika varians dari istilah kesalahan dalam model regresi adalah konstan. Jika varians dari istilah kesalahan adalah homoskedastik, modelnya didefinisikan dengan baik. Jika ada terlalu banyak varian, model mungkin tidak dapat didefinisikan dengan baik. Menambahkan variabel prediktor tambahan dapat membantu menjelaskan kinerja variabel dependen. Terutama, heteroskedastisitas terjadi ketika varians dari istilah kesalahan tidak konstan.
Bagaimana Homoskedastic Bekerja
Homoskedasticity adalah salah satu asumsi pemodelan regresi linier. Jika varians kesalahan di sekitar garis regresi sangat bervariasi, model regresi mungkin tidak didefinisikan dengan baik. Kebalikan dari homoskedasticity adalah heteroskedasticity sama seperti kebalikan dari "homogenous" adalah "heterogen." Heteroskedasticity (juga dieja “heteroscedasticity”) mengacu pada suatu kondisi di mana varians dari istilah kesalahan dalam persamaan regresi tidak konstan.
Ketika mempertimbangkan bahwa varians adalah perbedaan yang diukur antara hasil yang diprediksi dan hasil aktual dari situasi tertentu, menentukan homoskedastisitas dapat membantu menentukan faktor mana yang perlu disesuaikan untuk akurasi.
Pertimbangan Khusus
Model regresi sederhana, atau persamaan, terdiri dari empat istilah. Di sebelah kiri adalah variabel dependen. Ini mewakili fenomena yang ingin dijelaskan oleh model. Di sebelah kanan adalah konstanta, variabel prediktor, dan residual, atau kesalahan, istilah. Istilah kesalahan menunjukkan jumlah variabilitas dalam variabel dependen yang tidak dijelaskan oleh variabel prediktor.
Contoh dari Homoskedastic
Misalnya, Anda ingin menjelaskan nilai tes siswa menggunakan jumlah waktu yang dihabiskan setiap siswa untuk belajar. Dalam hal ini, skor tes akan menjadi variabel dependen dan waktu yang dihabiskan untuk belajar adalah variabel prediktor.
Istilah kesalahan akan menunjukkan jumlah varians dalam nilai tes yang tidak dijelaskan oleh jumlah waktu belajar. Jika varian itu seragam, atau homoskedastik, maka itu akan menyarankan model mungkin penjelasan yang memadai untuk kinerja tes — menjelaskannya dalam hal waktu yang dihabiskan untuk belajar.
Tetapi varians mungkin heteroskedastik. Plot data istilah kesalahan dapat menunjukkan sejumlah besar waktu belajar berhubungan sangat erat dengan skor tes tinggi tetapi skor tes waktu belajar yang rendah sangat bervariasi dan bahkan termasuk beberapa skor yang sangat tinggi. Jadi varians skor tidak akan dijelaskan dengan baik hanya oleh satu variabel prediktor — jumlah waktu belajar. Dalam hal ini, beberapa faktor lain mungkin sedang bekerja, dan model mungkin perlu ditingkatkan untuk mengidentifikasi atau mereka. Penyelidikan lebih lanjut dapat mengungkapkan bahwa beberapa siswa telah melihat jawaban untuk tes sebelumnya atau bahwa mereka sebelumnya telah mengambil tes yang sama, dan karena itu tidak perlu belajar untuk tes khusus ini.
Untuk meningkatkan pada model regresi, oleh karena itu, peneliti akan menambahkan variabel penjelas lain yang menunjukkan apakah seorang siswa telah melihat jawaban sebelum tes. Model regresi kemudian akan memiliki dua variabel penjelas - waktu belajar dan apakah siswa memiliki pengetahuan sebelumnya tentang jawaban. Dengan dua variabel ini, lebih banyak varians dari nilai tes akan dijelaskan dan varians dari istilah kesalahan kemudian mungkin homoskedastik, menunjukkan bahwa model itu didefinisikan dengan baik.