Apa itu Regresi Bertahap?
Analisis regresi adalah pendekatan statistik yang banyak digunakan yang berusaha mengidentifikasi hubungan antar variabel. Idenya adalah untuk mengumpulkan data yang relevan untuk membuat keputusan dengan informasi yang lebih baik dan merupakan praktik umum dalam dunia investasi. Regresi bertahap adalah konstruksi iteratif selangkah demi selangkah dari model regresi yang melibatkan pemilihan otomatis variabel independen. Ketersediaan paket perangkat lunak statistik memungkinkan regresi bertahap, bahkan dalam model dengan ratusan variabel.
Jenis Regresi Bertahap
Tujuan mendasar dari regresi bertahap adalah, melalui serangkaian tes (uji-F, uji-t) untuk menemukan serangkaian variabel independen yang secara signifikan mempengaruhi variabel dependen. Ini dilakukan dengan komputer melalui iterasi, yang merupakan proses tiba ke hasil atau keputusan dengan melalui putaran berulang atau siklus analisis. Melakukan tes secara otomatis dengan bantuan dari paket perangkat lunak statistik memiliki keuntungan menghemat waktu bagi individu.
Pengambilan Kunci
- Analisis regresi adalah pendekatan statistik yang berupaya memahami dan mengukur hubungan antara variabel independen dan dependen. Regresi sebaliknya adalah metode yang menguji signifikansi statistik masing-masing variabel independen dalam model. Pendekatan seleksi maju menambahkan variabel dan kemudian menguji signifikansi statistik..Metode eliminasi mundur dimulai dengan model yang sarat dengan banyak variabel dan kemudian menghapus satu variabel untuk menguji kepentingannya relatif terhadap hasil keseluruhan. Regresi sebaliknya memiliki banyak kritik, karena pendekatan yang mencocokkan data ke dalam model untuk mencapai hasil yang diinginkan.
Regresi bertahap dapat dicapai dengan mencoba satu variabel independen pada satu waktu dan memasukkannya ke dalam model regresi jika signifikan secara statistik atau dengan memasukkan semua variabel independen potensial dalam model dan menghilangkan variabel-variabel yang tidak signifikan secara statistik. Beberapa menggunakan kombinasi kedua metode dan oleh karena itu ada tiga pendekatan untuk regresi bertahap:
- Pemilihan maju dimulai tanpa variabel dalam model, menguji masing-masing variabel seperti yang ditambahkan ke model, kemudian menjaga variabel yang dianggap paling signifikan secara statistik — ulangi proses hingga hasilnya optimal. Penghapusan kembali dimulai dengan satu set variabel independen, menghapus satu per satu, kemudian menguji untuk melihat apakah variabel yang dihapus secara statistik signifikan. Penghapusan dua arah adalah kombinasi dari dua metode pertama yang menguji variabel mana yang harus dimasukkan atau dikecualikan.
Contoh dari regresi bertahap menggunakan metode eliminasi mundur akan menjadi upaya untuk memahami penggunaan energi di pabrik menggunakan variabel seperti waktu menjalankan peralatan, usia peralatan, ukuran staf, suhu di luar, dan waktu tahun. Model ini mencakup semua variabel — kemudian masing-masing dihapus, satu per satu, untuk menentukan yang paling tidak signifikan secara statistik. Pada akhirnya, model ini mungkin menunjukkan bahwa waktu dalam setahun dan suhu paling signifikan, kemungkinan menunjukkan konsumsi energi puncak di pabrik adalah ketika penggunaan pendingin udara berada pada titik tertinggi.
Keterbatasan Regresi Bertahap
Analisis regresi, baik linier dan multivariat, banyak digunakan di dunia investasi saat ini. Idenya adalah sering menemukan pola yang ada di masa lalu yang mungkin juga terulang di masa depan. Regresi linier sederhana, misalnya, mungkin melihat rasio harga terhadap pendapatan dan pengembalian saham selama bertahun-tahun untuk menentukan apakah saham dengan rasio P / E rendah (variabel independen) menawarkan pengembalian yang lebih tinggi (variabel dependen). Masalah dengan pendekatan ini adalah bahwa kondisi pasar sering berubah dan hubungan yang dimiliki di masa lalu tidak selalu berlaku di masa sekarang atau di masa depan.
Sementara itu, proses regresi bertahap memiliki banyak kritik dan bahkan ada panggilan untuk berhenti menggunakan metode ini sama sekali. Ahli statistik mencatat beberapa kelemahan pada pendekatan, termasuk hasil yang tidak benar, bias yang melekat dalam proses itu sendiri, dan perlunya kekuatan komputasi yang signifikan untuk mengembangkan model regresi yang kompleks melalui iterasi.