Apa itu Overfitting?
Overfitting adalah kesalahan pemodelan yang terjadi ketika suatu fungsi terlalu dekat dengan kumpulan data yang terbatas. Overfitting model umumnya mengambil bentuk membuat model yang terlalu rumit untuk menjelaskan keanehan dalam data yang diteliti.
Pada kenyataannya, data yang sering dipelajari memiliki tingkat kesalahan atau kebisingan acak di dalamnya. Dengan demikian, upaya untuk membuat model menyesuaikan terlalu dekat dengan data yang sedikit tidak akurat dapat menginfeksi model dengan kesalahan substansial dan mengurangi daya prediksi.
Pengambilan Kunci
- Overfitting adalah kesalahan pemodelan yang terjadi ketika suatu fungsi terlalu dekat dengan kumpulan data yang terbatas. Profesional keuangan harus selalu sadar akan bahaya overfitting suatu model berdasarkan data yang terbatas.
Memahami Overfitting
Misalnya, masalah umum adalah menggunakan algoritma komputer untuk mencari basis data luas dari data pasar historis untuk menemukan pola. Mengingat penelitian yang cukup, sering kali mungkin untuk mengembangkan teorema rumit yang tampaknya memprediksi hal-hal seperti pengembalian di pasar saham dengan akurasi dekat.
Namun, ketika diterapkan pada data di luar sampel, teorema seperti itu mungkin terbukti hanya overfitting dari model untuk apa yang pada kenyataannya hanya kejadian kebetulan. Dalam semua kasus, penting untuk menguji model terhadap data yang berada di luar sampel yang digunakan untuk mengembangkannya.
Profesional keuangan harus selalu waspada akan bahaya overfitting model berdasarkan data yang terbatas.