Apa itu Induksi Mundur?
Induksi mundur dalam teori permainan adalah proses berulang dari penalaran mundur dalam waktu, dari akhir masalah atau situasi, untuk menyelesaikan bentuk terbatas dan permainan berurutan, dan menyimpulkan urutan tindakan optimal.
Induksi Mundur Dijelaskan
Induksi mundur telah digunakan untuk menyelesaikan permainan sejak John von Neumann dan Oskar Morgenstern menetapkan teori permainan sebagai subjek akademis ketika mereka menerbitkan buku mereka, Teori Permainan dan Perilaku Ekonomi pada tahun 1944.
Pada setiap tahap permainan, induksi mundur menentukan strategi optimal pemain yang membuat langkah terakhir dalam permainan. Kemudian, tindakan optimal dari pemain yang bergerak selanjutnya ditentukan, mengambil tindakan pemain terakhir seperti yang diberikan. Proses ini terus mundur hingga tindakan terbaik untuk setiap titik waktu telah ditentukan. Secara efektif, seseorang menentukan keseimbangan Nash dari setiap subgame dari game asli.
Namun, hasil yang disimpulkan dari induksi mundur sering gagal untuk memprediksi permainan manusia yang sebenarnya. Studi eksperimental telah menunjukkan bahwa perilaku "rasional" (seperti yang diperkirakan oleh teori permainan) jarang diperlihatkan dalam kehidupan nyata. Pemain irasional sebenarnya bisa mendapatkan hadiah lebih tinggi dari yang diperkirakan oleh induksi mundur, seperti yang diilustrasikan dalam permainan kelabang.
Dalam permainan kelabang, dua pemain secara bergantian mendapatkan kesempatan untuk mengambil bagian lebih besar dari jumlah uang yang semakin banyak, atau untuk memberikan uang kepada pemain lain. Imbalannya diatur sehingga jika pot diteruskan ke lawan seseorang dan lawan mengambil pot pada putaran berikutnya, ia menerima sedikit lebih sedikit daripada jika seseorang mengambil pot pada putaran ini. Permainan berakhir segera setelah pemain mengambil simpanan, dengan pemain yang mendapatkan porsi lebih besar dan pemain lain mendapatkan porsi yang lebih kecil.
Contoh Induksi Mundur
Sebagai contoh, anggap Pemain A lebih dulu dan harus memutuskan apakah ia harus "mengambil" atau "lulus" simpanan, yang saat ini berjumlah $ 2. Jika dia mengambil, maka A dan B mendapatkan $ 1 masing-masing, tetapi jika A melewati, keputusan untuk mengambil atau lulus sekarang harus dibuat oleh Pemain B. Jika B mengambil, dia mendapat $ 3 (yaitu, simpanan sebelumnya sebesar $ 2 + $ 1) dan A mendapat $ 0. Tetapi jika B berlalu, A sekarang harus memutuskan apakah akan mengambil atau lulus, dan seterusnya. Jika kedua pemain selalu memilih untuk mengoper, mereka masing-masing menerima hadiah $ 100 pada akhir pertandingan.
Inti dari permainan ini adalah jika A dan B keduanya bekerja sama dan terus melewati hingga akhir pertandingan, mereka mendapatkan pembayaran maksimum masing-masing $ 100. Tetapi jika mereka tidak mempercayai pemain lain dan mengharapkan mereka untuk "mengambil" pada kesempatan pertama, keseimbangan Nash memprediksi para pemain akan mengambil klaim serendah mungkin ($ 1 dalam kasus ini).
Kesetimbangan Nash dari permainan ini, di mana tidak ada pemain yang memiliki insentif untuk menyimpang dari strategi yang dipilihnya setelah mempertimbangkan pilihan lawan, menunjukkan bahwa pemain pertama akan mengambil pot pada putaran pertama permainan. Namun, pada kenyataannya, relatif sedikit pemain yang melakukannya. Akibatnya, mereka mendapatkan hasil yang lebih tinggi daripada hasil yang diperkirakan oleh analisis ekuilibria.
Memecahkan Permainan Sekuensial Menggunakan Induksi Mundur
Di bawah ini adalah permainan berurutan sederhana antara dua pemain. Label dengan Player 1 dan Player 2 di dalamnya adalah set informasi untuk masing-masing pemain satu atau dua. Angka-angka dalam tanda kurung di bagian bawah pohon adalah hadiah pada setiap titik masing-masing. Gim ini juga berurutan, sehingga Player 1 membuat keputusan pertama (kiri atau kanan) dan Player 2 membuat keputusan setelah Player 1 (atas atau bawah).
Gambar 1
Induksi mundur, seperti semua teori permainan, menggunakan asumsi rasionalitas dan maksimalisasi, yang berarti bahwa Player 2 akan memaksimalkan imbalannya dalam situasi apa pun. Pada set informasi mana pun, kami memiliki dua pilihan, semuanya empat. Dengan menghilangkan pilihan yang tidak akan dipilih Player 2, kita dapat mempersempit pohon kita. Dengan cara ini, kami akan menebalkan garis yang memaksimalkan hasil pemain di set informasi yang diberikan.
Gambar 2
Setelah pengurangan ini, Player 1 dapat memaksimalkan imbalannya sekarang setelah pilihan Player 2 diketahui. Hasilnya adalah keseimbangan yang ditemukan oleh induksi mundur Player 1 memilih "benar" dan Player 2 memilih "naik." Di bawah ini adalah solusi untuk permainan dengan garis keseimbangan dicetak tebal.
Gambar 3
Misalnya, seseorang dapat dengan mudah membuat game yang mirip dengan yang di atas menggunakan perusahaan sebagai pemain. Game ini dapat mencakup skenario rilis produk. Jika Perusahaan 1 ingin merilis produk, apa yang Perusahaan 2 lakukan sebagai tanggapan? Akankah Perusahaan 2 merilis produk pesaing yang serupa? Dengan memperkirakan penjualan produk baru ini dalam skenario yang berbeda, kami dapat membuat game untuk memprediksi bagaimana peristiwa dapat terjadi. Di bawah ini adalah contoh bagaimana orang bisa memodelkan permainan seperti itu.
Gambar 4