Geriye dönük

Geriye Dönük Tümevarım Nedir?

İçinde hareket indüksiyon oyun teorisi sonlu kapsamlı bir form ve ardışık oyun çözmek ve uygun bir dizi eylemi anlaması için bir sorun, ya da durumun ucundan, zaman içinde geriye akıl bir tekrar eden bir süreçtir.

Geriye Doğru Tümevarım Açıklandı

John von Neumann ve Oskar Morgenstern , Oyun Teorisi ve Ekonomik Davranış adlı kitaplarını yayınladıklarında akademik bir konu olarak oyun teorisini kurduklarından beri, oyunları çözmek için geriye dönük çıkarım kullanılmıştır.

Oyunun her aşamasında geriye dönük çıkarım, oyundaki son hamleyi yapan oyuncunun optimal stratejisini belirler. Ardından, son oyuncunun verilen eylemi alınarak, bir sonraki-son hareket eden oyuncunun optimal eylemi belirlenir. Bu süreç, zamandaki her nokta için en iyi eylem belirlenene kadar geriye doğru devam eder. Etkili bir şekilde, orijinal oyunun her bir alt oyununun Nash dengesi belirleniyor.

Bununla birlikte, geriye dönük çıkarımdan çıkarılan sonuçlar çoğu zaman gerçek insan oyununu tahmin etmekte başarısız olur. Deneysel çalışmalar, “rasyonel” davranışın (oyun teorisinin öngördüğü gibi) gerçek hayatta nadiren sergilendiğini göstermiştir. Mantıksız oyuncular, kırkayak oyununda gösterildiği gibi, geriye dönük çıkarımla tahmin edilenden daha yüksek kazançlar elde edebilirler.

Kırkayak oyununda, iki oyuncu dönüşümlü olarak artan pot paradan daha büyük bir pay alma veya potu diğer oyuncuya geçirme şansı yakalar. Kazançlar, potun rakibine geçmesi ve rakip potu bir sonraki turda alması durumunda, potu bu turda almış olandan biraz daha az alacak şekilde düzenlenir. Oyun, bir oyuncu zulayı alır almaz sona erer, bu oyuncu daha büyük kısmı alır ve diğer oyuncu daha küçük kısmı alır.

Geriye Dönük Tümevarım Örneği

Örnek olarak, Oyuncu A’nın önce gittiğini ve şu anda 2 $ tutarında olan zulayı “alıp almayacağına” veya “geçip geçmeyeceğine” karar vermesi gerektiğini varsayalım. Eğer alırsa, A ve B’nin her biri 1 $ alır, ancak A geçerse, alma veya geçme kararı Oyuncu B tarafından verilmelidir. B alırsa, 3 $ alır (yani, önceki 2 $ + 1 $ zulası) ve A 0 $ alır. Ama eğer B geçerse, şimdi A alıp almayacağına ya da geçip geçmeyeceğine karar verir ve bu böyle devam eder. Her iki oyuncu da her zaman geçmeyi seçerse, oyunun sonunda her biri 100 dolarlık bir ödeme alır.

Oyunun amacı, eğer A ve B hem işbirliği yapar hem de oyunun sonuna kadar geçmeye devam ederse, her biri 100 $ ‘lık maksimum ödeme alırlar. Ancak diğer oyuncuya güvenmezlerse ve ilk fırsatta “almalarını” beklerlerse, Nash dengesi oyuncuların mümkün olan en düşük iddiayı alacağını öngörür (bu durumda 1 $).

Hiçbir oyuncunun rakibinin seçimini düşündükten sonra seçtiği stratejiden sapma dürtüsünün olmadığı bu oyunun Nash dengesi, ilk oyuncunun potu oyunun ilk turunda alacağını gösteriyor. Bununla birlikte, gerçekte, nispeten az sayıda oyuncu bunu yapmaktadır. Sonuç olarak, denge analizinin öngördüğünden daha yüksek bir getiri elde ederler.

Geriye Dönük Tümevarımı Kullanarak Sıralı Oyunları Çözme

Aşağıda iki oyuncu arasındaki basit bir ardışık oyun var. İçlerinde Oyuncu 1 ve Oyuncu 2 bulunan etiketler, sırasıyla bir veya iki oyuncu için bilgi setleridir. Ağacın altındaki parantez içindeki sayılar, her bir ilgili noktadaki getirilerdir. Oyun da sıralıdır, bu nedenle Oyuncu 1 ilk kararı verir (sol veya sağ) ve Oyuncu 2 kararını Oyuncu 1’den sonra (yukarı veya aşağı) verir.

Geriye dönük çıkarım, tüm oyun teorileri gibi, rasyonellik ve maksimizasyon varsayımlarını kullanır, bu da Oyuncu 2’nin herhangi bir durumda getirisini maksimize edeceği anlamına gelir. Her iki bilgi kümesinde de dört seçeneğimiz var. Oyuncu 2’nin seçmeyeceği seçenekleri ortadan kaldırarak ağacımızı daraltabiliriz. Bu şekilde, verilen bilgi setinde oyuncunun getirisini en üst düzeye çıkaran çizgileri mavi olarak işaretleyeceğiz.

Bu indirgemeden sonra, Oyuncu 1, Oyuncu 2’nin seçimleri bilindiğinden, getirilerini maksimize edebilir. Sonuç, Oyuncu 1’in “doğru” yu ve Oyuncu 2’nin “yukarı” yı seçmesinin geriye dönük çıkarımıyla bulunan bir dengedir. Aşağıda, denge yolu kalınlaştırılmış oyuna çözüm bulunmaktadır.

Örneğin, şirketler oyuncuları kullanarak yukarıdakine benzer bir oyunu kolayca kurabilir. Bu oyun, ürün sürüm senaryolarını içerebilir. Şirket 1 bir ürünü piyasaya sürmek isterse, Şirket 2 buna yanıt olarak ne yapabilir? Şirket 2, benzer bir rakip ürün çıkaracak mı? By tahmin değişik senaryolarda bu yeni ürünün satış biz olacağını işliyor tahmin etmek için bir oyun ayarlayabilirsiniz. Aşağıda böyle bir oyunun nasıl modellenebileceğine dair bir örnek verilmiştir.