P-Değeri

P-Değeri Nedir?

İstatistikte, p-değeri, sıfır hipotezinin doğru olduğu varsayılarak, en azından istatistiksel bir hipotez testinin gözlemlenen sonuçları kadar uç sonuçlar elde etme olasılığıdır . P değeri, sıfır hipotezinin reddedileceği en küçük anlamlılık düzeyini sağlamak için reddetme noktalarına alternatif olarak kullanılır . Daha küçük bir p değeri, alternatif hipotez lehine daha güçlü kanıt olduğu anlamına gelir.

Temel Çıkarımlar

  • Bir p-değeri, gözlenen bir farkın sadece rastgele şans eseri oluşmuş olma olasılığının bir ölçüsüdür.
  • P değeri ne kadar düşükse, gözlemlenen farkın istatistiksel önemi o kadar büyüktür.
  • P değeri, hipotez testi için önceden seçilmiş güven düzeylerine bir alternatif olarak veya ek olarak kullanılabilir.

P Değeri Nasıl Hesaplanır?

P değerleri genellikle p değeri tabloları veya elektronik tablolar / istatistiksel yazılım kullanılarak bulunur. Bu hesaplamalar, test edilen spesifik istatistiğin varsayılan veya bilinen olasılık dağılımına dayanmaktadır. P değerleri, istatistiğin olasılık dağılımı verildiğinde, gözlenen değer ile seçilen bir referans değeri arasındaki sapmadan hesaplanır ve daha düşük bir p değerine karşılık gelen iki değer arasında daha büyük bir fark vardır.

Matematiksel olarak p-değeri, olasılık dağılım eğrisinin altındaki toplam alana göre en azından referans değerden en az gözlenen değer kadar uzak olan tüm istatistik değerleri için olasılık dağılım eğrisinin altındaki alandan integral hesabı kullanılarak hesaplanır. Özetle, gözlemlenen iki değer arasındaki fark ne kadar büyükse, farkın basit rastgele şanstan kaynaklanma olasılığı o kadar azdır ve bu daha düşük bir p değeri ile yansıtılır.

Hipotez Testine P-Değeri Yaklaşımı

Hipotez testine yönelik p-değeri yaklaşımı, sıfır hipotezini reddetmek için kanıt olup olmadığını belirlemek için hesaplanan olasılığı kullanır. Varsayım olarak da bilinen boş hipotez, bir popülasyon (veya veri oluşturma süreci) hakkındaki ilk iddiadır. Alternatif hipotez, popülasyon parametresinin varsayımda belirtilen popülasyon parametresinin değerinden farklı olup olmadığını belirtir.

Pratikte, sıfır hipotezini reddetmek için p değerinin ne kadar küçük olması gerektiğini belirlemek için önceden ifade edilir. Farklı araştırmacılar bir soruyu incelerken farklı önem düzeyleri kullandıklarından, okuyucu bazen iki farklı testin sonuçlarını karşılaştırmakta güçlük çekebilir. P değerleri bu soruna bir çözüm sağlar.

Örneğin, iki belirli varlığın getirilerini karşılaştıran bir çalışmanın, aynı verileri ancak farklı önem düzeylerini kullanan farklı araştırmacılar tarafından yapıldığını varsayalım. Araştırmacılar, varlıkların farklı olup olmadığı konusunda zıt sonuçlara varabilir. Bir araştırmacı% 90 güven düzeyini kullanırsa ve diğeri sıfır hipotezini reddetmek için% 95 güven düzeyine ihtiyaç duyarsa ve iki sonuç arasında gözlemlenen farkın p değeri 0,08 (% 92 güven düzeyine karşılık gelir), daha sonra ilk araştırmacı, iki varlığın istatistiksel olarak anlamlı bir farka sahip olduğunu bulurken, ikincisi, getiriler arasında istatistiksel olarak anlamlı bir fark bulmayacaktır.

Bu sorunu önlemek için, araştırmacılar hipotez testinin p değerini rapor edebilir ve okuyucunun istatistiksel önemi  kendi kendine yorumlamasına izin verebilir . Buna hipotez testine p-değeri yaklaşımı denir. Bağımsız bir gözlemci p değerini not edebilir ve bunun istatistiksel olarak anlamlı bir farkı temsil edip etmediğine kendisi karar verebilir.

Gerçek Dünyadaki P Değeri Örneği

Bir yatırımcının, yatırım portföyünün performansının Standard & Poor’s (S&P) 500 Endeksine eşdeğer olduğunu iddia ettiğini varsayın. Bunu belirlemek için yatırımcı iki kuyruklu bir test yapar. Boş hipotez, portföyün getirilerinin belirli bir dönemdeki S&P 500 getirilerine eşdeğer olduğunu belirtirken, alternatif hipotez portföyün getirilerinin ve S&P 500’ün getirilerinin eşdeğer olmadığını belirtir. (Yatırımcı tek kuyruklu bir test yaparsa, alternatif hipotez portföyün getirilerinin S&P 500’ün getirilerinden daha az veya daha fazla olduğunu belirtir.)

P-değeri hipotez testi, yatırımcının getirilerin eşdeğer olduğuna dair sıfır hipotezini sıfırlaması gereken önceden seçilmiş bir güven düzeyini kullanmak zorunda değildir. Bunun yerine, boş hipotezi reddetmek için ne kadar kanıt olduğuna dair bir ölçü sağlar. P değeri ne kadar küçükse, sıfır hipotezine karşı kanıt o kadar büyük olur. Dolayısıyla, yatırımcı p-değerinin 0,001 olduğunu bulursa, sıfır hipotezine karşı güçlü kanıtlar vardır ve yatırımcı portföyün getirilerini güvenle sonuçlandırabilir ve S&P 500’ün getirileri eşdeğer değildir.

Bu, yatırımcının boş hipotezi ne zaman kabul etmesi veya reddetmesi gerektiği konusunda kesin bir eşik sağlamasa da, çok pratik başka bir avantajı vardır. P-değeri hipotez testi, yatırımcının S&P 500 gibi bir kıyaslama ölçütüne göre çok sayıda farklı yatırım veya portföy arasından seçim yaparken sahip olabileceği göreceli güveni karşılaştırmanın doğrudan bir yolunu sunar.

Örneğin, performansı sırasıyla 0.10 ve 0.01 p değerleriyle S&P 500’den farklı olan iki portföy, A ve B için, yatırımcı, daha düşük bir p değerine sahip B portföyünün aslında tutarlı bir şekilde farklı göstereceğinden çok daha emin olabilir. Sonuçlar.