İstatistiksel anlamlılık

İstatistiksel Önem Nedir?

İstatistiksel anlamlılık, test veya deney yoluyla oluşturulan verilerden elde edilen bir sonucun rastgele veya şans eseri meydana gelmesinin muhtemel olmadığı, bunun yerine belirli bir nedene atfedilebileceği iddiasını ifade eder. İstatistiksel öneme sahip olmak, ekonomi, finans, yatırım, tıp, fizik ve biyoloji gibi verileri ve araştırmayı analiz etmeye büyük ölçüde güvenen akademik disiplinler veya uygulayıcılar için önemlidir.

İstatistiksel anlamlılık güçlü veya zayıf kabul edilebilir. Bir veri setini analiz ederken ve bir veya daha fazla değişkenin bir sonuç üzerinde etkisi olup olmadığını anlamak için gerekli testleri yaparken, güçlü istatistiksel anlamlılık, sonuçların gerçek olduğu ve şans veya şans eseri olmadığı gerçeğini desteklemeye yardımcı olur. Basitçe ifade etmek gerekirse, bir p değeri küçükse, sonuç daha güvenilir kabul edilir.

Araştırmacılar genellikle popülasyonların kendileri ile değil, daha büyük popülasyonların örnekleriyle çalıştıkları için istatistiksel anlamlılık testlerinde sorunlar ortaya çıkmaktadır. Sonuç olarak, numuneler popülasyonu temsil etmelidir, bu nedenle numunede bulunan veriler hiçbir şekilde önyargılı olmamalıdır. Ekonomi dahil çoğu bilim dalında,% 95 (veya bazen% 99) düzeyinde bir iddia yapılabiliyorsa istatistiksel anlamlılık önemlidir.

İstatistiksel Önemi Anlamak

İstatistiksel anlamlılığın hesaplanması (anlamlılık testi) belirli bir derecede hataya tabidir. Araştırmacı, tüm popülasyonu içermeyen herhangi bir testte var olan bir örnekleme hatası olasılığını önceden tanımlamalıdır.

Numune boyutu, daha büyük numunelerin şansa daha az eğilimli olması nedeniyle istatistiksel açıdan önemli bir bileşendir. Anlamlılık testinde yalnızca rastgele, temsili numuneler kullanılmalıdır. Bir olayın istatistiksel olarak önemli olup olmadığını kabul edebilecek düzey, önem düzeyi olarak bilinir.

Araştırmacılar, istatistiksel önemi belirlemek için p değeri olarak bilinen bir test istatistiği kullanır: p değeri, anlamlılık seviyesinin altına düşerse, sonuç istatistiksel olarak anlamlıdır. P-değeri, veri örneklerinin ortalamalarının ve standart sapmalarının bir fonksiyonudur.

P-değeri, sonuçtan sadece şansın sorumlu olduğunu varsayarak, verilen istatistiksel sonucun gerçekleşme olasılığını gösterir. Bu olasılık küçükse, araştırmacı şansımızı bir sebep olarak güvenle yönetebilir. Sonuçların en azından istatistiksel olarak anlamlı kabul edilebilmesi için p değerinin anlamlılık düzeyinin altına düşmesi gerekir.

1 eksi anlamlılık düzeyi olarak hesaplanan anlamlılık düzeyinin tersi güven düzeyidir. İstatistiksel sonucun tesadüfen veya örnekleme hatasıyla oluşmadığına dair güven derecesini gösterir. Pek çok istatistiksel testte alışılmış güven seviyesi yüzde 95’tir ve bu da alışılmış bir anlamlılık düzeyine veya yüzde 5’lik bir p değerine yol açar.

Temel çıkarımlar

  • İstatistiksel anlamlılık, test veya deneme yoluyla oluşturulan verilerden elde edilen bir sonucun büyük olasılıkla belirli bir nedene atfedilebileceği iddiasıdır.
  • Bir istatistik yüksek öneme sahipse, o zaman daha güvenilir kabul edilir.
  • İstatistiksel anlamın hesaplanması belirli bir derecede hataya tabidir. 
  • Araştırmacılar sonuçlarını bildirirken dili dikkatli kullanmadıklarında istatistiksel önem yanlış yorumlanabilir. 
  • Yürütülen araştırmaya bağlı olarak birkaç tür anlamlılık testi kullanılır.

Özel Hususlar

İstatistiksel anlamlılık her zaman pratik önemi göstermez, bu da sonuçların gerçek dünyadaki iş durumlarına uygulanamayacağı anlamına gelir. Ek olarak, araştırmacılar sonuçlarını rapor ederken dili dikkatli kullanmadıklarında istatistiksel anlamlılık yanlış yorumlanabilir. Bir sonuç öyle anlamına gelmez istatistiksel olarak anlamlı olduğu için değil  onun rastgele olma olasılığı büyük ölçüde azalır sadece rastgele.

İki veri serisinin birbiriyle güçlü bir korelasyona sahip olması, nedensellik anlamına gelmez. Örneğin, aktör Nicolas Cage’in belirli bir yılda oynadığı film sayısı, yüzme havuzlarında kaza sonucu boğulma sayısıyla çok yüksek bir korelasyona sahip. Ancak bu korelasyon sahte, çünkü yapılabilecek teorik nedensel bir iddia yok.

İstatistiksel anlamlılıkla ortaya çıkabilecek diğer bir sorun, geçmiş veriler ve bu verilerden elde edilen sonuçların istatistiksel olarak anlamlı olsun veya olmasın, devam eden veya gelecekteki koşulları yansıtmayabilmesidir. Yatırımda, bu, korelasyonlar değiştikçe ve değişkenler her zamanki gibi etkileşime girmediğinden, finansal kriz zamanlarında parçalanan bir fiyatlandırma modelinde kendini gösterebilir. İstatistiksel önem, bir yatırımcının bir varlık fiyatlandırma modelinin diğerinden daha iyi olup olmadığını anlamasına da yardımcı olabilir.

İstatistiksel Anlamlılık Testlerinin Türleri

Yürütülen araştırmaya bağlı olarak birkaç tür anlamlılık testi kullanılır. Örneğin testler, ortalamalar, varyanslar, oranlar, eşleştirilmiş veya eşleşmemiş veriler veya farklı veri dağılımları için çeşitli boyutlarda bir, iki veya daha fazla veri örneği için kullanılabilir.

Boş Hipotezi

Tüm bu faktörlerde boş hipotezler vardır ve önem genellikle istatistikte hipotez testinin amacıdır. En yaygın boş hipotez, söz konusu parametrenin sıfıra eşit olmasıdır (tipik olarak, bir değişkenin ilgili sonuç üzerinde sıfır etkisinin olduğunu gösterir). Sıfır hipotezini yüzde 95 veya daha iyi bir güvenle reddedebilirseniz, araştırmacılar istatistiksel anlamlılığa başvurabilirler. Boş hipotezler ayrıca iki veya daha fazla alternatif tedavinin etkisinin eşitliği (sıfıra eşit olmaktan ziyade) için test edilebilir – örneğin, bir klinik araştırmada bir ilaç ile bir plasebo arasında.

Sıfır hipotezinin reddedilmesi, çok yüksek derecede istatistiksel anlamlılık hiçbir zaman bir şeyi kanıtlayamasa bile, yalnızca var olan bir hipoteze destek sağlayabilir. Öte yandan, boş bir hipotezi reddetmedeki başarısızlık, genellikle bir hipotezin reddedilmesine neden olur.

Bir istatistiksel anlamlılık testi, bir güven aralığını hesaplamakla aynı matematiğin çoğunu paylaşır. Yaygın durumlarda, istatistiksel önemi yorumlamanın bir yolu, karşılık gelen yüzde 95 güven aralığının sıfır değerini içermemesidir. Bir değişken istatistiksel olarak anlamlı bulunsa bile, gerçek dünyada yine de mantıklı olmalıdır.

Ek olarak, bir etki istatistiksel olarak önemli olabilir ancak çok küçük bir etkiye sahiptir. Örneğin, banyolarında iki katlı tuvalet kağıdı kullanan şirketlerin daha üretken çalışanlara sahip olma şansından dolayı çok düşük bir ihtimal olabilir, ancak her çalışanın mutlak verimliliğindeki iyileşme muhtemelen çok küçük olacaktır.