Tanımlayıcı istatistikler
Tanımlayıcı İstatistikler Nelerdir?
Tanımlayıcı istatistikler, belirli bir veri setini özetleyen kısa tanımlayıcı katsayılardır; bu, tümünün bir temsili veya bir popülasyonun bir örneği olabilir. Tanımlayıcı istatistikler, merkezi eğilim ölçülerine ve değişkenlik (yayılma) ölçülerine bölünmüştür. Ölçüleri iken, merkezi ölçüleri, ortalama, medyan ve modu dahil değişkenlik dahil basıklığını ve çarpıklık.
Temel Çıkarımlar
- Tanımlayıcı istatistikler, bir veri setinin özelliklerini özetler veya tanımlar.
- Tanımlayıcı istatistikler iki temel ölçü kategorisinden oluşur: merkezi eğilim ölçüleri ve değişkenlik (veya yayılma) ölçüleri.
- Merkezi eğilim ölçüleri bir veri setinin merkezini tanımlar.
- Değişkenlik veya yayılma ölçüleri, küme içindeki verilerin dağılımını tanımlar.
Tanımlayıcı İstatistikleri Anlamak
Kısaca tanımlayıcı istatistikler, örnek ve verilerin ölçümleri hakkında kısa özetler vererek belirli bir veri setinin özelliklerini tanımlamaya ve anlamaya yardımcı olur. En çok tanınan tanımlayıcı istatistik türleri, neredeyse tüm matematik ve istatistik düzeylerinde kullanılan merkez ölçüleridir: ortalama, medyan ve mod. Ortalama veya ortalama, veri setindeki tüm rakamların toplanması ve ardından set içindeki rakamların sayısına bölünmesiyle hesaplanır. Örneğin, aşağıdaki veri kümesinin toplamı 20’dir: (2, 3, 4, 5, 6). Ortalama 4 (20/5). Bir veri kümesinin modu, en sık görünen değerdir ve medyan, veri kümesinin ortasında yer alan şekildir. Bir veri seti içerisinde yüksek rakamları düşük rakamlardan ayıran rakamdır. Bununla birlikte, hala çok önemli olan daha az yaygın tanımlayıcı istatistik türleri vardır.
İnsanlar, büyük bir veri kümesindeki anlaşılması zor nicel içgörüleri küçük boyutlu açıklamalara dönüştürmek için tanımlayıcı istatistikleri kullanır. Örneğin, bir öğrencinin not ortalaması (GPA), tanımlayıcı istatistiklerin iyi anlaşılmasını sağlar. GPA fikri, çok çeşitli sınavlardan, sınıflardan ve notlardan veri noktaları alması ve bir öğrencinin genel akademik performansı hakkında genel bir anlayış sağlamak için bunların ortalamasını almasıdır. Bir öğrencinin kişisel not ortalaması, ortalama akademik performansını yansıtır.
Tanımlayıcı İstatistik Ölçüleri
Tüm tanımlayıcı istatistikler ya merkezi eğilim ölçüleri ya da değişkenlik ölçüleri olup, aynı zamanda dağılım ölçüleri olarak da bilinir. Merkezi eğilim ölçüleri, veri setlerinin ortalama veya orta değerlerine odaklanırken, değişkenlik ölçüleri verilerin dağılımına odaklanır. Bu iki ölçü, insanların analiz edilen verilerin anlamını anlamalarına yardımcı olmak için grafikler, tablolar ve genel tartışmalar kullanır.
Merkezi eğilim ölçüleri, bir veri seti için bir dağılımın merkez konumunu tanımlar. Bir kişi, dağılımdaki her veri noktasının sıklığını analiz eder ve analiz edilen veri setinin en yaygın modellerini ölçen ortalama, medyan veya modu kullanarak açıklar.
Değişkenlik ölçüleri veya yayılma ölçüleri, bir veri kümesi için dağılımın nasıl yayıldığını analiz etmeye yardımcı olur. Örneğin, merkezi eğilim ölçüleri bir kişiye bir veri setinin ortalamasını verebilirken, verilerin set içinde nasıl dağıtıldığını açıklamaz. Dolayısıyla, verilerin ortalaması 100 üzerinden 65 olsa da, hem 1 hem de 100’de veri noktaları olabilir. Değişkenlik ölçüleri, veri setinin şeklini ve yayılmasını tanımlayarak bunu iletmeye yardımcı olur. Aralık, çeyrekler, mutlak sapma ve varyans, değişkenlik ölçülerinin tüm örnekleridir.
Şu veri setini göz önünde bulundurun: 5, 19, 24, 62, 91, 100. Bu veri setinin aralığı 95’tir ve veri setindeki en düşük sayı (5) en yüksekten (100) çıkarılarak hesaplanır.
Sıkça Sorulan Sorular
Verileri basitçe tanımlayan istatistiklere neden ihtiyacımız var?
Tanımlayıcı istatistikler, bir değişkenin ortalaması, standart sapması veya sıklığı gibi bir numunenin veya veri setinin özelliklerini tanımlamak veya özetlemek için kullanılır. Çıkarımsal istatistik. Bu tür istatistikler, bir veri örneğindeki öğelerin toplu özelliklerini anlamamıza yardımcı olabilir. Bu ölçümler bize olasılık dağılımı veya histogram veya nokta grafiği gibi bir grafik üzerinde gösterilebilen verilerin genel “şekli” hakkında bir fikir verebilir . Bir değişkenin örnek ortalamasını, varyansını ve dağılımını bilmek çevremizdeki dünyayı anlamamıza yardımcı olabilir.
Ortalama ve standart sapma nedir?
Bunlar, yaygın olarak kullanılan iki tanımlayıcı istatistiktir. Ortalama, bazı verilerde gözlemlenen ortalama düzeydir, standart sapma ise varyansı veya bu değişkende gözlemlenen verilerin ortalamaya nasıl dağıldığını açıklar.
Açıklayıcı istatistikler çıkarım yapmak veya tahmin yapmak için kullanılabilir mi?
Hayır. Bu tanımlamalar verilerin niteliklerinin anlaşılmasına yardımcı olurken, bir veri setinde değişkenlerin birbirleriyle nasıl etkileşime girdiğini anlamak için çıkarımsal istatistiksel teknikler – ayrı bir istatistik dalı – gereklidir.