Temas halinde Facebook heyecan RSS beslemesi

Pearson dağılımı (ki-kare dağılımı). Ki-kare dağılımı. MS EXCEL'de matematiksel istatistiklerin dağılımları Ki kare dağılım fonksiyonunun değeri

Rusya Federasyonu Eğitim ve Bilim Bakanlığı

Irkutsk Şehri Federal Eğitim Ajansı

Baykal Devlet Ekonomi ve Hukuk Üniversitesi

Bilişim ve Sibernetik Bölümü

Ki-kare dağılımı ve uygulamaları

Kolmikova Anna Andreevna

2. sınıf öğrencisi

grup IS-09-1

İrkutsk 2010

giriiş

1. Ki-kare dağılımı

Başvuru

Çözüm

Kaynakça

giriiş

Olasılık teorisinin yaklaşımları, fikirleri ve sonuçları hayatımızda nasıl kullanılıyor?

Temel, gerçek bir olgunun veya sürecin olasılıksal bir modelidir; nesnel ilişkilerin olasılık teorisi açısından ifade edildiği bir matematiksel model. Olasılıklar öncelikle karar alırken dikkate alınması gereken belirsizlikleri tanımlamak için kullanılır. Bu, hem istenmeyen fırsatlara (risklere) hem de cazip fırsatlara (“şanslı şans”) atıfta bulunur. Bazen rastgelelik, örneğin kura çekerken, kontrol için birimleri rastgele seçerken, piyango düzenlerken veya tüketici anketleri yaparken bir duruma kasıtlı olarak dahil edilir.

Olasılık teorisi, bir olasılığın araştırmacının ilgisini çeken diğer olasılıkları hesaplamak için kullanılmasına izin verir.

Bir olgunun veya sürecin olasılıksal modeli matematiksel istatistiğin temelidir. Teoriye ilişkin olanlar (olasılıksal model) ve uygulamaya ilişkin olanlar (gözlem sonuçlarının örneklenmesi) olmak üzere iki paralel kavram dizisi kullanılmaktadır. Örneğin teorik olasılık, numuneden bulunan frekansa karşılık gelir. Matematiksel beklenti (teorik seri), örnek aritmetik ortalamaya (pratik seri) karşılık gelir. Kural olarak, örnek özellikler teorik olanların tahminleridir. Aynı zamanda teorik seriye ilişkin nicelikler “araştırmacıların kafasındadır”, fikir dünyasıyla ilgilidir (antik Yunan filozofu Platon'a göre) ve doğrudan ölçüm için mevcut değildir. Araştırmacıların elinde yalnızca kendilerini ilgilendiren teorik olasılıksal bir modelin özelliklerini oluşturmaya çalıştıkları örnek veriler var.

Neden olasılıksal bir modele ihtiyacımız var? Gerçek şu ki, belirli bir numunenin analizinden elde edilen özellikler, yalnızca onun yardımıyla diğer numunelere ve sözde genel popülasyonun tamamına aktarılabilir. "Nüfus" terimi, üzerinde çalışılan birimlerin büyük ama sınırlı bir koleksiyonuna atıfta bulunurken kullanılır. Örneğin, Rusya'nın tüm sakinlerinin toplamı veya Moskova'daki tüm hazır kahve tüketicilerinin toplamı hakkında. Pazarlama veya sosyolojik araştırmaların amacı, yüzlerce veya binlerce kişiden oluşan bir örneklemden elde edilen ifadeleri birkaç milyonluk nüfusa aktarmaktır. Kalite kontrolünde, bir ürün partisi genel popülasyon görevi görür.

Bir örneklemden elde edilen sonuçların daha büyük bir popülasyona aktarılması, örneklem özelliklerinin bu daha büyük popülasyonun özellikleriyle ilişkisi hakkında bazı varsayımlar gerektirir. Bu varsayımlar uygun bir olasılıksal modele dayanmaktadır.

Elbette, şu veya bu olasılıksal modeli kullanmadan örnek verileri işlemek mümkündür. Örneğin, örnek bir aritmetik ortalamayı hesaplayabilir, belirli koşulların gerçekleşme sıklığını vb. hesaplayabilirsiniz. Ancak hesaplama sonuçları yalnızca belirli bir örneklemle ilgili olacaktır; bunların yardımıyla elde edilen sonuçların başka bir popülasyona aktarılması yanlıştır. Bu etkinliğe bazen "veri analizi" adı verilir. Olasılıksal-istatistiksel yöntemlerle karşılaştırıldığında, veri analizinin eğitimsel değeri sınırlıdır.

Dolayısıyla, örneklem özelliklerini kullanarak hipotezlerin tahmin edilmesine ve test edilmesine dayanan olasılıksal modellerin kullanılması, olasılıksal-istatistiksel karar verme yöntemlerinin özüdür.

Ki-kare dağılımı

Normal dağılım kullanılarak, istatistiksel veri işlemede artık sıklıkla kullanılan üç dağılım tanımlanır. Bunlar Pearson (“ki-kare”), Öğrenci ve Fisher dağılımlarıdır.

Dağıtıma odaklanacağız

(“ki – kare”). Bu dağılım ilk olarak 1876'da gökbilimci F. Helmert tarafından incelenmiştir. Gauss hata teorisiyle bağlantılı olarak, n bağımsız, standart olarak normal dağılmış rastgele değişkenin karelerinin toplamlarını inceledi. Karl Pearson daha sonra bu dağılım fonksiyonuna "ki-kare" adını verdi. Ve artık dağıtım onun adını taşıyor.

Normal dağılımla yakın bağlantısı nedeniyle χ2 dağılımı olasılık teorisinde ve matematiksel istatistikte önemli bir rol oynar. χ2 dağılımı ve χ2 dağılımı tarafından tanımlanan diğer birçok dağılım (örneğin Öğrenci dağılımı), normal dağılmış gözlem sonuçlarından çeşitli fonksiyonların örnek dağılımlarını tanımlar ve güven aralıkları ve istatistiksel testler oluşturmak için kullanılır.

Pearson dağılımı

(ki - kare) – X1, X2,..., Xn'nin normal bağımsız rastgele değişkenler olduğu ve her birinin matematiksel beklentisinin sıfır olduğu ve standart sapmanın bir olduğu bir rastgele değişkenin dağılımı.

Karelerin toplamı


yasalara uygun olarak dağıtılır

(“ki – kare”).

Bu durumda terim sayısı, yani. n, ki-kare dağılımının "serbestlik derecesi sayısı" olarak adlandırılır. Serbestlik derecesi sayısı arttıkça dağılım yavaş yavaş normale yaklaşır.

Bu dağılımın yoğunluğu

Dolayısıyla χ2'nin dağılımı bir parametre olan n'ye, yani serbestlik derecesi sayısına bağlıdır.

χ2 dağılım fonksiyonu şu şekildedir:

eğer χ2≥0 ise. (2.7.)

Şekil 1'de farklı serbestlik dereceleri için olasılık yoğunluğunun ve χ2 dağılım fonksiyonunun grafiği gösterilmektedir.

Resim 1 Farklı serbestlik derecesi sayıları için χ2 (chi – kare) dağılımındaki olasılık yoğunluğunun φ (x) bağımlılığı.

Ki-kare dağılımının momentleri:

Ki-kare dağılımı, varyansın tahmin edilmesinde (bir güven aralığı kullanılarak), öncelikle sınırlı sayıda değer alan niteliksel (kategorize edilmiş) değişkenler için anlaşma, homojenlik, bağımsızlık hipotezlerinin test edilmesinde ve istatistiksel veri analizinin diğer birçok görevinde kullanılır. .

2. İstatistiksel veri analizi problemlerinde "Ki-kare"

İstatistiksel veri analizi yöntemleri, insan faaliyetinin hemen hemen tüm alanlarında kullanılmaktadır. Bir miktar içsel heterojenliğe sahip bir grup (nesneler veya özneler) hakkında herhangi bir yargıyı elde etmek ve haklı çıkarmak gerektiğinde kullanılırlar.

İstatistiksel yöntemlerin modern gelişim aşaması, İngiliz K. Pearson'un "Biometrika" dergisini kurduğu 1900 yılından itibaren sayılabilir. Yirminci yüzyılın ilk üçte biri. parametrik istatistiklerin işareti altında geçti. Yöntemler, Pearson ailesi eğrileri tarafından tanımlanan parametrik dağılım ailelerinden elde edilen verilerin analizine dayanarak incelenmiştir. En popüler olanı normal dağılımdı. Hipotezleri test etmek için Pearson, Öğrenci ve Fisher testleri kullanıldı. Maksimum olabilirlik yöntemi ve varyans analizi önerildi ve deney planlamasının temel fikirleri formüle edildi.

Ki-kare dağılımı istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. Ki-kare dağılımına dayanarak, en güçlü uyum iyiliği testlerinden biri olan Pearson ki-kare testi oluşturulmuştur.

Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.

χ2 (ki-kare) testi çeşitli dağılımların hipotezini test etmek için kullanılır. Bu onun onuru.

Kriterin hesaplama formülü eşittir

burada m ve m' sırasıyla ampirik ve teorik frekanslardır

Söz konusu dağıtım;

n serbestlik derecesinin sayısıdır.

Kontrol etmek için ampirik (gözlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.

Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşürse, S (E – T) = 0 ve χ2 kriteri de sıfıra eşit olacaktır. S (E – T) sıfıra eşit değilse, bu, hesaplanan frekanslar ile serinin ampirik frekansları arasında bir tutarsızlık olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen χ2 kriterinin anlamlılığının değerlendirilmesi gerekmektedir. Bu, χ2ф'nin gerçekte elde edilen değerini kritik değeriyle (χ2st) karşılaştırarak yapılır. Sıfır hipotezi, yani ampirik ve teorik veya beklenen frekanslar arasındaki tutarsızlığın rastgele olduğu varsayımı, χ2ф'nin bundan büyük veya ona eşit olması durumunda reddedilir. Kabul edilen anlamlılık düzeyi (a) ve serbestlik derecesi sayısı (n) için χ2.

Biyolojik olayların nicel olarak incelenmesi, zorunlu olarak bu olguları açıklayacak hipotezlerin yaratılmasını gerektirir. Belirli bir hipotezi test etmek için bir dizi özel deney gerçekleştirilir ve elde edilen gerçek veriler, bu hipoteze göre teorik olarak beklenen verilerle karşılaştırılır. Eğer bir tesadüf varsa bu hipotezi kabul etmek için yeterli bir neden olabilir. Deneysel veriler teorik olarak beklenenlerle iyi bir şekilde uyuşmuyorsa, önerilen hipotezin doğruluğu konusunda büyük şüpheler ortaya çıkar.

Gerçek verilerin beklenene (varsayımsal) karşılık gelme derecesi ki-kare testiyle ölçülür:

- özelliğin gerçek gözlemlenen değeri Ben- Belirli bir grup için teorik olarak beklenen sayı veya işaret (gösterge), k-veri grubu sayısı.

Kriter 1900 yılında K. Pearson tarafından önerilmiştir ve bazen Pearson kriteri olarak da adlandırılmaktadır.

Görev. Bir ebeveynden bir faktörü, diğerinden bir faktörü miras alan 164 çocuk arasında, faktöre sahip 46 çocuk, faktöre sahip 50 çocuk ve her ikisine de sahip olan 68 çocuk vardı. Gruplar arasında 1:2:1 oranı için beklenen frekansları hesaplayın ve Pearson testini kullanarak ampirik verilerin uyum derecesini belirleyin.

Çözüm: Gözlemlenen frekansların oranı 46:68:50 olup, teorik olarak beklenen oran 41:82:41'dir.

Anlamlılık düzeyini 0,05 olarak ayarlayalım. Serbestlik derecesi sayısının eşit olduğu bu anlamlılık düzeyi için Pearson kriterinin tablo değeri 5,99 olarak bulunmuştur. Bu nedenle deneysel verilerin teorik verilere uygunluğuna ilişkin hipotez kabul edilebilir, çünkü .

Ki-kare testini hesaplarken artık dağılımın vazgeçilmez normalliği için koşullar belirlemediğimizi unutmayın. Ki-kare testi, varsayımlarımızda seçmekte özgür olduğumuz tüm dağılımlar için kullanılabilir. Bu kriterin bir miktar evrenselliği vardır.

Pearson testinin bir başka uygulaması da ampirik dağılımı Gauss normal dağılımıyla karşılaştırmaktır. Ayrıca dağılımın normalliğini kontrol etmek için kullanılan bir grup kriter olarak da sınıflandırılabilir. Tek sınırlama, bu kriteri kullanırken toplam değer (seçenek) sayısının yeterince büyük (en az 40) olması ve bireysel sınıflardaki (aralıklardaki) değer sayısının en az 5 olması gerektiğidir. Aksi halde bitişik aralıklar birleştirilmelidir. Dağılımın normalliği kontrol edilirken serbestlik derecesi sayısı şu şekilde hesaplanmalıdır:.

    1. Fisher kriteri.

Bu parametrik test, normal dağılım gösteren popülasyonların varyanslarının eşit olduğuna ilişkin sıfır hipotezini test etmek için kullanılır.

Veya.

Küçük örneklem büyüklüklerinde Öğrenci testinin kullanımı ancak varyansların eşit olması durumunda doğru olabilir. Bu nedenle örneklem ortalamalarının eşitliğini test etmeden önce, Öğrenci t testinin kullanımının geçerliliğinin sağlanması gerekmektedir.

Nerede N 1 , N 2 numune boyutları, 1 , 2 bu numuneler için serbestlik derecesi sayısı.

Tabloları kullanırken serbestlik derecesi sayısının daha büyük dağılıma sahip bir örnek için tablo sütun numarası, daha küçük bir dağılım için ise tablo satır numarası olarak seçilmesine dikkat etmelisiniz.

Anlamlılık düzeyi  için tablo değerini matematiksel istatistik tablolarından buluruz. Eğer öyleyse, seçilen anlamlılık düzeyi için varyansların eşitliği hipotezi reddedilir.

Örnek. Kobaltın tavşanların vücut ağırlığı üzerindeki etkisi araştırıldı. Deney iki grup hayvan üzerinde gerçekleştirildi: deney ve kontrol. Deney deneklerine sulu bir kobalt klorür çözeltisi formunda bir diyet takviyesi verildi. Deney sırasında kilo artışı gram cinsindendi:

Kontrol

Ki-kare dağılımı

Normal dağılım kullanılarak, istatistiksel veri işlemede artık sıklıkla kullanılan üç dağılım tanımlanır. Bunlar Pearson (“ki-kare”), Öğrenci ve Fisher dağılımlarıdır.

Dağıtıma (“ki-kare”) odaklanacağız. Bu dağılım ilk olarak 1876'da gökbilimci F. Helmert tarafından incelenmiştir. Gauss hata teorisiyle bağlantılı olarak, n bağımsız, standart olarak normal dağılmış rastgele değişkenin karelerinin toplamlarını inceledi. Daha sonra Karl Pearson bu dağılım fonksiyonuna “ki-kare” adını verdi. Ve artık dağıtım onun adını taşıyor.

Normal dağılımla yakın bağlantısı nedeniyle h2 dağılımı olasılık teorisinde ve matematiksel istatistikte önemli bir rol oynar. h2 dağılımı ve h2 dağılımı tarafından belirlenen diğer birçok dağılım (örneğin, Öğrenci dağılımı), normal dağılmış gözlem sonuçlarından çeşitli fonksiyonların örnek dağılımlarını tanımlar ve güven aralıkları ve istatistiksel testler oluşturmak için kullanılır.

Pearson dağılımı (ki - kare) - X1, X2,..., Xn'nin normal bağımsız rastgele değişkenler olduğu ve her birinin matematiksel beklentisinin sıfır olduğu ve standart sapmanın bir olduğu bir rastgele değişkenin dağılımı.

Karelerin toplamı

yasaya göre dağıtılır (“ki - kare”).

Bu durumda terim sayısı, yani. n, ki-kare dağılımının "serbestlik derecesi sayısı" olarak adlandırılır. Serbestlik derecesi sayısı arttıkça dağılım yavaş yavaş normale yaklaşır.

Bu dağılımın yoğunluğu


Dolayısıyla, h2 dağılımı bir parametre n'ye - serbestlik derecesinin sayısına - bağlıdır.

Dağıtım fonksiyonu h2 şu şekildedir:

eğer h2?0 ise. (2.7.)

Şekil 1'de farklı serbestlik dereceleri için olasılık yoğunluğu ve h2 dağılım fonksiyonlarının grafiği gösterilmektedir.

Şekil 1 Farklı serbestlik derecesi sayıları için h2 (ki - kare) dağılımındaki olasılık yoğunluğunun q(x) bağımlılığı.

Ki-kare dağılımının momentleri:

Ki-kare dağılımı, varyansın tahmin edilmesinde (bir güven aralığı kullanılarak), öncelikle sınırlı sayıda değer alan niteliksel (kategorize edilmiş) değişkenler için anlaşma, homojenlik, bağımsızlık hipotezlerinin test edilmesinde ve istatistiksel veri analizinin diğer birçok görevinde kullanılır. .

İstatistiksel veri analizi problemlerinde "Ki-kare"

İstatistiksel veri analizi yöntemleri, insan faaliyetinin hemen hemen tüm alanlarında kullanılmaktadır. Bir miktar içsel heterojenliğe sahip bir grup (nesneler veya özneler) hakkında herhangi bir yargıyı elde etmek ve haklı çıkarmak gerektiğinde kullanılırlar.

İstatistiksel yöntemlerin modern gelişim aşaması, İngiliz K. Pearson'un "Biometrika" dergisini kurduğu 1900 yılından itibaren sayılabilir. Yirminci yüzyılın ilk üçte biri. parametrik istatistiklerin işareti altında geçti. Yöntemler, Pearson ailesi eğrileri tarafından tanımlanan parametrik dağılım ailelerinden elde edilen verilerin analizine dayanarak incelenmiştir. En popüler olanı normal dağılımdı. Hipotezleri test etmek için Pearson, Öğrenci ve Fisher testleri kullanıldı. Maksimum olabilirlik yöntemi ve varyans analizi önerildi ve deney planlamasının temel fikirleri formüle edildi.

Ki-kare dağılımı istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. Ki-kare dağılımına dayanarak, en güçlü uyum iyiliği testlerinden biri olan Pearson ki-kare testi oluşturulmuştur.

Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.

h2 testi ("ki-kare") çeşitli dağılımların hipotezini test etmek için kullanılır. Bu onun onuru.

Kriterin hesaplama formülü eşittir

burada m ve m" sırasıyla ampirik ve teorik frekanslardır

Söz konusu dağıtım;

n serbestlik derecesinin sayısıdır.

Kontrol etmek için ampirik (gözlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.

Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşürse, S (E - T) = 0 ve h2 kriteri de sıfıra eşit olacaktır. S (E - T) sıfıra eşit değilse, bu, hesaplanan frekanslar ile serinin ampirik frekansları arasında bir tutarsızlık olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen h2 kriterinin anlamlılığının değerlendirilmesi gerekmektedir. Bu, h2f'nin gerçek değerini kritik değeriyle (h2st) karşılaştırarak yapılır. Boş hipotez, yani ampirik ve teorik veya beklenen frekanslar arasındaki tutarsızlığın rastgele olduğu varsayımı, h2f'nin h2st'ye eşit veya büyük olması durumunda reddedilir. kabul edilen anlamlılık düzeyi (a) ve serbestlik derecesi sayısı (n) için.

Rastgele değişken h2'nin olası değerlerinin dağılımı sürekli ve asimetriktir. Serbestlik derecesi sayısına (n) bağlıdır ve gözlem sayısı arttıkça normal dağılıma yaklaşır. Bu nedenle h2 kriterinin ayrık dağılımların değerlendirilmesinde uygulanması, özellikle küçük örneklemlerde değerini etkileyen bazı hatalar ile ilişkilidir. Daha doğru tahminler elde etmek için varyasyon serisine dağıtılan numunenin en az 50 seçeneğe sahip olması gerekir. h2 kriterinin doğru uygulanması aynı zamanda ekstrem sınıflardaki varyantların frekanslarının 5'ten az olmamasını gerektirir; 5'ten az ise komşu sınıfların frekansları ile birleştirilir, böylece toplam miktar 5'ten büyük veya eşit olur. Frekansların birleşimine göre sınıf sayısı (N) azalır. Serbestlik derecesi sayısı, varyasyon özgürlüğü üzerindeki kısıtlamaların sayısı dikkate alınarak ikincil sınıf sayısına göre belirlenir.

h2 kriterini belirlemenin doğruluğu büyük ölçüde teorik frekansların (T) hesaplanmasının doğruluğuna bağlı olduğundan, ampirik ve hesaplanan frekanslar arasındaki farkı elde etmek için yuvarlatılmamış teorik frekanslar kullanılmalıdır.

Örnek olarak, istatistiksel yöntemlerin beşeri bilimlerde uygulanmasına adanmış bir web sitesinde yayınlanan bir çalışmayı ele alalım.

Ki-kare testi, normal dağılıp dağılmadığına bakılmaksızın frekans dağılımlarını karşılaştırmanıza olanak tanır.

Sıklık, bir olayın gerçekleşme sayısını ifade eder. Genellikle olayların meydana gelme sıklığı, değişkenler bir isim ölçeğinde ölçüldüğünde ve bunların sıklığın yanı sıra diğer özelliklerinin seçilmesi imkansız veya sorunlu olduğunda ele alınır. Başka bir deyişle, bir değişken niteliksel özelliklere sahip olduğunda. Ayrıca birçok araştırmacı, test puanlarını seviyelere (yüksek, ortalama, düşük) dönüştürme ve bu seviyelerdeki kişi sayısını bulmak için puan dağılım tabloları oluşturma eğilimindedir. Seviyelerden birinde (kategorilerden birinde) kişi sayısının gerçekten daha fazla (daha az) olduğunu kanıtlamak için Ki-kare katsayısı da kullanılır.

En basit örneğe bakalım.

Benlik saygısını belirlemek için genç ergenler arasında bir test yapıldı. Test puanları üç seviyeye dönüştürüldü: yüksek, orta ve düşük. Frekanslar şu şekilde dağıtıldı:

Yüksek (B) 27 kişi.

Ortalama (C) 12 kişi.

Düşük (L) 11 kişi

Çocukların çoğunluğunun özgüveninin yüksek olduğu açıktır ancak bunun istatistiksel olarak kanıtlanması gerekmektedir. Bunu yapmak için Ki-kare testini kullanıyoruz.

Görevimiz, elde edilen ampirik verilerin teorik olarak eşit derecede muhtemel olanlardan farklı olup olmadığını kontrol etmektir. Bunu yapmak için teorik frekansları bulmanız gerekir. Bizim durumumuzda teorik frekanslar, tüm frekansların toplanıp kategori sayısına bölünmesiyle bulunan eşit olasılıklı frekanslardır.

Bizim durumumuzda:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Ki-kare testini hesaplamak için formül:

h2 = ?(E - T)? / T

Masayı oluşturuyoruz:

Ampirik (E)

Teorik (T)

Son sütunun toplamını bulun:

Şimdi kritik değerler tablosunu kullanarak kriterin kritik değerini bulmanız gerekiyor (Ekteki Tablo 1). Bunu yapmak için serbestlik derecesi sayısına (n) ihtiyacımız var.

n = (R - 1) * (C - 1)

burada R, tablodaki satır sayısıdır, C ise sütun sayısıdır.

Bizim durumumuzda yalnızca bir sütun (orijinal ampirik frekanslar anlamına gelir) ve üç satır (kategoriler) vardır, dolayısıyla formül değişir; sütunları hariç tutarız.

n = (R - 1) = 3-1 = 2

Hata olasılığı p?0,05 ve n = 2 için kritik değer h2 = 5,99'dur.

Elde edilen ampirik değer kritik değerden daha büyüktür; frekanslardaki farklar önemlidir (h2 = 9,64; p? 0,05).

Gördüğünüz gibi kriterin hesaplanması çok basit ve fazla zaman almıyor. Ki-kare testinin pratik değeri çok büyüktür. Bu yöntem, anketlere verilen yanıtları analiz ederken çok değerlidir.

Daha karmaşık bir örneğe bakalım.

Örneğin bir psikolog, öğretmenlerin kızlardan ziyade erkeklere karşı daha önyargılı olduğunun doğru olup olmadığını bilmek istiyor. Onlar. kızları övme olasılıkları daha yüksektir. Bunu yapmak için psikolog, öğretmenler tarafından yazılan öğrencilerin özelliklerini üç kelimenin görülme sıklığı açısından analiz etti: "aktif", "çalışkan", "disiplinli" ve bu kelimelerin eşanlamlıları da sayıldı. Kelimelerin görülme sıklığına ilişkin veriler tabloya girilmiştir:

Elde edilen verileri işlemek için ki-kare testini kullanıyoruz.

Bunu yapmak için ampirik frekansların dağılım tablosunu oluşturacağız, yani. gözlemlediğimiz frekanslar:

Teorik olarak frekansların eşit şekilde dağıtılmasını bekliyoruz. sıklık kız ve erkek çocuklar arasında orantılı olarak dağıtılacaktır. Teorik frekansların bir tablosunu oluşturalım. Bunu yapmak için satır toplamını sütun toplamıyla çarpın ve elde edilen sayıyı toplam toplam (lar) a bölün.

Hesaplamalar için son tablo şöyle görünecektir:

h2 = ?(E - T)? / T

n = (R - 1), burada R, tablodaki satır sayısıdır.

Bizim durumumuzda ki-kare = 4,21; n = 2.

Kriterin kritik değerleri tablosunu kullanarak şunları buluyoruz: n = 2 ve 0,05 hata seviyesi ile kritik değer h2 = 5,99.

Ortaya çıkan değer kritik değerden küçüktür, bu da sıfır hipotezinin kabul edildiği anlamına gelir.

Sonuç: Öğretmenler çocuğun özelliklerini yazarken çocuğun cinsiyetine önem vermemektedir.

Başvuru

Kritik dağıtım noktaları h2

Ki-kare testi, bir deneyin sonuçları ile kullanılan istatistiksel model arasındaki uyumu kontrol etmek için kullanılan evrensel bir yöntemdir.

Pearson mesafesi X 2

Pyatnitsky A.M.

Rusya Devlet Tıp Üniversitesi

1900 yılında Karl Pearson, model tahminleri ile deneysel veriler arasındaki uyumu test etmek için basit, evrensel ve etkili bir yol önerdi. Önerdiği “ki-kare testi” istatistiksel testlerin en önemlisi ve en sık kullanılanıdır. Bilinmeyen model parametrelerinin tahmin edilmesi ve model ile deneysel veriler arasındaki uyumun kontrol edilmesiyle ilgili sorunların çoğu onun yardımıyla çözülebilir.

İncelenen nesnenin veya sürecin a priori (“deney öncesi”) bir modeli (istatistikte “sıfır hipotezi” H 0'dan söz edilir) ve bu nesneyle yapılan bir deneyin sonuçları olsun. Modelin yeterli olup olmadığına (gerçeğe uygun mu) karar verilmesi gerekiyor mu? Deneysel sonuçlar gerçekliğin nasıl çalıştığına dair fikirlerimizle çelişiyor mu, başka bir deyişle H0 reddedilmeli mi? Çoğunlukla bu görev, belirli olayların meydana gelme sıklıklarının modele (E i = Beklenen) göre gözlemlenen (O i = Gözlenen) ve beklenenin karşılaştırılmasına indirgenebilir. Gözlemlenen frekansların, sabit (!) koşullar altında yapılan bir dizi bağımsız (!) gözlemden elde edildiğine inanılmaktadır. Her gözlem sonucunda M olayından biri kaydedilir. Bu olaylar aynı anda gerçekleşemez (çiftler halinde uyumsuzdurlar) ve mutlaka biri meydana gelir (bunların birleşimi güvenilir bir olay oluşturur). Tüm gözlemlerin toplamı, deneyin sonuçlarını tamamen açıklayan (O i )=(O 1 ,… O M ) frekanslarının bir tablosuna (vektörüne) indirgenir. O 2 =4 değeri 2 numaralı olayın 4 kez meydana geldiği anlamına gelir. Frekansların toplamı O 1 +… O M =N. İki durumu birbirinden ayırmak önemlidir: N – sabit, rastgele olmayan, N – rastgele değişken. Sabit toplam deney sayısı N için, frekanslar bir polinom dağılımına sahiptir. Bu genel şemayı basit bir örnekle açıklayalım.

Basit hipotezleri test etmek için ki-kare testinin kullanılması.

Model (sıfır hipotezi H 0) zarın adil olduğunu varsayalım - p i =1/6, i =, M=6 olasılığıyla tüm yüzler eşit sıklıkta görünür. Zarın 60 kez atıldığı bir deney yapıldı (N = 60 bağımsız deneme yapıldı). Modele göre, 1,2,... 6 noktalarında gözlemlenen tüm O i frekanslarının ortalama değerlerine E i =Np i =60∙(1/6)=10 yakın olmasını bekliyoruz. H 0'a göre ortalama frekansların vektörü (E i )=(Np i )=(10, 10, 10, 10, 10, 10). (Deneyin başlangıcından önce ortalama frekansların tamamen bilindiği hipotezlere basit denir.) Gözlemlenen vektör (O i ) (34,0,0,0,0,26)'ya eşitse, o zaman hemen modelin yanlış olduğu açıktır - yalnızca 1 ve 6 60 kez atıldığı için kemik doğru olamaz Doğru zar için böyle bir olayın olasılığı ihmal edilebilir: P = (2/6) 60 =2,4*10 -29. Ancak model ile deneyim arasında bu kadar bariz farklılıkların ortaya çıkması bir istisnadır. Gözlemlenen frekansların vektörü (Oi), (5, 15, 6, 14, 4, 16)'ya eşit olsun. Bu H0 ile tutarlı mı? Bu nedenle iki frekans vektörünü (E i) ve (O i) karşılaştırmamız gerekir. Bu durumda, beklenen frekansların vektörü (Ei) rastgele değildir, ancak gözlemlenen frekansların vektörü (Oi) rastgeledir - bir sonraki deney sırasında (60 atışlık yeni bir seride) farklı olduğu ortaya çıkacaktır. Sorunun geometrik bir yorumunu ortaya koymak ve frekans uzayında (bu durumda 6 boyutlu) iki noktanın (5, 15, 6, 14, 4, 16) ve (10, 10, 10, 10, 10, 10). Bunun H 0 ile uyumsuz olduğunu düşünecek kadar birbirlerinden uzaktalar mı? Başka bir deyişle ihtiyacımız var:

  1. Frekanslar arasındaki mesafeleri (frekans uzayındaki noktalar) ölçmeyi öğrenin,
  2. Hangi mesafenin çok (“inanılmaz derecede”) büyük, yani H 0 ile tutarsız olarak kabul edilmesi gerektiğine dair bir kriterimiz var.

Sıradan Öklid mesafesinin karesi şuna eşit olacaktır:

X 2 Öklid = S(O ben -E i) 2 = (5-10) 2 +(15-10) 2 + (6-10) 2 +(14-10) 2 +(4-10) 2 +(16-10) 2

Bu durumda, E i değerlerini sabitleyip O i değiştirirsek, X 2 Öklid = const yüzeyleri her zaman küre olur. Karl Pearson, frekans uzayında Öklid mesafesinin kullanılmaması gerektiğini kaydetti. Bu nedenle, (O = 1030 ve E = 1000) ve (O = 40 ve E = 10) noktalarının birbirinden eşit uzaklıkta olduğunu varsaymak yanlıştır, ancak her iki durumda da fark O -E = 30'dur. Sonuçta, beklenen frekans ne kadar yüksek olursa, bundan daha büyük sapmaların da mümkün olduğu düşünülmelidir. Bu nedenle (O =1030 ve E =1000) noktaları birbirine “yakın”, (O =40 ve E =10) noktaları ise “uzak” kabul edilmelidir. Eğer H 0 hipotezi doğruysa, o zaman E i'ye göre O i frekans dalgalanmalarının E i'nin karekökü(!) mertebesinde olduğu gösterilebilir. Bu nedenle Pearson, mesafeyi hesaplarken farkların (O i -E i) değil, normalleştirilmiş farkların (O i -E i)/E i 1/2'nin karesini almayı önerdi. İşte Pearson mesafesini hesaplamak için formül: (aslında mesafenin karesidir):

X 2 Pearson = S((O i -E ben )/E ben 1/2) 2 = S(O i -E i ) 2 /E i

Örneğimizde:

X 2 Pearson = (5-10) 2 /10+(15-10) 2 /10 +(6-10) 2 /10+(14-10) 2 /10+(4-10) 2 /10+( 16-10) 2 /10=15,4

Düzenli bir kalıp için, beklenen tüm Ei frekansları aynıdır, ancak genellikle farklıdırlar, dolayısıyla Pearson mesafesinin sabit olduğu (X 2 Pearson = sabit) yüzeylerin küre değil elipsoid olduğu ortaya çıkar.

Artık mesafeleri hesaplama formülü seçildiğine göre, hangi mesafelerin “çok büyük” sayılmaması gerektiğini (H 0 ile tutarlı) bulmak gerekir. Yani örneğin 15.4 olarak hesapladığımız mesafe hakkında ne söyleyebiliriz? ? Normal bir kalıpla deneyler yaparken, vakaların yüzde kaçında (veya hangi olasılıkla) 15,4'ten daha büyük bir mesafe elde ederiz? Bu yüzde küçükse (<0.05), то H 0 надо отвергнуть. Иными словами требуется найти распределение длярасстояния Пирсона. Если все ожидаемые частоты E i не слишком малы (≥5), и верна H 0 , то нормированные разности (O i - E i )/E i 1/2 приближенно эквивалентны стандартным гауссовским случайным величинам: (O i - E i )/E i 1/2 ≈N (0,1). Это, например, означает, что в 95% случаев| (O i - E i )/E i 1/2 | < 1.96 ≈ 2 (правило “двух сигм”).

Açıklama. Tablo hücresine i sayısıyla düşen O i ölçümlerinin sayısı, şu parametrelerle binom dağılıma sahiptir: m =Np i =E i,σ =(Np i (1-p i)) 1/2, burada N sayıdır ölçüm sayısı (N "1), pi, bir ölçümün belirli bir hücreye düşme olasılığıdır (ölçümlerin bağımsız olduğunu ve sabit koşullar altında gerçekleştirildiğini hatırlayın). Eğer p i küçükse, o zaman: σ≈(Np i ) 1/2 =E i ve binom dağılımı Poisson'a yakındır, burada ortalama gözlem sayısı E i =λ ve standart sapma σ=λ 1/2 = E ben 1/2. λ≥5 için Poisson dağılımı normal N'ye yakındır (m =E i =λ, σ=E i 1/2 =λ 1/2) ve normalleştirilmiş değer (O i - E i )/E i 1 /2 ≈ N(0 ,1).

Pearson rastgele değişkeni χ 2 n – “n serbestlik derecesine sahip ki-kare”yi, n bağımsız standart normal rastgele değişkenin karelerinin toplamı olarak tanımladı:

χ 2 n = T 1 2 + T 2 2 + …+ T n 2 , herkes nerede T ben = N(0,1) - N. Ö. R. İle. V.

İstatistiklerdeki bu en önemli rastgele değişkenin anlamını net bir şekilde anlamaya çalışalım. Bunu yapmak için, düzlemde (n = 2 ile) veya uzayda (n = 3 ile) koordinatları bağımsız ve standart normal dağılıma sahip olan bir nokta bulutu sunuyoruzf T (x) ~exp (-x 2 /2) ). Bir düzlemde, her iki koordinata da bağımsız olarak uygulanan “iki sigma” kuralına göre, noktaların %90'ı (0,95*0,95≈0,90) bir karenin (-2) içinde bulunur.

f χ 2 2 (a) = Сexp(-a/2) = 0,5exp(-a/2).

Yeterince büyük sayıda serbestlik derecesi n (n > 30) ile ki-kare dağılımı normale yaklaşır: N (m = n; σ = (2n) ½). Bu, “merkezi limit teoreminin” bir sonucudur: sonlu varyansa sahip, aynı şekilde dağılmış büyüklüklerin toplamı, terim sayısı arttıkça normal yasaya yaklaşır.

Pratikte, mesafenin ortalama karesinin m (χ 2 n) = n'ye eşit olduğunu ve varyansının σ 2 (χ 2 n) = 2n olduğunu hatırlamanız gerekir. Buradan hangi ki-kare değerlerinin çok küçük ve çok büyük sayılması gerektiği sonucuna varmak kolaydır: dağılımın çoğu n -2∙(2n) ½ ila n +2∙(2n) ½ aralığındadır.

Bu nedenle, n +2∙ (2n) ½'yi önemli ölçüde aşan Pearson mesafelerinin inanılmaz derecede büyük olduğu kabul edilmelidir (H 0 ile tutarsızdır). Sonuç n +2∙(2n) ½'ye yakınsa, bu tür ve büyük ki-kare değerlerinin hangi durumlarda görünebileceğini tam olarak bulabileceğiniz tabloları kullanmalısınız.

Serbestlik derecesi sayısı (kısaltılmış n.d.f.) için doğru değerin nasıl seçileceğini bilmek önemlidir. N'nin basamak sayısına eşit olduğunu varsaymak doğal görünüyordu: n =M. Pearson makalesinde bunu önerdi. Zar örneğinde bu, n =6 anlamına gelir. Ancak birkaç yıl sonra Pearson'un yanıldığı ortaya çıktı. O i rastgele değişkenleri arasında bağlantılar varsa, serbestlik derecesi sayısı her zaman basamak sayısından azdır. Zar örneğinde, O i toplamı 60'tır ve yalnızca 5 frekans bağımsız olarak değiştirilebilir, dolayısıyla doğru değer n = 6-1 = 5'tir. Bu n değeri için n +2∙(2n) ½ =5+2∙(10) ½ =11,3 elde ederiz. 15.4>11.3 olduğundan H 0 - zarın doğru olduğu hipotezi reddedilmelidir.

Hatayı açıklığa kavuşturduktan sonra, en küçük rakam sayısı = 2 olduğundan başlangıçta n = 1 durumu olmadığından mevcut χ 2 tablolarının desteklenmesi gerekiyordu. Şimdi Pearson mesafesinin χ 2 n =1 dağılımına sahip olduğu durumların olabileceği ortaya çıktı.

Örnek. 100 yazı tura atıldığında tura sayısı O 1 = 65, yazı tura sayısı O 2 = 35 olur. Rakam sayısı M = 2'dir. Madeni para simetrikse beklenen frekanslar E 1 =50, E 2 =50 olur.

X 2 Pearson = S(O i -E i) 2 /E i = (65-50) 2 /50 + (35-50) 2 /50 = 2*225/50 = 9.

Ortaya çıkan değer, standart normal değer χ 2 n =1 =T 1 2 ≥ 9'un karesi olarak tanımlanan rastgele değişken χ 2 n =1'in alabileceği değerlerle karşılaştırılmalıdır. ó T 1 ≥3 veya T 1 ≤-3. Böyle bir olayın olasılığı çok düşüktür P (χ 2 n =1 ≥9) = 0,006. Bu nedenle madeni paranın simetrik olduğu düşünülemez: H 0 reddedilmelidir. Serbestlik derecesi sayısının basamak sayısına eşit olamayacağı gerçeği, gözlenen frekansların toplamının her zaman beklenenlerin toplamına eşit olmasından açıkça anlaşılmaktadır, örneğin O 1 +O 2 =65+ 35 = E 1 +E 2 =50+50=100. Bu nedenle, O 1 ve O 2 koordinatlarına sahip rastgele noktalar düz bir çizgi üzerinde bulunur: O 1 +O 2 =E 1 +E 2 =100 ve merkeze olan mesafe, bu kısıtlamanın olmadığı duruma göre daha az olur ve uçağın tamamında bulunuyorlardı. Aslında, matematiksel beklentileri E 1 =50, E 2 =50 olan iki bağımsız rastgele değişken için bunların gerçekleşmelerinin toplamı her zaman 100'e eşit olmamalıdır - örneğin, O 1 =60, O 2 =55 değerleri kabul edilebilir olsun.

Açıklama. Pearson kriterinin M = 2'deki sonucunu, N bağımsız Bernoulli testlerinden oluşan bir dizide p olasılığına sahip ν =K /N olayının meydana gelme sıklığındaki rastgele dalgalanmaları tahmin ederken Moivre-Laplace formülünün verdiği sonuçla karşılaştıralım ( K, başarıların sayısıdır):

χ 2 n =1 = S(O ben -E i) 2 /E ben = (O 1 -E 1) 2 /E 1 + (O 2 -E 2) 2 /E 2 = (Nν -Np) 2 /(Np) + (N ( 1-ν )-N (1-p)) 2 /(N (1-p ))=

=(Nν-Np) 2 (1/p + 1/(1-p))/N=(Nν-Np) 2 /(Np(1-p))=((K-Np)/(Npq) ½ ) 2 = T2

Değer T =(K -Np)/(Npq) ½ = (K -m (K))/σ(K) ≈N (0,1), σ(K)=(Npq) ½ ≥3. Bu durumda Pearson sonucunun binom dağılımı için normal yaklaşımın verdiği sonuçla tam olarak örtüştüğünü görüyoruz.

Şu ana kadar beklenen ortalama Ei frekanslarının tamamen önceden bilindiği basit hipotezleri değerlendirdik. Karmaşık hipotezler için doğru sayıda serbestlik derecesinin nasıl seçileceğine ilişkin bilgi için aşağıya bakın.

Karmaşık hipotezleri test etmek için ki-kare testini kullanma

Düzenli zar ve madeni paranın kullanıldığı örneklerde beklenen frekanslar deney öncesinde(!) belirlenebilmektedir. Bu tür hipotezlere “basit” denir. Uygulamada “karmaşık hipotezler” daha yaygındır. Ayrıca, beklenen E i frekanslarını bulmak için öncelikle bir veya birkaç miktarın (model parametreleri) tahmin edilmesi gerekir ve bu yalnızca deneysel veriler kullanılarak yapılabilir. Sonuç olarak, "karmaşık hipotezler" için beklenen Ei frekanslarının, gözlemlenen Oi frekanslarına bağlı olduğu ve dolayısıyla deneyin sonuçlarına bağlı olarak değişen rastgele değişkenler haline geldiği ortaya çıkar. Parametrelerin seçilmesi sürecinde Pearson mesafesi azalır; parametreler, model ile deney arasındaki uyumu iyileştirecek şekilde seçilir. Bu nedenle serbestlik derecesi sayısının azalması gerekir.

Model parametreleri nasıl tahmin edilir? Pek çok farklı tahmin yöntemi vardır; “maksimum olabilirlik yöntemi”, “momentler yöntemi”, “ikame yöntemi”. Ancak Pearson mesafesini en aza indirerek herhangi bir ek fon kullanamaz ve parametre tahminleri bulamazsınız. Bilgisayar öncesi dönemde bu yaklaşım nadiren kullanılıyordu: manuel hesaplamalar için uygun değildir ve kural olarak analitik olarak çözülemez. Bilgisayarda hesaplama yaparken sayısal minimizasyonun gerçekleştirilmesi genellikle kolaydır ve bu yöntemin avantajı çok yönlülüğüdür. Yani "ki-kare minimizasyon yöntemine" göre bilinmeyen parametrelerin değerlerini Pearson mesafesi en küçük olacak şekilde seçiyoruz. (Bu arada, bulunan minimuma göre küçük yer değiştirmelerle bu mesafedeki değişiklikleri inceleyerek, tahminin doğruluğunun ölçüsünü tahmin edebilirsiniz: güven aralıkları oluşturun.) Parametreler ve bu minimum mesafenin kendisi bulunduktan sonra, Yeterince küçük mü sorusunun cevabını bir kez daha vermek gerekiyor.

Genel eylem sırası aşağıdaki gibidir:

  1. Model seçimi (hipotez H 0).
  2. Bitlerin seçimi ve gözlemlenen Oi frekanslarının vektörünün belirlenmesi.
  3. Bilinmeyen model parametrelerinin tahmini ve bunlar için güven aralıklarının oluşturulması (örneğin, minimum Pearson mesafesini arayarak).
  4. Beklenen frekansların hesaplanması E i .
  5. Pearson mesafesi X 2'nin bulunan değerinin, ki-kare χ 2 kritik değeri ile karşılaştırılması - hala makul kabul edilen en büyüğü, H 0 ile uyumludur. Denklemi çözerek tablolardan χ 2 kritik değerini buluyoruz

P (χ 2 n > χ 2 kritik) = 1-α,

burada α “önem düzeyi” veya “kriterin büyüklüğü” veya “ilk tip hatanın büyüklüğü”dür (tipik değer α = 0,05).

Genellikle serbestlik derecesi sayısı n aşağıdaki formül kullanılarak hesaplanır

n = (hane sayısı) – 1 – (tahmin edilecek parametre sayısı)

X 2 > χ 2 kritiği ise H 0 hipotezi reddedilir, aksi takdirde kabul edilir. Vakaların α∙%100'ünde (yani oldukça nadiren), H 0'ı kontrol etmenin bu yöntemi "birinci tür hataya" yol açacaktır: H 0 hipotezi hatalı bir şekilde reddedilecektir.

Örnek. 100 tohumluk 10 seri incelenirken yeşil gözlü sinekle enfekte olanların sayısı sayıldı. Alınan veriler: O ben =(16, 18, 11, 18, 21, 10, 20, 18, 17, 21);

Burada beklenen frekansların vektörü önceden bilinmemektedir. Veriler homojense ve binom dağılımı için elde edilmişse, o zaman bir parametre bilinmiyor: enfekte tohumların oranı p. Orijinal tabloda aslında 10 bağlantıyı karşılayan 10 değil 20 frekans bulunduğunu unutmayın: 16+84=100, ... 21+79=100.

X 2 = (16-100p) 2 /100p +(84-100(1-p)) 2 /(100(1-p))+…+

(21-100p) 2 /100p +(79-100(1-p)) 2 /(100(1-p))

Terimleri çiftler halinde birleştirerek (örnekte madeni parayla olduğu gibi), genellikle hemen yazılan Pearson kriteri yazma biçimini elde ederiz:

X 2 = (16-100p) 2 /(100p(1-p))+…+ (21-100p) 2 /(100p(1-p)).

Şimdi, eğer p'yi tahmin etmek için minimum Pearson mesafesi bir yöntem olarak kullanılıyorsa, o zaman X 2 = min olan bir p bulmak gerekir. (Model mümkünse deneysel verilere "ayarlamaya" çalışır.)

Pearson kriteri istatistikte kullanılanların en evrenselidir. Tek değişkenli ve çok değişkenli verilere, niceliksel ve niteliksel özelliklere uygulanabilir. Ancak tam da çok yönlülüğü nedeniyle hata yapmamaya dikkat edilmelidir.

Önemli noktalar

1.Kategori seçimi.

  • Dağılım ayrıksa, rakam seçiminde genellikle keyfilik olmaz.
  • Dağıtım sürekli ise keyfilik kaçınılmazdır. İstatistiksel olarak eşdeğer bloklar kullanılabilir (tüm O'lar aynıdır, örneğin =10). Ancak aralıkların uzunlukları farklıdır. Manuel hesaplamalar yaparken aralıkları aynı yapmaya çalıştılar. Tek değişkenli bir özelliğin dağılımını incelerken aralıklar eşit mi olmalı? HAYIR.
  • Rakamlar, beklenen (gözlenmeyen!) frekanslar çok küçük olmayacak (≥5) olacak şekilde birleştirilmelidir. X 2'yi hesaplarken paydalarda bulunanların (E i) olduğunu hatırlayalım! Tek boyutlu karakteristikleri analiz ederken, bu kuralın iki uç rakam olan E 1 =E max =1'de ihlal edilmesine izin verilir. Eğer basamak sayısı büyükse ve beklenen frekanslar yakınsa, o zaman X 2, E i =2 için bile χ 2'ye iyi bir yaklaşımdır.

Parametre Tahmini. "Ev yapımı" verimsiz tahmin yöntemlerinin kullanılması Pearson mesafe değerlerinin şişirilmesine yol açabilir.

Doğru sayıda serbestlik derecesinin seçilmesi. Parametre tahminleri frekanslardan değil doğrudan verilerden yapılıyorsa (örneğin, aritmetik ortalama ortalamanın tahmini olarak alınır), o zaman n serbestlik derecesinin tam sayısı bilinmemektedir. Sadece eşitsizliği karşıladığını biliyoruz:

(basamak sayısı – 1 – değerlendirilen parametre sayısı)< n < (число разрядов – 1)

Bu nedenle, X2'yi bu n aralığı boyunca hesaplanan kritik χ2 kritik değerleriyle karşılaştırmak gerekir.

İnanılmaz derecede küçük ki-kare değerleri nasıl yorumlanır? Bir madeni para 10.000 kez atıldıktan sonra 5.000 kez armanın üzerine düşüyorsa simetrik mi kabul edilmeli? Daha önce birçok istatistikçi H 0'ın da reddedilmesi gerektiğine inanıyordu. Şimdi başka bir yaklaşım öneriliyor: H 0'ı kabul edin, ancak verileri ve bunların analizine yönelik metodolojiyi ek doğrulamaya tabi tutun. İki olasılık vardır: ya çok küçük bir Pearson mesafesi, model parametrelerinin sayısındaki artışın serbestlik derecesi sayısında uygun bir azalmaya eşlik etmediği ya da verilerin kendisinin tahrif edildiği (belki de kasıtsız olarak beklenen sonuca göre ayarlandığı) anlamına gelir.

Örnek.İki araştırmacı A ve B, bir AA * aa monohibrit çaprazının ikinci neslindeki resesif homozigot aa oranını hesapladı. Mendel kanunlarına göre bu kesir 0,25'tir. Her araştırmacı 5 deney gerçekleştirdi ve her deneyde 100 organizma incelendi.

Sonuçlar A: 25, 24, 26, 25, 24. Araştırmacının sonucu: Mendel yasası doğrudur(?).

Sonuçlar B: 29, 21, 23, 30, 19. Araştırmacının sonucu: Mendel yasası adil değil(?).

Ancak Mendel yasası istatistiksel niteliktedir ve sonuçların niceliksel analizi sonuçları tersine çevirir! Beş deneyi bir deneyde birleştirerek 5 serbestlik derecesine sahip bir ki-kare dağılımına ulaşıyoruz (basit bir hipotez test edilmiştir):

X 2 A = ((25-25) 2 +(24-25) 2 +(26-25) 2 +(25-25) 2 +(24-25) 2)/(100∙0,25∙0,75)=0,16

X 2 B = ((29-25) 2 +(21-25) 2 +(23-25) 2 +(30-25) 2 +(19-25) 2)/(100∙0,25∙0,75)=5,17

Ortalama değer m [χ 2 n =5 ]=5, standart sapma σ[χ 2 n =5 ]=(2∙5) 1/2 =3,2.

Bu nedenle, tablolara atıfta bulunmadan, X 2 B değerinin tipik olduğu ve X 2 A değerinin inanılmaz derecede küçük olduğu açıktır. Tablolara göre P (χ 2 n =5<0.16)<0.0001.

Bu örnek, 1930'larda meydana gelen gerçek bir vakanın uyarlamasıdır (bkz. Kolmogorov'un "Mendel Kanunlarının Başka Bir Kanıtı Üzerine" adlı çalışması). İlginç bir şekilde, Araştırmacı A genetiğin savunucusuydu, Araştırmacı B ise buna karşıydı.

Notasyonda karışıklık. Hesaplanmasında ek kurallar gerektiren Pearson mesafesini ki-kare rastgele değişkeninin matematiksel kavramından ayırmak gerekir. Belirli koşullar altında Pearson mesafesi, n serbestlik derecesine sahip ki-kare'ye yakın bir dağılıma sahiptir. Bu nedenle, Pearson uzaklığının χ 2 n sembolüyle GÖSTERİLMESİ DEĞİL, benzer ancak farklı bir X 2 gösteriminin kullanılması tavsiye edilir.

Pearson kriteri her şeye kadir değildir. H 0 için hesaba katamayacağı sonsuz sayıda alternatif vardır. Özelliğin düzgün bir dağılıma sahip olduğu, 10 basamağınız olduğu ve gözlemlenen frekansların vektörünün (130,125,121,118,116,115,114,113,111,110) değerine eşit olduğu hipotezini test ettiğinizi varsayalım. Pearson kriteri frekansların monoton bir şekilde azaldığını ve H 0'ın reddedilmeyeceğini "fark edemez". Bir seri kriteri ile desteklenmişse evet!

Ki-kare dağılımı istatistiksel hipotezleri test etmek için istatistikte en yaygın kullanılanlardan biridir. Ki-kare dağılımına dayanarak, en güçlü uyum iyiliği testlerinden biri olan Pearson ki-kare testi oluşturulmuştur.

Anlaşma kriteri, bilinmeyen bir dağılımın varsayılan yasası hakkındaki hipotezi test etme kriteridir.

χ2 (ki-kare) testi çeşitli dağılımların hipotezini test etmek için kullanılır. Bu onun onuru.

Kriterin hesaplama formülü eşittir

burada m ve m' sırasıyla ampirik ve teorik frekanslardır

Söz konusu dağıtım;

n serbestlik derecesinin sayısıdır.

Kontrol etmek için ampirik (gözlenen) ve teorik (normal dağılım varsayımı altında hesaplanan) frekansları karşılaştırmamız gerekir.

Ampirik frekanslar, hesaplanan veya beklenen frekanslarla tamamen örtüşürse, S (E – T) = 0 ve χ2 kriteri de sıfıra eşit olacaktır. S (E – T) sıfıra eşit değilse, bu, hesaplanan frekanslar ile serinin ampirik frekansları arasında bir tutarsızlık olduğunu gösterecektir. Bu gibi durumlarda teorik olarak sıfırdan sonsuza kadar değişebilen χ2 kriterinin anlamlılığının değerlendirilmesi gerekmektedir. Bu, χ2ф'nin gerçekte elde edilen değerini kritik değeriyle (χ2st) karşılaştırarak yapılır. Sıfır hipotezi, yani ampirik ve teorik veya beklenen frekanslar arasındaki tutarsızlığın rastgele olduğu varsayımı, χ2ф'nin bundan büyük veya ona eşit olması durumunda reddedilir. Kabul edilen anlamlılık düzeyi (a) ve serbestlik derecesi sayısı (n) için χ2.

Rastgele değişken χ2'nin olası değerlerinin dağılımı sürekli ve asimetriktir. Serbestlik derecesi sayısına (n) bağlıdır ve gözlem sayısı arttıkça normal dağılıma yaklaşır. Bu nedenle χ2 kriterinin ayrık dağılımların değerlendirilmesinde uygulanması, özellikle küçük örneklemlerde değerini etkileyen bazı hatalarla ilişkilidir. Daha doğru tahminler elde etmek için varyasyon serisine dağıtılan numunenin en az 50 seçeneğe sahip olması gerekir. χ2 kriterinin doğru uygulanması aynı zamanda uç sınıflardaki değişkenlerin frekanslarının 5'ten az olmamasını da gerektirir; 5'ten az ise komşu sınıfların frekansları ile birleştirilir, böylece toplam miktar 5'ten büyük veya eşit olur. Frekansların birleşimine göre sınıf sayısı (N) azalır. Serbestlik derecesi sayısı, varyasyon özgürlüğü üzerindeki kısıtlamaların sayısı dikkate alınarak ikincil sınıf sayısına göre belirlenir.



χ2 kriterini belirlemenin doğruluğu büyük ölçüde teorik frekansların (T) hesaplanmasının doğruluğuna bağlı olduğundan, ampirik ve hesaplanan frekanslar arasındaki farkı elde etmek için yuvarlatılmamış teorik frekanslar kullanılmalıdır.

Örnek olarak, istatistiksel yöntemlerin beşeri bilimlerde uygulanmasına adanmış bir web sitesinde yayınlanan bir çalışmayı ele alalım.

Ki-kare testi, normal dağılıp dağılmadığına bakılmaksızın frekans dağılımlarını karşılaştırmanıza olanak tanır.

Sıklık, bir olayın gerçekleşme sayısını ifade eder. Genellikle olayların meydana gelme sıklığı, değişkenler bir isim ölçeğinde ölçüldüğünde ve bunların sıklığın yanı sıra diğer özelliklerinin seçilmesi imkansız veya sorunlu olduğunda ele alınır. Başka bir deyişle, bir değişken niteliksel özelliklere sahip olduğunda. Ayrıca birçok araştırmacı, test puanlarını seviyelere (yüksek, ortalama, düşük) dönüştürme ve bu seviyelerdeki kişi sayısını bulmak için puan dağılım tabloları oluşturma eğilimindedir. Seviyelerden birinde (kategorilerden birinde) kişi sayısının gerçekten daha fazla (daha az) olduğunu kanıtlamak için Ki-kare katsayısı da kullanılır.

En basit örneğe bakalım.

Benlik saygısını belirlemek için genç ergenler arasında bir test yapıldı. Test puanları üç seviyeye dönüştürüldü: yüksek, orta ve düşük. Frekanslar şu şekilde dağıtıldı:

Yüksek (B) 27 kişi.

Ortalama (C) 12 kişi.

Düşük (L) 11 kişi

Çocukların çoğunluğunun özgüveninin yüksek olduğu açıktır ancak bunun istatistiksel olarak kanıtlanması gerekmektedir. Bunu yapmak için Ki-kare testini kullanıyoruz.

Görevimiz, elde edilen ampirik verilerin teorik olarak eşit derecede muhtemel olanlardan farklı olup olmadığını kontrol etmektir. Bunu yapmak için teorik frekansları bulmanız gerekir. Bizim durumumuzda teorik frekanslar, tüm frekansların toplanıp kategori sayısına bölünmesiyle bulunan eşit olasılıklı frekanslardır.

Bizim durumumuzda:

(B + C + H)/3 = (27+12+11)/3 = 16,6

Ki-kare testini hesaplamak için formül:

χ2 = ∑(E - T)I / T

Masayı oluşturuyoruz:

Son sütunun toplamını bulun:

Şimdi kritik değerler tablosunu kullanarak kriterin kritik değerini bulmanız gerekiyor (Ekteki Tablo 1). Bunu yapmak için serbestlik derecesi sayısına (n) ihtiyacımız var.

n = (R - 1) * (C - 1)

burada R, tablodaki satır sayısıdır, C ise sütun sayısıdır.

Bizim durumumuzda yalnızca bir sütun (orijinal ampirik frekanslar anlamına gelir) ve üç satır (kategoriler) vardır, dolayısıyla formül değişir; sütunları hariç tutarız.

n = (R - 1) = 3-1 = 2

Hata olasılığı p≤0,05 ve n = 2 için kritik değer χ2 = 5,99'dur.

Elde edilen ampirik değer kritik değerden daha büyüktür; frekanslardaki farklar önemlidir (χ2= 9,64; p≤0,05).

Gördüğünüz gibi kriterin hesaplanması çok basit ve fazla zaman almıyor. Ki-kare testinin pratik değeri çok büyüktür. Bu yöntem, anketlere verilen yanıtları analiz ederken çok değerlidir.


Daha karmaşık bir örneğe bakalım.

Örneğin bir psikolog, öğretmenlerin kızlardan ziyade erkeklere karşı daha önyargılı olduğunun doğru olup olmadığını bilmek istiyor. Onlar. kızları övme olasılıkları daha yüksektir. Bunu yapmak için psikolog, öğretmenler tarafından yazılan öğrencilerin özelliklerini üç kelimenin görülme sıklığı açısından analiz etti: "aktif", "çalışkan", "disiplinli" ve bu kelimelerin eşanlamlıları da sayıldı. Kelimelerin görülme sıklığına ilişkin veriler tabloya girilmiştir:

Elde edilen verileri işlemek için ki-kare testini kullanıyoruz.

Bunu yapmak için ampirik frekansların dağılım tablosunu oluşturacağız, yani. gözlemlediğimiz frekanslar:

Teorik olarak frekansların eşit şekilde dağıtılmasını bekliyoruz. sıklık kız ve erkek çocuklar arasında orantılı olarak dağıtılacaktır. Teorik frekansların bir tablosunu oluşturalım. Bunu yapmak için satır toplamını sütun toplamıyla çarpın ve elde edilen sayıyı toplam toplam (lar) a bölün.

Hesaplamalar için son tablo şöyle görünecektir:

χ2 = ∑(E - T)I / T

n = (R - 1), burada R, tablodaki satır sayısıdır.

Bizim durumumuzda ki-kare = 4,21; n = 2.

Kriterin kritik değerleri tablosunu kullanarak şunları buluyoruz: n = 2 ve 0,05 hata seviyesi ile kritik değer χ2 = 5,99'dur.

Ortaya çıkan değer kritik değerden küçüktür, bu da sıfır hipotezinin kabul edildiği anlamına gelir.

Sonuç: Öğretmenler çocuğun özelliklerini yazarken çocuğun cinsiyetine önem vermemektedir.


Çözüm.

K. Pearson, matematiksel istatistiklerin (çok sayıda temel kavram) gelişimine önemli katkılarda bulundu. Pearson'un ana felsefi konumu şu şekilde formüle edilmiştir: Bilimin kavramları yapay yapılardır, duyusal deneyimi tanımlama ve düzenleme araçlarıdır; bunları bilimsel cümlelere bağlamanın kuralları bilim felsefesi olan bilimin grameri tarafından izole edilmiştir. Evrensel disiplin - uygulamalı istatistik - Pearson'a göre öznel olsa da, farklı kavram ve olguları birbirine bağlamamıza olanak tanır.

K. Pearson'un yapılarının çoğu doğrudan ilişkilidir veya antropolojik malzemeler kullanılarak geliştirilmiştir. Bilimin her alanında kullanılan çok sayıda sayısal sınıflandırma yöntemi ve istatistiksel kriter geliştirdi.


Edebiyat.

1. Bogolyubov A. N. Matematik. Mekanik. Biyografik referans kitabı. - Kiev: Naukova Dumka, 1983.

2. Kolmogorov A.N., Yushkevich A.P. (ed.). 19. yüzyılın matematiği. - M.: Bilim. -T.I.

3. 3. Borovkov A.A. Matematik istatistikleri. M.: Nauka, 1994.

4. 8. Feller V. Olasılık teorisine giriş ve uygulamaları. - M.: Mir, T.2, 1984.

5. 9. Harman G., Modern faktör analizi. - M .: İstatistikler, 1972.

2024 Evdeki konfor hakkında. Gaz sayaçları. Isıtma sistemi. Su tedarik etmek. Havalandırma sistemi