Student'in t testi

Student'ın t-testi istatistik bilimi içinde incelenen, eğer sıfır hipotez desteklenmekte ise test istatistiğinin bir Student's t-dağılımı gösterdiği hallerde uygulanan çıkartımsal istatistiksel hipotez sınamasıdır. Verilen iki değişik grup sayısal verinin birbirinden anlamlı olarak farklılık gösterip göstermemesini sınamak için kullanılabilir. En sıkça uygulanma örnekleri eğer test istatistiği içinde bulunan ölçek parametre faktörünün değerinin bir normal dağılım gösterdiği bilinmekte olduğu hallerde tatbik edilmektedir. Eğer test istatistiği içinde bulunan ölçek parametresi faktörünün değeri bilinmiyorsa ve bu faktör veriye dayayan bir kestirim ile ifade edilmekte ise (gayet iyice tanımlanmış özel belirli hallerde) test istatistiği bir Student'ın t-dağılımı gösterebilir.

TarihçeDüzenle

t-test ve t-istatistiği kullanma ilk defa 1908'de Dublin, İrlanda'da önemli bir biracılık şirketi olan Guinness birasının kalitesini sınmak amacıyla bu bira fabrikasına özel olarak tutulmuş bir akademik kimyager olan (ve "Student" rumuzu ile akademik makalelerini imzalayan) William Sealy Gosset tarafından ortaya çıkartılmıştır ve kullanılmaya başlanmıştır. Guiness Şirketi'nin sahibi Claude Guinness imal ettiği bira ürününün tek bir yüksek standartta üretilmesini sağlamak Oxford Üniversitesi ve Cambridge Üniversitesi fen bilimleri mezunlarından en iyilerinden biyokimya ve istatistik bilimlerini pratikte sanayi imalat süreclerinde kullanmaya koyabilecek mezunlar istihdam etmeye önem vermekte idi. Gosset t-testini Dublin'de Guinness bira fabrikasının özel imalatı olan siyah ve yoğun "stout" adı verilen bira tipinin standart olarak üretilip üretilmediğini sınamak için ortaya çıkardı. Bu istatistiksel üretim kalitesi kontrol aracının geniş bir alanda da uygulanabileceği gayet açık olarak anlaşılmıştı. 1908'de Gosset ortaya çıkardığı "t-test" yöneteminin matematiksel olarak açıklanmasını bir bilimsel makale haline getirdi ve gayet itibarlı akademik bilimsel dergi olan "Biometrica" dergisine sundu. Bu dergi bu makaleyi yayınlamayı kabul etti. Fakat prensip olarak Guinness Şirketi bu sirkette çalışanlarin kendi isimleri ile makaleler yazıp bastırmalarına iyi bakmamakta idi. Bunun için Gosset Biometrika'da yayınlacak makalesi için kendi ismini kullanamadı ve makalesi "Student" rumuzu ile bastırıldı. Guinness ileri teknoloji kullanan çalışanlarına üniversiteler de ileri bilimsel çalışmalar yapmaları için akademik izin de vermekte idi. Gosset 1906-1907'de Londra Üniversitesi'ne bağlı olan University College'de Profesör Karl Pearson'un başı olduğu Biyometri Laboratuvarı'ndan çalışmaya başladı. O zaman Gossen'in ismi ve bilimsel ünü istatistikçiler ve biyometriciler tarafından bilinmekteydi ve bu akademik çalışmalar t-testinin geliştirilip kullanılıp yaygınlaştırılmasında önemli rol oynadılar. Fakat günümüze kadar çözümü bilinmeyen bir bilimsel sorun, istatistiksel t-testinin geliştirilmesinde Guinness firmasının pratik alanda yaptığı katkınin ne kadar olduğu ve Gosset'in Londra University College'de yaptığı akademik çalışmaların katkılarının ne olduğudur.

KullanimDüzenle

Değişik t-testlerinin en sık olarak kullanılanları arasında şunlar bulunmaktadır:

Pratik istatistiksel kullanımlarda "iki-örneklem konum testi" pratikte gayet genel olarak kullanılmaktadır. Fakat teorik bakımdan daha doğru ve sıkı düşünülürse "iki örneklem konum testi" ancak gayet belirli iki örneklem verileri için uygulanmması gerekmektedir. Bu belirli varsayımlara göre iki örneklemin kayaak olarak geldiği iki anakütlenin varyanslarının bilinmesi ve birbirine eşit olması gerekmektedir. Fakat pratik istatistik uygulamaların çoğunda bu eşit varyanslar varsayımı iki anakütle varyansının hiç ölçülmeden, sadece bir düşünce mahsulü olarak, eşit oldukları kabul edilmektedir. Bu tip düşünce mahsulü varyans eşitliği kabul edilmesinden sonra t-testinin uygulanmasını Welch'in t-testi olarak anıp bildirmek teorik olarak daha uygundur. Bu türlü elde edilen örneklem verilerine "eşlileştirme yapılmadan örneklem" veya "iki bağımsız örneklem" adı da verilmektedir. Bu "eşlileştirme yapılmadan örnekleme"'de iki değişik verilerin kaynağı olan iki "veri çerçevesi" bulunmaktadır ve bu iki veri çerçevesi içindeki veriler arasında bağımlılık bulunmamaktadır. "Eşlileştirme yapılmadan örnekleme" alınması halinde anakitle içinde bulunan her bir eleman, ancak tek bir örneklem içine girebilmekte ve eğer bir eleman bir çerçeve içine girmişse ikinci örneklem çerçevesi içinde bulunması imkânı olmaması gerekmektedir yani iki örneklem çerçevesinin birbiri üstüne binişmeleri ("överlepping" olmaları) imkânsızdır.[1]

  • Aynı anakütle elemanın yanı istatistiksel birimin üzerinde yapılan iki değişik ölçülme ile ortaya çıkan "eşlileştirilmiş örneklem" verileri ile yapılan ölçülme farklarının ortalaması için "t-testi". Bu testte sıfır hipotez anakitle için ölçüm farklarının ortalamasının 0 değere eşit olduğu sınanmaktadır. Örneğin, bir kanser hastasının tümörünün büyüklüğü ilk defa kanser ilacı vermeden önce ölçülmekte ikinci defa kanser ilacı verildikten sonra ölçüm alınmaktadır. Bu önce-ve-sonra seklindeki iki ölçüm arasındaki fark analiz için veridir yani kullanılan veri tek tek ölçüm değil birbirine bağımlı olarak tek elemanda (tek bir hastada) iki (tedaviden önce ve tedaviden sonra) ölçüm arasındaki farktır. Bu ölçümler sayica büyükçe bir örneklem hastalardan alınması gerekmektedir. Eğer tedavi efektif ise, birçok hasta için tümör büyüklüğünün ölçüm farklarının çoğunun negatif olması ve farklar ortalamasının sıfır altında olması beklenmektedir. Bu tip örneklem verileri için t-testine "eşlileştirilmiş örneklem t-testi" veya "tekrarlanmış ölçmeler için t-testi" adı verilmektedir.[1][2].
  • Doğrusal regresyon doğrusu'nun eğiliminin 0 değere eşit olup veya 0 değerden anlamlı olarak değişik olduğu.

VarsayımlarDüzenle

Eşlileştirilmiş olmayan ve eşlileştirilmiş olan iki-örneklemli t-testleriDüzenle

Bağımsız (eşlileştimiş olmayan) örneklemlerDüzenle

Eşlileştirilmiş örneklemlerDüzenle

HesaplamalarDüzenle

Bir örneklem için t-testiDüzenle

İsim Formül Varsayımlar

Bağımsız iki-örneklemli t-testiDüzenle

İki-örneklem ve iki anakütle parametresi farkı için hipotez sınamalarıDüzenle

Eşit örneklem büyüklükleri, eşit varyansDüzenle

Eşit veya eşit olmayan örneklem büyüklükleri, eşit varyansDüzenle

İsim Formül Varsayımlar
İki-örneklem pool edilmiş t-testi  

 
 

(Normal anakütle veya n1+n2 > 40) ve bağımsız gözlemler ve σ1 = σ2 ve (bilinmeyen σ1 ve σ2 değerleri)
İsim Formül Varsayımlar
İki-örneklem z-testi   Normal dağılım ve bağımsız gözlemler ve (bilinen σ1 ve σ1 değerleri)

Eşit veya eşit olmayan örneklem büyüklükleri, eşit olmayan varyanslarDüzenle

İsim Formül Varsayımlar
İki-örneklem pool edilmemiş t-testi  

 
 
veya  

(Normal anakütleler veya n1+n2 > 40) ve bağımsız gözlemler ve σ1 ≠ σ2 ve (bilinmeyen σ1 ve σ2 değerleri)

Eşlileştirilmiş örneklemler için bağımlı t-testiDüzenle

İsim Formül Varsayımlar
Eşlileştirilmiş t-testi  

 

(Normal farklar anakütlesi veya n < 30) ve bilinmeyen σ değeri

Regresyon doğrusunun eğilimiDüzenle

Çözülmüş problem örnekleriDüzenle

Eşit olmayan varyanslarDüzenle

Eşit olan varyanslarDüzenle

Anakitle konum problemleri için t-testlerine alternatiflerDüzenle

Çoklu-değişirli ististiksel sınamaDüzenle


Tek-örneklem için T2 testiDüzenle

İki-örneklem için T2 testiDüzenle

Yazılım uygulamalarıDüzenle

Ayrıca bakınızDüzenle

NotlarDüzenle

  1. ^ a b Fadem, Barbara (2008). High-Yield Behavioral Science (High-Yield Series) (İngilizce). Hagerstwon, MD: Lippincott Williams and Wilkins. ISBN 0-7817-8258-9. 
  2. ^ Zimmerman, Donald W. (1997). "A Note on İnterpretation of the Paired-Samples t Test". Journal of Educational and Behavioral Statistics. ss. 349-360. doi:10.3102/10769986022003349. JSTOR 1165289. 

KaynakçaDüzenle

  • Boneau, C. Alan (1960). "The effects of violations of assumptions underlying the t test". Psychological Bulletin c.57 no.:(1) say. 49–64. doi:10.1037/h0041412.
  • Edgell, Stephen E., & Noon, Sheila M (1984). "Effect of violation of normality on the t test of the correlation coefficient". Psychological Bulletin c.95 no.(3) s. 576–583. doi:10.1037/0033-2909.95.3.576.

Ek bibliyografyaDüzenle

  • O'Mahony, Michael (1986). Sensory Evaluation of Food: Statistical Methods and Procedures. CRC Press. s. 487. ISBN 0-82477337-3. (İngilizce)
  • Press, William H.; Saul A. Teukolsky; William T. Vetterling; Brian P. Flannery (1992).Numerical Recipes in C: The Art of Scientific Computing. p. 616[ölü/kırık bağlantı] Cambridge University Press. s 616. ISBN 0-521-43108-5. (İngilizce)

Dış bağlantılarDüzenle