"Örnekleme" sayfasının sürümleri arasındaki fark

k
Yazım hataları ve genel düzenlemeler, değiştirildi: prensipi → prensibi (3), rasgele → rastgele (7)
k (nisbeten → nispeten)
k (Yazım hataları ve genel düzenlemeler, değiştirildi: prensipi → prensibi (3), rasgele → rastgele (7))
Örnek hesaplamalarında <math>n</math>, <math>\bar{x}</math>, <math>s^2</math>, <math>s</math>, <math>p</math> gibi semboller kullanılırken yığın hesaplamalarında ise bu simgelerin yerine sırası ile <math>N</math>, <math>\mu</math>, <math>\sigma^2</math>, <math>\sigma</math>, <math>\pi</math> simgeleri kullanılır. İstatistik sadece örnekler üzerinde hesaplanabilir. Yığında ise parametre değerleri hesaplanır.
 
[[İstatistik]] bilim dalında ''örnekleme'', N hacimli bir [[istatistiksel yığın|anakütleden]], anakütleyi temsil edebilen n hacimli bir altküme elde edilmesidir. Tipik olarak anakütle çok büyüktür veya tüm anakütle elemanları hakkında bilgiler elde etmek imkânsızdır veya elde etmek için anakütleyi değiştirmek veya elemanlarına zarar vermek gerekecektir veya çok büyük masraf ve emek gerektirecektir. Bu nedenle [[tam sayım]] ile tüm sayısal değerlerin öğrenilmesi istenmez. Örnekleme ile kullanılabilir bir büyüklükte altküme elde edilir. Örnek verileri toplanır; örnek verileri hakkında istatistikler hesaplanır ve örnek istatistikleri üzerinde [[çıkarımsal istatistik]] veya [[ekstrapolasyon]]lar kullanarak anakütle hakkında bilgiler elde edilir.
 
Örneğin, Türkiye'de üniversite öğrencilerinin fen bilimleri hakkındaki tavırları ölçülmek istensin ve bu tavırları açıklayan 10 soruluk bir anket hazırlanabileceği bilinsin. "Türkiye'de 2006-2007 öğretim yılında üniversite öğrencisi" olanların tümünün bu 10 soruya sayısal şekilde yanıt verdiği varsayılsın. Her bir soruya verilen yanıtın sayısal değerlerinin tümü birer [[istatistiksel yığın|anakütle]] olur. Burada dikkat edilecek nokta, istatistik bilimi için anakütlenin sayısal değerler olması ve üniversite öğrencisi olmamasıdır. Üniversite öğrencilerinin hepsi '''anakütle çerçevesi''' olarak anılır. Bu türlü sonuç bulmak ya imkânsızdır; ya da büyük emek, para ve zaman istemektedir. Bu nedenle örnekleme methodunun uygulanması tercih edilir.
== Örnekleme teknikleri ==
=== Genel örnekleme tekniği tanımı ===
Yukarıda anakütle çerçevesinden uygun bir şekilde bir daha ufak örnekleme çerçevesi elde edilir denilmişti; işte bu uygun şekillerin incelenmesi örnekleme tekniklerinin incelenmesi demektir. Genel olarak örnekleme çerçevesinin anakütle çerçevesinden elde edilmesi için prensip örnekleme çerçevesinin anakütleyi '''temsil edici''' olmasıdır. Örnek verileri bir art fikirle bazı kişisel veya grupsal fikir ve prensiplere güya bilimsel bir destek sağlamak için kullanılmaması gerekmektedir; ama ne yazıktır ki pratikte birçok ticari, sinai, sosyal ve politik örnek bu niyetle elde edilip kullanılmakta ve genel gerçekte temsilci olma prensipindenprensibinden uzaklaşılmaktadır. Bu '''istatistikle yalan söyleme''' şeklinde adlandırılabilen birçok araştırmalarda ele alınan bir konu olmuştur.<ref>D.Huff, [1993] ''How to lie with statistics'', W.W.Norton & co.</ref>
Eğer '''temsilci olma''' prensibine uygunluk arzu edilmekte ise örnekleme tekniği seçimi için iki genel teknik grubu bulunmaktadır:
Fakat genel olarak seçilen olasılık dağılımı [[Bernoulli dağılımı]] olduğu için birçok referansda bu prensip
:anakütle çerçevesi içinde bulunan her elemanın örnek çerçevesi içine alınma olasığının eşit ve aynı olmasıdır.
şeklinde ifade edilmektedir. Dikkat edilirse '''rastgele örnek''' için '''temsilcilik prensipiprensibi''' özel olarak matematik-istatistik içeriğine göre değiştirilmiştir; '''belirlenmiş bir dağılıma göre olasılık''' , '''eşit olasılık''' prensibi ön plana alınmıştır. Eğer anakütle elemanları için bu prensip uygulanırsa, bunun mantıksal olarak '''temsilcilik prensipineprensibine''' uyacağı da ima edilmektedir. Burada bu iki grup örnekleme tekniğine ait olan teknikler genel olarak detaya inmeden açıklanacaktır.
 
== Olasılık prensiplerine uymayan örnekleme teknikleri ==
 
=== Yargısal örnekleme ===
'''Yargısal örnekleme''' bir uzman kişi veya bilirkişinin kendi özel bigisini ve yargısını kullanarak ''temsilci olma'' niceliğini taşıyan elemanlar ile bir örnekleme çerçevesi kurmasıdır.
 
Bu çeşit örneklerde çok kere bilinmeyen ve daha önceden hiç tahmin edilme imkânı olmayan yanlılıklar ortaya çıkar. Örnek seçme usulu ve protokollerinin kuruluşu ve kullanışı sırasında şeffaflık olmadığı için bilinmezliklerin nerede ve nasıl ortaya çıkabilecekleri ve nasıl yanlılıkların aksi tesirlerinin, nasıl çarelerle giderilebilineceği bilinmez.
 
Bazı hallerde yargısal örnekleme kullanışlı ve hatta tercih edilir örnek alma tekniği olabilir.
İkinci adım olarak kota örneklemede her veri toplayıcısına, tespit edilmiş her tabaka için aldıkları örnekte (çok kere anket sorularını cevaplandırıcı sayısı olan) kaç gözlem ile bulunacağını tespit eden bir '''kota sayısı''' verilir.
 
Bundan sonra veri toplayıcılar kendilerine verilen her tabaka için kota sayısına göre kendi şahsi yargılarını kullanarak veri toplarlar. Bu adım tıpkı bir yargısal örnekleme gibidir; ama yargıyı uygulayanlar çok defa, uzman kişi veya bilirkişiler değil, gerçek veri toplayıcılardır.
 
=== Kartopu örneklemesi ===
'''Rastgele örnekleme''' ''olasılık örneklemesi'' olarak da adlandırılır. ''Rasgele örnek'' bulma ve kullanma için istenilen özellik:
: "Her bir anakütle elamanının belirli olasılıkla örnekde bulunmasıdır."
Bundan açıktır ki istenilen özellik doğrudan doğruya örneğin anakütle için ''temsilci'' olması değildir. ''Temsilci'' olma prensibine ''rastgele örnekleme'' biraz dolaylı olarak varmaktadır. Rastgele örnekleme kavramı ve prensibi temsilci olmama riskini bir seri istatistik teori kavramı ile niceliksel olarak açığa çıkarmaya yöneliktir. Bu niceliksel sonuçlar önce hangi çeşit rastgele örneklemenin seçilmesi ve sonra ne kadar büyük bir örnek hacmi elde edilmesi gerektiğine karar vermekte kullanılır. Bu örnek alınmasından önce karar verme yanında, örnek alındıktan sonra ölçülmüş sonuçlara bağlı örnekleme hatasını hesaplamaya yardım sağlar.
 
''Belirli olasılık'' teriminin tanımlanmasına göre değişik türlü rastgele örnek ortaya çıkabilir. Bunlardan en iyi bilineni ''basit rasgelerastgele örnekleme''dir. Bu türlü örneklemenin ana prensibi her bir anakütle elemanının ''aynı olasılıkla'' örnekleme girebilmesidir. Yani her bir anakütle elemanı için örnekde bulunma olasılığı bir [[Bernoulli dağılımı]] gösterir. Diğer türlü ''belirli olasılık'' her bir anakütle elemanının Poisson dağılımına göre (birbirine eşit olmayarak) örnek içinde bulunmasıdır.
 
Ancak ''rastgele örnekleme''ler için sınıflandırma (gösterilen olasılık dağılımına göre yapılmamakta) daha pratik olarak nasıl rastgele olmanın sağlanma yöntemine dayanılmaktadır. Bu sınıflandırmaya göre ''rastgele örnekleme'' sınıfı içinde şu değişik örnekleme tipi mevcuttur:
{{ana|Basit rastgele örnekleme}}
 
'''Basit rasgelerastgele örneklem''' almanın ana prensibi her bir anakütle elemanının ''aynı olasılıkla'' örneğe girebilmesidir. Bu bir ''olasılık örneği'' tanımına uyar, çünkü her bir anakütle elemanı için örneklemde bulunma olasılığı bir [[Bernoulli dağılımı]] gösterir. Eğer anakütle büyüklüğü ''N'' ile ifade edilirse, her bir anakütle elemanı ''1/N'' olasılıkla örnekde bulunur.
 
Bu prensibi uygulamak için şu aşamalar uygulanır:
# Anakütlenin her bir elemanı tespit edilir ve tespit edilen elamanların her birine bir sayısal kod verilir. Genellikle kodlar birbirini takip eden sayılar halinde [[sıralama düzeni]] halindedir ve sanki sayısal bir isimdir.
# İkinci aşamada en uygun örneklem hacmi, yani ''n'', tayin edilir.
# Bir ''rastgele numara üretici alet'' kullanılarak istenilen ''n'' sayıda (birbirinden değisik olması tercih edilir) rastgele sayı çıkartılır. Rassal sayılar gayet çok olduğu için bir çeşit geri koymadan örnek alma deneyim sonucu olan ''n'' tane rasgelerastgele sayı aynı olasılığa haizdir.
# Bu rastgele ''n'' numara anakütle elemanlarının kodları ile karşılaştırılır. Kod numarası, çekilmiş olan rasgelerastgele sayıya eşit olan elemanlar örnek elemanı olarak seçilirler.
 
=== Örüntülü örnekleme ===
{{ana|küme örneklemesi}}
 
Bu şekilde örnekleme genellikle örnekleme zaman ve para maliyetlerini düşük tutmak için kullanılmaktadır. Anakütle çerçevesi elamanlarının birbirine yakın kümeler oluşturduğu hallerde ve her bir küme genel olarak diğer kümelere çok benzerlerse, bu tipi örnekleme kullanılması uygun olabilir. Örneğin, anakütle çerçevesi belli bir üniversite olursa, o üniversite içindeki değişik bölümlerde bulunan öğrencilerin benzer özellikler gösterdikleri kabul edilebilir ve bölümler incelenen sorun için birbirinden çok değişik değillerse, bölümler birer küme olarak incelemeye taban olabilirler. Bu kümeler mekan içinde (örneğin şehrin değişik mahalleleleri veya Amerika'daki gibi değişik şehir blokları) veya zaman içinde (belirli zaman dönemleri) olabilir.
 
Küme örneklemesi iki aşamada yapılır:
* İkinci aşamada her bir örneğe giren küme içinde bulunan bütün anakütle elemanları üzerinde gözlem yapılır. Yani her örnek küme için tam sayım yapılır. Örneğin, ilk aşamada seçilmiş olan 8 bölümdeki her öğrenci elemanlarınin tümüne gözlem uygulanır.
Doğal olarak, tüm anakütle çerçevesi seçilmediği için zaman ve para maliyetleri tam sayımdan düşük olur. Dikkat edilirse bu çeşit örneklemede rasgelerastgele seçilme kümelerle ilgilidir. Bu seçim yapıldıktan sonra seçilen kümeler içinde bulunan birbirine yakın elemanlar gözümlendiği için de maliyetler (özellikle [[basit rastgele örnekleme]]ye kıyasla) daha düşük olması çok mümkündür. [[Basit rastgele örnekleme]]ye kıyasla küme örneklemesinin bir diğer avantaji, tüm anakütle elemanlarının her birinin kodlanmasının gerekmediğidir; bu tüm kodlama büyük maliyet gerektirir ve bazan da imkânsızdır. Buna karşılık küme örneklemesisinde sadece birinci aşamada seçilmiş olan kümeler elemanları tespit edilip kodlanır.
 
Ancak küme örneklemesi, her bir kümenin diğer kümelere benzediğine ve sadece kendine has karakteri olan bir veya birkaç kümenin bulunmadığı varsayımına dayanır. Gerçekte bu varsayım her zaman ancak yaklaşık olarak doğru olacak ve bazı belirlenen kümeler kendine has karakter arz edecektir. Bu nedenle küme örneklemesinin yayılımı ayni anakütle için alınabilecek basit rastgele örneklemeden daha fazla olacaktır ve örneklemeden sonra elde edilecek kestirimler veya yapılan sınamalar daha az tutarlı olacak ve daha fazla yanlı olma olasılığı taşıyacaklardır.
{{ana|Çok aşamalı örnekleme}}
 
'''Çok aşamalı örnekleme''' ''küme örneklemesi''nin biraz daha karmaşık bir şeklidir. ''Küme örneklemesi'' için ''basit rastgele örnek'' olarak seçilmiş kümeler gerekmekte ve seçilen kümeler içinde tamsayım yapılması önerilmektedir. Bu tamsayım (ya parasal veya diğer kaynak kullanımına göre) çok maliyetli ve hatta imkânsız bile olabilir. İki aşamalı örneklem için birinci aşamada (aynı küme örneklemesi gibi) ''basit rastgele örnekleme'' ile belirli sayıda küme seçilir. Bundan sonra ikinci aşamada kullanılan çerçeveler ilk aşamada seçilmiş kümeler olur. Her seçilmiş küme için ''basit rastgele örnekleme'' uygulanıp tüm küme haciminden daha ufak sayıda örnekleme girecek elemanlar seçilir. Nadir hallerde ikiden fazla aşama da uygulanabilir. Bunda ilk aşama küme seçmektir; ondan sonraki aşama veya aşamalarda gittikçe birbiri içine girmiş alt-küme, alt-alt-küme vb. seçmek amaçtır ve en son aşamada ise seçilmiş alt-alt..-küme içinden basit rasgelerastgele örnek seçilir. Bu son aşamada elde edilecek örnek büyüklülüğünün kaç eleman kapsayacağı kararı önemlidir. Eğer örnek büyüklüğü ile anakütledeki küme (veya alt-alt-..-küme oranında eşitlik istenirse herhangi bir seçilen küme içinde bulunan tüm anakütleye orantılı eleman sayısı son aşama örnek büyüklüğü seçiminde de aynen uygulanır.
 
=== Eşli rastgele örnekleme ===
 
'''Eşli rastgele örnekleme'' birbirine bağlantısı olan iki değişik örneğe elaman seçimini kapsar. Anakütle elamanları önce diğer bir karakteristiğe veya değişkene göre eşlenerek o değişkeni inceleyecek örneklere seçilmiş olurlar. İnceleme yapılacak diğer bir karakteristik veya değişken için kullanılacak bu önceden eşlenmiş elamanları nasıl rastgele bu yeni değişken için örneklere tahsis edileceği ''eşli rasgelerastgele örnekleme'' yöntemi kullanılarak yapılır.
 
Bu çeşit olasılık örneklemi bulmak özellikle şu iki halde çok uygundur:
Matematik olarak '''rasgele örnekleme''' daha formel bir şekilde tanımlanır. ''X'' [[olasılık dağılımı]] ''F'' olan verilmiş bir [[rassal değişken]] olsun. ''n''=1, 2 ,3,... büyüklüğü olan bir rastgele örnek ''F'' dağılımı olan ''n'' tane [[bağımsız]] ve her biri ayni şekilde dağılım gösteren ''n'' elemanı bulunan bir settir.<ref>Wilk,Samuel S. (1962), ''Mathematical Statistics'', John Wiley, Bol.8.1</ref>
 
Bir örnek somut şekilde, her bir denemede aynı miktar ölçülürse ''n'' tane denemeyi temsil eder. Örneğin, biz üniversite öğrencilerini boyu ile ilgili isek ''X'' bir öğrencinin boyu olur ve <math>n</math> tane öğrenci boyu ölçümlenir ve <math>X_i</math> ''i''-inci öğrencinin boyunu ifade eder. Fakat (bir sıra ölçülebilir fonksiyondan oluşan) bir rassal değişkenler örneği ile bu rassal değişkenlerin gerçekleşmelerini (yani rassal değişkenin almış olduğu değerleri) kavramsal olarak ayrı tutmak gerekmektedir. Diğer bir deyişle, <math>X_i</math> i-inci denemedeki ölçmeyi temsil eden bir fonksiyon olmakta ve <math>x_i=X_i(\omega)</math> gerçekte yapılan ölçmelerden elde edilen sayılar olmaktadır.
 
Böylece [[matematik]] açıklamaya göre örnek kavramı verilerin (yani rassal değişkenlerin) nasıl elde edilmeleri ''sürecini'' açıklamaktadır. Bu gereklidir çünkü örnek ve bundan elde edilen [[örnekleme istatistikleri]] hakkında matematik ifadelerin verilmesi gerekmektedir.
547

değişiklik