MyUNI'ye hoş geldin!

Dağılımlar

Veri analizinde kullanılan farklı dağılım türleri, verilerin nasıl dağıldığını anlamamıza yardımcı olur. Bu sayfada en yaygın kullanılan dağılım türleri ve bunların temel özellikleri açıklanmaktadır.

Olasılık Dağılımları Nedir?

Olasılık dağılımları, bir veri kümesinin nasıl organize olduğunu ve belirli bir değerin hangi olasılıkla ortaya çıkacağını anlamamıza yardımcı olan matematiksel fonksiyonlardır. İstatistik ve veri analizinde önemli bir yere sahiptirler çünkü verilerin belirli bir model çerçevesinde nasıl davranacağını tahmin etmemize olanak tanır.

Farklı olasılık dağılımları, farklı veri setleri ve analiz ihtiyaçları için kullanılır. Doğru dağılım türünü seçmek, analiz sonuçlarının güvenilirliği açısından büyük önem taşır. İşte en yaygın kullanılan olasılık dağılımlarından bazıları:

Dağılım Türleri

Normal Dağılım

Normal dağılım, istatistikte en yaygın kullanılan dağılımlardan biridir. "Çan eğrisi" (bell curve) olarak da bilinir çünkü histogramı çan şeklindedir. Bu dağılımda veriler merkezi bir noktada yoğunlaşırken uçlara doğru gidildikçe azalma görülür.

Özellikleri:

  • Simetriktir.
  • Ortalama, medyan ve mod aynıdır.
  • Doğal olarak oluşan birçok fenomeni (örneğin, boy uzunlukları, IQ seviyeleri, kan basıncı) modellemek için kullanılır.
  • Merkezi limit teoremi gereği, büyük örneklem sayısına sahip birçok dağılım normal dağılıma yaklaşır.

Kullanım Alanları:

  • Finansal analizlerde hisse senedi getirilerini modellemek.
  • Tıp alanında kan test sonuçlarının dağılımını anlamak.
  • Psikoloji ve sosyal bilimlerde test puanlarının dağılımını analiz etmek.
# Normal dağılım örneği
veri <- rnorm(1000, mean = 50, sd = 10)
hist(veri, main = "Normal Dağılım", col = "blue", border = "black")

Üniform Dağılım

Üniform dağılımda, tüm değerlerin ortaya çıkma olasılığı eşittir. Yani belirli bir aralıktaki tüm değerlerin görülme ihtimali aynıdır. Bu dağılım, genellikle rastgele sayı üretme ve simülasyon çalışmalarında kullanılır.

Özellikleri:

  • Tüm değerlerin olasılığı eşittir.
  • Kesikli ve sürekli türleri bulunur.
  • Rastgelelik gerektiren uygulamalarda sıkça kullanılır.

Kullanım Alanları:

  • Rastgele numune seçimi.
  • Simülasyonlarda rastgele başlangıç değerleri üretme.
  • Şifreleme ve güvenlik uygulamalarında rastgele veri oluşturma.
# Üniform dağılım örneği
veri <- runif(1000, min = 0, max = 100)
hist(veri, main = "Üniform Dağılım", col = "green", border = "black")

Poisson Dağılımı

Poisson dağılımı, belirli bir zaman aralığında nadiren gerçekleşen olayları modellemek için kullanılır. Örneğin, bir çağrı merkezine gelen müşteri çağrılarının sayısı veya trafik kazalarının günlük sıklığı gibi olayları tahmin etmek için uygundur.

Özellikleri:

  • Kesikli bir dağılımdır.
  • Belirli bir zaman veya alan içinde nadir gerçekleşen olayların sayısını tahmin etmek için kullanılır.
  • Parametresi λ (lambda), belirli bir zaman diliminde beklenen ortalama olay sayısını gösterir.

Kullanım Alanları:

  • Hastanelerde acil servise gelen hasta sayısının analizi.
  • E-ticaret sitelerinde belirli bir dakikada gerçekleşen sipariş sayısını tahmin etmek.
  • Ağ trafiği analizinde sunucuya gelen isteklerin modellenmesi.
# Poisson dağılımı örneği
veri <- rpois(1000, lambda = 5)
hist(veri, main = "Poisson Dağılımı", col = "red", border = "black")