Histogram grafiği, verilerin özet haline getirilerek analiz edilmesine imkan tanıyan istatistiksel bir yöntemdir. Histogram ile verinin dağılımını görselleştirebilir ve bu dağılımdaki simetriyi, çarpıklığı, uç değerleri analiz edebiliriz.
Veriyi özet haline getirmek analiz, görselleştirme ve sunum süreçlerinde önemli bir adımdır. Histogramlar, verinin dağılımını sade ve anlaşılır bir şekilde göstererek, veri analizini kolaylaştırır ve verideki genel desenleri hızla anlamamıza yardımcı olur.
Grup genişliği, histogramda veriler belli aralıklara bölündüğünde bu aralıkların uzunluğunu temsil eden ölçüdür. Grup genişliği arttıkça, veriler daha az ayrıntılı ve daha özet bir biçimde gösterilir. Histogram grafiğinin anlamlı olabilmesi için grup genişliğinin doğru seçilmesi önemlidir.
Grup genişliğini bulabilmek için aşağıdaki formülü kullanabiliriz. Grup genişliği belirlenirken grup sayısının kaç olacağına karar verilmelidir. Grup Sayısı histogramdaki sütun sayısıdır. Verinin kaç gruba bölüneceğini doğru seçmek önemlidir. Grup sayısını kendimiz belirleyebileceğimiz istatistiksel yöntemlerle de belirleyebiliriz. Grup sayısı belirleme de kullanılan en önemli yöntemler Sturges Kuralı, Scott kuralı ve Freedman-Diaconis Kuralı'dır.
Excelde histogram grafiği oluşturmak için öncelikle veri seçilmelidir. Insert (Ekle) sekmesine giderek Charts (Grafikler) bölümünden histogram grafiğini seçerek excelde histogram grafiği oluşturabiliriz.
Aşağıda pencereyi kullanarak histogram dışındaki grafikleri de kolay bir şekilde çalışmamıza ekleyebiliriz.
Pythonda histogram grafiği oluşturmak için matplotlib.pyplot kütüphanesi kulanılabilir. Bu kütüphane ile verilerimizi kolay bir şekilde histogram grafiğine dönüştürebiliriz. Aşağıdaki python kodu ile pythonda histogram grafiği oluşturabiliriz. Veri isimli değişkene grafiğini oluştumak istediğimiz değerleri yazıyoruz. bins parametresi histogram grafiğindeki grup sayısını belirlememize imkan vermektedir.
import matplotlib.pyplot as plt veri = [9, 13, 14, 17, 22, 25, 26, 28, 29, 30]
plt.hist(veri, bins = 3) plt.show()
Histogram grafiği ile verilerin hangi aralıkta yoğunlaştığını tespit edilebilir. Verinin fazla ya da az olduğu aralıklarda bu durumun normal olup olmadığını incelenebilir. Ayrıca histogram grafiği analiz edilerek yeni stratejiler oluşturulabilir. Örneğin müşterileri gelme sıklığı saat 10-11 aralığında fazlaysa çalışan sayısını da bu saat aralığında arttırabiliriz.
Yeni çalışmalardan ve benzer içeriklerden haberdar olmak isterseniz beni aşağıdaki hesaplardan takip edebilirsiniz.
Linkedin: www.linkedin.com/in/mustafabayhan/
Medium: medium.com/@bayhanmustafa