Şu eğitimden: Veri Görselleştirme İpuçları ve Püf Noktaları
Verilerdeki karşılaştırmaları görselleştirin
Şu eğitimden: Veri Görselleştirme İpuçları ve Püf Noktaları
Verilerdeki karşılaştırmaları görselleştirin
- Sahip olduğumuz verilerin türüne ve sormak istediğimiz soruların türüne bağlı olarak verileri karşılaştırmanın birçok yolu vardır. Veri kümelerini karşılaştırmanın üç harika yolu çubuk grafikler, çizgi grafikler ve vurgu tablolarıdır. Sırayla her birine bir göz atalım. Verilerinizi bir boyutta analiz etmek istediğiniz zamanlar için, örneğin kategori başına kâr, çubuk grafik doğal seçimdir. Ve çok iyi bir nedenden dolayı. Çubuk grafiği bileşenlerine ayıralım ve kategorik verileri karşılaştırmak için neden mükemmel bir seçim olduğunu anlayalım. Örneğin, ürün kategorilerimizin her birinin elde ettiği kar miktarına bakmak istiyoruz. Yani bu durumda, ürün kategorimiz olacak bir boyutumuz ve kâr olacak bir ölçümüz var. Ölçü, sürekli bir veri türüdür. Sonsuz bir olası değer aralığı vardır, bu yüzden bunu bir eksen üzerinde çizmemiz gerekir. Öyleyse önce yatay bir eksen oluşturalım. Şimdi ürün kategorilerine ihtiyacımız var. Bunlar boyutlardır, bu nedenle y ekseninde çizilmiş kategorilerin her biri için bir satır olan sıralı bir listeye ihtiyacımız var. Şimdi, bunu tam tersi şekilde yapabilir ve boyutu x eksenine ve ölçüyü y eksenine koyabilirdik, ancak bu, ürün kategorisi etiketlerinin 90 derece döndürüleceği anlamına gelir, bu da onları görmeyi zorlaştırır. Bu nedenle, ilkeler her grafik türüne eşit olarak uygulansa da, sütun grafiğin aksine bir çubuk grafik tercih edilen seçenektir. Veri noktalarımızı koyduğumuzda, grafiğe kategorilerin her biri için kar değerine karşılık gelen tek bir işaret yerleştireceğiz. Buradaki sorun, satır başına tek noktanın herhangi bir sonuç çıkarmayı çok zorlaştırmasıdır. En karlı kategori olan veriler için bir sipariş görmek zordur ve birini diğeriyle karşılaştırmak zordur. Görselleştirmenin birincil amacı bu olduğundan, başka bir şey eklememiz gerekiyor ve bu uzunluk. Şimdi bunun yerine, kârın değerini çubuğun uzunluğunda kodlar ve sonra da renklendirirsek, elde ettiğimiz şey budur. Her çubuğun artık görülmesi çok daha net ve fotokopi makinelerinin en karlı ve masaların en az olduğunu görebiliyoruz. İlgilendiğimiz kategoriyi bulmak için kategori listesine kolayca gidebiliriz ve değerleri okursunuz. Peki ya hangisinin en çok ve en az karlı olduğunu bilmek istiyorsak? Bu durumda, tek yaptığımız görselleştirmeyi kârla sipariş etmektir ve bunu elde ederiz. Kategorilerimiz için kâr aralığını anında görebiliriz. Zarar ettiğimiz üç kategorimiz ve kar ettiğimiz beş kategorimiz olduğunu görebiliriz. Ve ilk üçün 40.000 dolardan fazla kazandığını görebiliyoruz. Artık bu görselleştirmeye daha fazla ayrıntı vermek için daha fazla boyut ekleyebiliriz (örneğin, alt kategorileri her bir başlığın altında gruplandıracak olan üst boyut ürün kategorisini eklemek). Peki ya bunun yerine sütuna bir boyut eklersek? Öyleyse bölgeye atalım ve bunun neye benzediğini görelim. Şimdi her bölge için bir tane olmak üzere dört bar setimiz var. Artık ürünlerimiz arasında bölgesel farklılıklar arayabilir ve bölgeler arasında ürün varyasyonları arayabiliriz. Ve burada görüyoruz ki, doğudaki masalar büyük bir sorundur, ancak makineler doğuda kâr eder, ancak başka yerlerde zarar eder. Genel olarak, güney tüm alt kategorilerde daha düşük karlar elde ediyor. Dolayısıyla, çubuk grafikler basit bir görselleştirme olmasına rağmen, doğru şekilde oluşturulurlarsa ve daha fazla boyut kullanarak ek bilgiler eklersek, bazı karmaşık analizler oluşturabiliriz. Peki ya dört bölgemiz için kârın zaman içinde nasıl değiştiğine bakmak isteseydik, örneğin son yılın verilerinde? Bu nasıl görünürdü? Yani burada x ekseninde ilerleyen aylar ve kârı temsil eden sütunlar var. Şimdi çubukla ilgili sorun, hesaplamanın değerini gösteren çubuğun uzunluğudur. Zaman serilerimiz için, kârların artıp artmadığını bilmek istiyoruz. Gerçek değerle değil, sadece komşularıyla nasıl karşılaştırıldığıyla ilgileniyoruz. Bölgeleri ekledik, bu yüzden yığılmış bir çubuğumuz var. Her bölge renklidir ve bölgenin aylık genel değere ne kadar katkıda bulunduğunu kolayca görebiliriz. Ve bazı olumsuz değerlerimiz olduğunu görebiliyoruz, bunlar bizim kayıplarımız, ancak bu dört bölgenin her birinin zaman içindeki performansını karşılaştırmak zor. Ve gerçekten yapabilmek istediğimiz şey bu. Bu yüzden sadece esas olarak barın sonuyla ilgileniyoruz. Bu yüzden yapmamız gereken şey, çubuğun uçlarını bir araya getirmektir, böylece zaman içindeki veri akışını gösterebiliriz. Bu noktaları bir çizgiyle birleştirerek, bu ilişkiyi yaratırız. İşte aynı veriler, ama bunun yerine, bir çizgi olarak. Ve ilginç bir şekilde bazı ilginç detaylar görüyoruz. Mart ayında, en karlı bölgemiz batıydı, yaklaşık 9.000 dolar civarındaydı ve ardından Nisan ayında büyük bir kayıp verdi ve sonra toparlandı. Genel olarak, yaz aylarının, muhteşem karlar olmasa da, istikrarlı bir şekilde getiren en düz dönemlerimiz olduğunu görebiliriz. Bununla birlikte, son çeyrekte, doğu kârda büyük bir sıçrama yaşarken, hem güney hem de merkez zarar etmeye devam etti. Çizgi grafik, bir bölgenin diğerini nerede geçtiğini ve ayrıca genel eğilimi kolayca görmemizi sağlar. Bu nedenle, bir zaman dilimindeki verileri karşılaştırmak için, çizgi grafik mükemmel bir seçimdir. Bu nedenle, hem çubuk hem de satır, özet düzeyindeki verileri göstermede iyidir. Toplamalar üzerinde çalışırlar. Bu nedenle, daha küçük bir veri kümeniz olduğunda ve ayrıntıyı hemen görebilmeniz gereken durumlar olacaktır. Ve gerçekten iyi çalışabilecek değiştirilmiş bir tablo grafiği türü var. Bu nedenle tablolar genellikle görselleştirme için zayıf bir alternatif olarak görülür. Ve aslında, bir veri tablosunun bir veri görselleştirmesi oluşturup oluşturmadığı konusunda bazı tartışmalar var. Ve benim kişisel görüşüm, verileri görüntülüyor ve bunu görsel bir şekilde yapıyor, bu yüzden evet, veri görselleştirme. Yine de iyi bir şey mi? Eh, bu tür bir şey değişir. Demek istediğim, olabilir. Bir veri tablosunun gücü, verilerdeki sayıları gerçekten görebilmenizdir. Bir araç ipucunun arkasında hiçbir şey gizli değildir, çubuğun uzunluğuna bakmak zorunda değilsiniz, sayı tam önünüzde. Aşağı yukarı okuyabilir ve ilgilendiğiniz hücreyi bulabilirsiniz. Bu nedenle, doğuda zarf satışlarının ne olduğunu bilmek istiyorsak, kategori listesine bir göz atabilir, Zarfları bulabilir ve ardından Doğu sütununa doğru okumalısınız. Ve işte cevabınız, 4.376. Bu kadar iyi çalışmayan şey, daha fazla satır ve daha fazla sütun içeren büyük bir veri kümeniz olduğunda. O zaman neler olup bittiğini görmek zorlaşır. Temel alınan verilere anında erişme avantajını kaybediyoruz. Öyleyse, nereye bakacağımızı bildiğimiz belirli bir değeri bulmak yeterince kolaydır, peki ya nereye bakacağımızı bilmediğimizde? Bölgelerimizde en çok satan kategorinin ne olduğunu bilmek istersek ne olur? Şimdi bu çok daha zor. Birlikte okumalı ve değerleri karşılaştırmalıyız. Bir öncekini hatırlamalı ve bir sonrakiyle karşılaştırmalıyız. Bu bir öncekinden daha mı yüksekti? Ya da ekrandaki büyük sayıyı bulmaya çalışırken etrafı tarayabiliriz. Şimdi, bu en iyi ihtimalle orta büyüklükte bir masa için can sıkıcı olurdu, ama büyük bir masa için bu bir kabus olurdu. Neyse ki, bu tür bir soruyu cevaplamayı kolaylaştırabilmemizin bir yolu var ve bu da bir vurgu tablosu oluşturmak için renk kullanmak. Bu yüzden tablodaki karelerin her birini değerine göre gölgelendiriyoruz. Yani şimdi mavi ne kadar koyu olursa, satışlar o kadar yüksek olur. Ve tablodaki en yüksek ve en düşük öğeleri kolayca seçebiliriz. Ve bu veriler söz konusu olduğunda, yaklaşık 100.000 dolar civarında olan dört öğe var. Bu nedenle, 68 değeri karşılaştırmak yerine, en büyük satışların batıdaki sandalyeler olduğunu bulmak için sadece bu dördünü karşılaştırmamız gerekiyor. Peki ya daha büyük veri kümeleri için? Bunu bir ısı haritası kullanarak da yapabiliriz. Isı haritası aslında vurgu tablosuyla aynıdır, ancak tablodaki değerleri paylaşmayız. Bu, yüzlerce hatta belki de binlerce kayıttan değer seçmek istediğimiz daha büyük veri kümeleri için daha uygundur. Öyleyse bu veri setini genişletelim ve nasıl göründüğünü görelim. Bu yüzden müşteri segmentini sütunumuza ekledik, böylece artık 204 değerimiz sergileniyor. Ve bu, sayının kendisini göstermek için çok fazla, ancak renk yüksek ve düşük satıcıları görmemizi sağlıyor. Ve sandalyelerin doğuda çok iyi sattığını hemen görebiliyoruz, ancak sadece bu müşteri segmentinde. Gerçek dolar değerini bilmek istiyorsak, bilgileri bir araç ipucundan veya bir dezavantajdan almamız gerekir. Isı haritasının gücü, kategoriye göre alt bölümlere ayrılmış büyük miktarda veri görebilmemiz ve daha sonra bu verilerdeki kalıpları arayabilmemizdir. Tablodaki satışların boyutunda ikinci bir değer de kodlayabiliriz. Örneğin, yılın her gününde kaç satış yaptığımızı ve o günün karlı olup olmadığını bilmek isteseydik ne olurdu? Yani bu ısı haritası satış miktarına göre boyutlandırılır ve günlük kar miktarına göre renklendirilir. Haftalara ve haftanın gününe bölünür. Ve ona bakabilir ve bazı ilginç şeyler görebiliriz. Yani en büyük satış dönemimiz yılın ikinci yarısı dibe doğru, kareler daha büyük gibi görünüyor. Almanya'da Pazartesi en yavaş satış günüdür, tüm bu küçük karelere bakın. Ve birkaç gün var, 12. haftada Pazar ve 45. haftada Perşembe günü, iyi bir satış vardı, ancak yine de çok düşük kar. Turuncu renklidirler. Şimdi bu gibi durumlarda, bu sayıları tam olarak bilmiyoruz, ama mesele bu değil. Gördüğümüz şey kalıplardır. Isı haritası bize hem iyi hem de kötü olanı gösterir ve bunun hafta boyunca mı yoksa haftanın günü için mi geçerli olduğunu gösterir. Daha sonra gidip başka bir gösterge tablosunda daha fazla bilgi arayabiliriz. Daha küçük veri kümeleri için, rengin yanı sıra değeri de gösteren vurgu tablosu gerçekten iyi çalışabilir. Ancak, etiketin çok küçük olacağı daha büyük veri kümeleri için, ısı haritası mükemmel bir seçimdir.
Deneme dosyaları ile uygulama yaparken öğrenin
Eğitmenin dersi öğretmek için kullandığı dosyaları indirin. İzleyerek, dinleyerek ve uygulama yaparak öğrenin.
İçerikler
-
-
-
-
Verilerdeki karşılaştırmaları görselleştirin10 dakika 10 saniye
-
(Kilitli)
Kategoriler arası çubuk grafikler2 dakika 46 saniye
-
(Kilitli)
Zaman içinde çizgi grafikler4 dakika 52 saniye
-
(Kilitli)
Önemli olaylar için mini grafikler4 dakika 48 saniye
-
(Kilitli)
Gantt çizelgeleri ve zaman farkı4 dakika 39 saniye
-
(Kilitli)
Uzun kuyruk verileri için ağaç haritaları5 dakika 6 saniye
-
(Kilitli)
Tabloları ve ısı haritalarını vurgulayın5 dakika 58 saniye
-
(Kilitli)
Tarihler arasındaki değişiklikler için eğim grafikleri3 dakika 12 saniye
-
(Kilitli)
Küçük katlarla gösterge paneli düzenini optimize edin3 dakika 31 saniye
-
-
-
-
-
-