Analiza wykresu – procentowy udział w sprzedaży

Witam,
Dzisiaj chciałbym podzielić się moją pasją, czyli wizualizacją danych. W prostych słowach: przedstawię kolejne kroki w tworzeniu maksymalnie prostego i czytelnego wykresu przedstawiającego udział w sprzedaży pewnych grup towarowych. W przykładowym pliku znajduje się kilkadziesiąt grup towarowych, wraz z ich procentowym udziałem w sprzedaży.

Łatwo pokusić się o stworzenie wykresu kołowego:

Domyślny wykres kołowy

Wady takiego rozwiązania są od razu widoczne:

  • Legenda nie mieści się na wykresie, a ilość kolorów i odcieni bardzo utrudnia identyfikowanie poszczególnych kawałków „tortu”,
  • Porównywanie poszczególnych wartości jest niemal niemożliwe,
  • Grupy produktowe o niskich wartościach są niewidoczne.
Stosując taki wykres nie osiągamy głównego celu tworzenia wykresu, czyli łatwej metody porównywania poszczególnych wartości. Chciałbym też, aby wykres był w stanie zastąpić źródłową tabelę, wprowadzając dodatkową wartość dla odbiorcy.
Spróbuję więc zastosować wykres kolumnowy:
Jest już dużo lepiej. Wyeliminowałem zbędną ferię barw. Poszczególne grupy można łatwo połączyć z odpowiadającymi im słupkami i bez problemu porównać poszczególne grupy.
Problemem na pewno jest fakt, że nie wszystkie etykiety grup towarowych mieszczą się na wykresie. Widzimy wszystkie słupki, nie wszystkie jednak są opisane. Problem ten rozwiązuje rozciągnięcie wykresu w poziomie:
Wszystkie słupki są już identyfikowane przez etykiety. Problemem tym razem jest skośne wyświetlanie nazw. Łatwo przekonać się, że jest to problem próbując czytać książkę przekrzywioną o 45 stopni. Chciałbym, aby odbiorca wykresu był w stanie jednym rzutem oka zapoznać się z wykresem bez potrzeby gimnastykowania szyi. Stworzę więc wykres słupkowy, który od razy rozciągnę w pionie, aby zobaczyć wszystkie etykiety.
Wszystkie wcześniejsze problemy zostały rozwiązane, uważam, że jest to najlepszy rodzaj wykresu dla tego zadania. Przejdę teraz do zabiegów zwiększających jego funkcjonalność i czytelność.
Na pewno oczywistym krokiem jest usunięcie legendy, skoro zawiera ona tylko jedną pozycję, oraz nadanie odpowiedniego tytułu.
Chciałbym, aby wykres ten był w stanie całkiem zastąpić źródłową tabelkę. Dodam więc etykiety do każdego słupka. Skoro przy każdej pozycji znajdować się będzie etykieta, oś pozioma nie będzie potrzebna, tak samo jak pionowe linie siatki. Ponieważ etykiety osi (nazwy grup) są położone bezpośrednio obok słupków, to znaczniki osi pionowej stanowią element czysto dekoracyjny, je także usunę.
Wykres spełnia już zamierzone cele i nie posiada żadnych elementów, które nie służą przekazaniu informacji. Można by na tym skończyć. Chciałbym zwrócić uwagę na jeszcze jeden element. Proszę zauważyć na rozłożenie etykiet danych (wartości procentowe). Są one ułożone zgodnie z wielkościami słupków danych. Skoro tak, uważam, że same słupki też nie są potrzebne, usuwam więc wypełnienie:
Osiągam więc maksymalnie prosty i estetyczny wykres, który służy niczemu innemu, niż przekazywaniu informacji bez zakłóceń.
Bardzo jestem ciekaw waszych opinii na ten temat. Tematyka wizualizacji danych w Polsce praktycznie nie istnieje lub ogranicza się do kursów tworzenia wizualnych fontann. Niedawno uruchomiłem możliwość komentowania moich wpisów, zapraszam więc do wyrażania swoich opinii, szczególnie tych krytycznych.
Osobom zainteresowanym zagadnieniem polecam doskonałe książki Edwarda Tufte. Niestety nie mam informacji o wydaniach w języku polskim, a wielka szkoda…

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *