Może wydawać się, iż w analityce wynagrodzeń nie ma prostszego wskaźnika niż średnia arytmetyczna. Przecież już nawet dzieci w szkole podstawowej odwołują się do wskaźników bazujących na średniej - obliczają średnie ocen, by dowiedzieć się, kto jest najlepszym uczniem. Średnia arytmetyczna jako wskaźnik może wydawać się intuicyjnie zrozumiała i tak trywialna, że nie warto o niej dyskutować. Jednak, interpretacja średniej nie zawsze jest tak prosta, jak mogłoby się wydawać, a niezrozumienie, co oznacza „wartość średnia” prowadzić może do pomyłek w analizie danych o wynagrodzeniach.
Trywialna, ale problematyczna – wyzwania w interpretacji średniej arytmetycznej
Ponieważ ze średnią arytmetyczną mamy do czynienia już od lat edukacji szkolnej, niemal każdy z nas wie jak ją policzyć. Aby to zrobić, musimy zsumować wartości zmiennych w analizowanym zbiorze i podzielić uzyskany wynik przez liczbę zmiennych. Jeśli pięciu pracowników produkcji otrzymało premie w wysokości (100; 200; 300; 400; 500) PLN, to wskaźnik średniej arytmetycznej dla premii wyniesie 300 PLN, gdyż 100 + 200 + 300 + 400 + 500 = 1500 PLN, a 1500/5 = 300 PLN. Wskaźnik średniej premii w wysokości 300 PLN oznacza zatem tyle, że gdyby wrzucić uzyskane przez pracowników premie do jednego worka i podzielić je po równo między wszystkich, to każdy otrzymałby po 300 PLN (por. Mathematics Stack Exchange, 2014). Interpretacja ta jasno pokazuje, że średnia premia nie dotyczy żadnego przeciętnego czy „statystycznego” pracownika, ale odnosi się do dość abstrakcyjnej sytuacji - równego podziału przyznanych premii pomiędzy cały zespół. Średnia arytmetyczna pokazuje, co by się stało, gdyby otrzymane przez pracowników premie zebrać i podzielić po równo, opisuje zatem całą zbiorowość, a nie jakąś konkretną osobę czy grupę osób z tej zbiorowości. Tymczasem zdarza się, że na średnią arytmetyczną patrzymy jako na wskaźnik, który ma pokazać, ile zarabia jakaś konkretna osoba, „statystyczny” Polak czy „przeciętny” pracownik (Polskie Radio, 2017). Jeśli wskaźnik bazujący na średniej arytmetycznej pokazuje, że średnia premia wynosi 300 PLN, to nasuwa się nam interpretacja, że to premia „statystycznego”, czyli zwykłego, normalnego pracownika. W tej interpretacji ktoś, kto odstaje od średniej, odbiega od normy - jest „nienormalny”. Nie ma nic bardziej mylnego, jak już mówiliśmy, średnia opisuje całą zborowość, a nie jakąś, typową, „normalną” osobę, dlatego utożsamianie średniej z wartością normalną może prowadzić do błędów w interpretacji wskaźników. By uniknąć pomyłek w posługiwaniu się średnią, patrzmy na nią nie jak na wartość przypisaną do „normalnego” pracownika, ale jak na wynik równego podziału zmiennej (Mathematics Stack Exchange, 2014). Średnia premia w wysokości 300 PLN nie mówi, że „normalny” pracownik zespołu otrzymuje premię 300 PLN, ale że jeśli premie wszystkich pracowników podzielilibyśmy po równo, to każdy z nich dostałby po 300 PLN.
Ponadto, wbrew potocznym intuicjom podpowiadającym, iż średnia arytmetyczna to wartość najczęstsza wśród członków danej grupy, średnia może być wartością, która w danej grupie jest nietypowa lub w niej nie występuje. W naszym przykładzie premii dla pięciu pracowników produkcji (100; 200; 300; 400; 500) PLN, średnia premia 300 PLN nie jest wartością najczęściej przyznawaną - otrzymuje ją tylko jedna osoba. By jeszcze wyraźniej zobaczyć, że średnia nie musi być wartością najczęstszą w zbiorze zmiennych, który opisuje, spójrzmy na przykład premii dla pięciu innych pracowników (100; 100; 100; 100; 1100) PLN. Tu również średnia arytmetyczna wynosi 300 PLN, ale wartość ta w zbiorze nie występuje i daleka jest od najczęstszej czy typowej przyznawanej w tym zespole premii. By uniknąć pomyłek w analityce wynagrodzeń, pamiętajmy, że średnia arytmetyczne to nie to samo, co wartość najczęściej występująca w zbiorze wynagrodzeń, który opisuje.
Kolejne zagadnienie odnoszące się do interpretacji średniej jest szczególnie ważne przy porównaniach i benchmarkingu wynagrodzeń pomiędzy różnymi zespołami i grupami. Dotyczy ono tego, iż prowadząc analitykę wynagrodzeń, trzeba pamiętać, że taka sama wartość średniej arytmetycznej może charakteryzować zupełnie różne struktury wynagrodzeń. To kolejne spostrzeżenie, które może przeczyć naszej intuicji, że jeśli dwie grupy pracowników mają takie same średnie premie czy wynagrodzenia, to premie/wynagrodzenia są takie same w obu grupach. By to lepiej zrozumieć, spójrzmy na przykład. Załóżmy, że znów poddajemy analizie grupę pięciu pracowników, tym razem handlowców, obliczając dla nich średnią arytmetyczną premii. W tym przypadku, mamy zbiór (0; 0; 0; 0; 1500) PLN, czyli czterech handlowców nie otrzymało żadnej premii, a jeden otrzymał premię w wysokości 1500 PLN, co daje nam średnią premię 1500/5 = 300 PLN. Przypomnijmy sobie teraz, omawiany już wcześniej, zespół pracowników produkcji z premiami w wysokości (100; 200; 300; 400; 500) PLN i średnią premią 300 PLN. W zespole handlowców średnia premia wynosi 300 PLN i wśród pracowników produkcji średnia premia również wynosi 300 PLN, ale czy możemy powiedzieć, że w obu zespołach premie są podobne? Wydaje się, że nie, mimo równych wskaźników średnich premii, pracownicy otrzymywali tu diametralnie inne premie – zróżnicowanie premii było inne. Jednak gdyby ktoś z nas otrzymał informację, że średnia premia w grupie handlowców i pracowników produkcji wyniosła po 300 PLN, to być może wielu wyciągnęłoby wniosek, że obie grupy nie różnią się pod względem otrzymywanych premii. Tymczasem z punktu widzenia percepcji wynagrodzenia, sytuacja, w której cztery osoby nie otrzymują żadnej premii, a jedna ma premię ekstremalnie wysoką, jest zasadniczo inna od sytuacji, w której premie są w miarę równomiernie rozłożone pomiędzy pracowników. W analityce wynagrodzeń warto pamiętać, że takie same wartości średniej arytmetycznej mogą opisywać zupełnie różne struktury rozkładu wynagrodzeń, a równość średnich w grupach nie oznacza, że wynagrodzenia w tych grupach są takie same.
Przytaczane tu przykłady są uproszczone, ale mają na celu ilustrować to, że interpretacja średniej arytmetycznej nie jest tak trywialna jak mogłoby się wydawać. Pokazują one także wyzwania, z którymi możemy spotkać się w praktyce korzystania ze średniej arytmetycznej, jako wskaźnika w analityce wynagrodzeń. Zastanówmy się, co zrobić, by takich problemów unikać i wyciągać z analizy danych o wynagrodzeniach poprawne wnioski.
Jak radzić sobie z wyzwaniami średniej arytmetycznej w analityce wynagrodzeń?
Ponieważ średnia arytmetyczna to jeden z częściej wykorzystywanych sposobów prezentowania wskaźników w analityce wynagrodzeń, zastanówmy się, co możemy zrobić w praktyce analizy danych, by nie popadać w pułapki podczas jej interpretacji.
Tabela 1 Przykład, iż średnia arytmetyczna nie oddaje zróżnicowania w strukturze wynagrodzeń. Różne struktury premii (w PLN) w czterech zespołach, dają takie samej wartości średniej premii dla każdego zespołu.
Tabela 1 prezentuje przykładowe zestawienia premii, które otrzymali pracownicy czterech różnych zespołów A, B, C i D. Średnia premia w każdym zespole wyniosła 500 PLN, jednak wyraźnie widzimy, że premie w zespołach nie są takie same - struktura premii jest zróżnicowana. Przykładowo, w zespole A wszyscy otrzymali po 500 PLN, a w zespole C mamy dwie grupy: jedną, która otrzymała 900 PLN i drugą, która otrzymała tylko 100 PLN premii. W naszym przykładzie z tabeli 1 mamy niewielu pracowników, więc możemy dostrzec różnice w strukturze premii pomiędzy zespołami, patrząc tylko na zestawienie tabelaryczne. Co jednak zrobić, gdy mamy do analizy dane o wynagrodzeniach dziesiątek, setek czy nawet tysięcy pracowników? Potrzebujemy wskaźników, które będą uzupełnieniem dla średniej arytmetycznej i pozwolą ocenić to, jaka jest struktura wynagrodzeń bez żmudnego przeglądania dziesiątek wierszy w tabelach.
Niektórzy sugerują, że uzupełnieniem średniej czy nawet wskaźnikiem, który powinien ją w analityce wynagrodzeń zastępować, może być mediana. Mediana jest to, najprościej rzecz ujmując, wartość środkowa, dzieląca zbiór obserwacji na dwie równe części. Przykładowo, jeśli w naszym pięcioosobowym zespole przyznaliśmy premie w wysokości (100; 200; 400; 500; 600) PLN, to mediana wyniesie 400 PLN, gdyż jest to wartość środkowa, znajdująca się w środku zbioru danych ułożonych od najmniejszej do największej wartości. Dla zbiorów mających parzystą liczbę elementów – gdzie nie ma jednego punktu środkowego, mediana zwykle jest średnią arytmetyczną dwóch sąsiadujących obserwacji „środkowych”. Przykładowo dla zbioru czterech premii w wysokości (100; 200; 400; 500) PLN, mediana wyniesie 300 PLN, bo jest to średnia arytmetyczna dwóch wartości środkowych: 200 PLN i 400 PLN. Mediana bywa preferowana w analityce wynagrodzeń, gdyż jest odporna na skrajne wartości, które dość często w przypadku wynagrodzeń obserwujemy. Jeśli wrócimy do naszych przykładów z początku tekstu to zobaczymy, że mediana premii dla pięciu pracowników produkcji (100; 200; 300; 400; 500) wyniesie 300 PLN, ale już dla pięciu handlowców o premiach (0; 0; 0; 0; 1500) mediana premii wyniesie 0 PLN.
Mediana często jest pomocna w analityce wynagrodzeń, jednak niestety nie w naszym przykładzie prezentowanym w tabeli 1. Jeśli spojrzymy na wartości środkowe dla każdego z zespołów A, B, C i D, to zobaczymy, że wynoszą one dla każdego z nich po 500 PLN, dokładnie tyle samo co średnia arytmetyczna. Dla zespołów A, B i D dwie środkowe obserwacje to 500 PLN, więc ich średnia to również 500 PLN. W przypadku zespołu C, dwie środkowe wartości, to 900 i 100, a ich średnia arytmetyczna daje w rezultacie medianę 500 PLN. Zatem, w tym przypadku zarówno średnie, jak i mediany są sobie równe, choć gołym okiem w tabeli 1 widać, że rozkłady premii w zespołach A, B, C i D są inne, a konkluzja, że każdy zespół otrzyma takie same premie jest nieuzasadniona i może mieć poważne negatywne skutki w praktyce wynagradzania. Z przedstawionego przykładu wynika, że zastąpienie średniej medianą nie rozwiązuje problemów, jakie pojawiają się w interpretacji wskaźników w analityce wynagrodzeń.
Mediany nie może zastąpić średnia, gdyż zarówno mediana, jak i średnia arytmetyczna, to miary z tej samej kategorii, wskaźniki tendencji centralnej w zbiorze danych, pokazują one punkt skupienia, który stanowi różnie wyliczone centrum zbioru danych (por. Mathematics Stack Exchange, 2014). Nie pokazują jednak jak bardzo zróżnicowana jest struktura wynagrodzeń w analizowanej grupie. Do tego potrzebujemy drugiej kategorii miar, wskaźników rozproszenia, które możemy nazwać także wskaźnikami dyspersji wynagrodzeń (por. APA, 2012). Zatem, by uniknąć błędów interpretacyjnych, jakie generować mogą w analityce wynagrodzeń miary tendencji centralnej, czy to średnia czy mediana, powinniśmy je uzupełniać wskaźnikami dyspersji – pokazującymi rozproszenie wynagrodzeń. Innymi słowy, nigdy nie możemy zadowalać się jednym wskaźnikiem pokazującym punkt skupienia wynagrodzeń, ale powinniśmy także dążyć do analizy wskaźników, które mówią nam o tym, w jaki sposób wynagrodzenia w danej grupie są rozproszone. Zastępowanie średniej medianą w analityce wynagrodzeń niewiele nam pomoże, bo w swej istocie są to miary z tej samej kategorii, pokazują tylko punkt centralny danych, ale nie oddają zmienności wynagrodzeń.
Wskaźniki rozproszenia w analityce wynagrodzeń
Jednym z najprostszych wskaźników rozproszenia, które można używać w praktyce analityki wynagrodzeń, by uzupełnić wskaźniki tendencji centralnej (średnia, mediana) jest rozstęp. Rozstęp obliczać można na wiele sposobów, ale najbardziej intuicyjna wersja to po prostu różnica pomiędzy największą i najmniejszą wartością w zbiorze danych. Dla naszej przykładowej grupy pracowników produkcji o premiach (100; 200; 300; 400; 500) PLN, rozstęp będzie to różnica pomiędzy najwyższą 500 PLN a najniższą 100 PLN wartością premii, wynoszącą 500 – 100 = 400 PLN. Dla drugiej z przykładowych grup, handlowców o premiach (0; 0; 0; 0; 1500) PLN, rozstęp wyniesie 1500 PLN, co wynika z tego, że wartość największa to 1500 PLN, a najmniejsza 0 PLN. Spójrzmy teraz na prezentację średnich wskaźników wynagrodzeń uzupełnianą o informację na temat zmienności wynagrodzeń. Dla grupy pracowników produkcji średnia, jak pamiętamy, wynosi 300 PLN, a dyspersja wyrażona wskaźnikiem rozstępu premii wynosi 400 PLN, dla grupy handlowców średnia arytmetyczna z premii również wynosi 300 PLN, ale dyspersja to 1500 PLN. Uzupełnienie średniej o jeden tylko wskaźnik zmienności - rozstęp, pozwala zauważyć, że mimo równości średnich, premie w obu analizowanych grupach mają inną strukturę. Przyglądając się danym w tabeli 1, dla których wszystkie zespoły miały średnią i medianę równą 500 PLN, zauważymy, że wskaźnik rozstępu je istotnie różnicuje. Dla zespołu A rozstęp wyniesie 0, ponieważ wszyscy pracownicy uzyskali takie same premie równe 500 PLN, zatem maksymalna i minimalna wartość premii to 500 PLN, a 500 – 500 = 0. W zespole B różnica między najwyższą (1000 PLN) a najniższą wartością premii (125 PLN) wynosi 875 PLN, a w zespołach C i D rozstęp wynosi 800 PLN, bo w obu grupach najwyższą wartością jest 900 PLN, a najniższą 100 PLN. W ten sposób prezentując wskaźniki widzimy, że w zespole A średnia wyniosła 500 PLN a rozstęp 0 PLN, podczas gdy w zespole D średnia co prawda też wyniosła 500 PLN, ale rozstęp wyniósł 800 PLN. Co od razu zwraca naszą uwagę, że struktura premii w tych zespołach nie jest taka sama. Wykorzystanie wskaźników rozstępu jako miar rozproszenia wynagrodzeń pozwala zauważyć, że mimo równości średnich, struktura wynagrodzeń w obu grupach nie jest równa.
Istnieje oczywiście o wiele więcej wskaźników dyspersji wynagrodzeń (Manikandan, 2011; Wikipedia, 2021; OpenStax, 2021 ) niż tylko wskaźnik rozstępu, np.: wariancja, odchylenie standardowe czy rozstęp międzykwartylowy. Sam wskaźnik rozstępu ma również swoje wady, pokazuje zróżnicowanie danych pomiędzy największą i najmniejszą wartością, ale nie pokazuje, w jaki sposób dane rozpraszają się dookoła punktu centralnego (mediany, średniej). Jednak innymi wskaźnikami dyspersji wynagrodzeń i ich wadami oraz zaletami zajmiemy się w kolejnych artykułach. Głównym celem tego tekstu jest zwrócenie uwagi na wyzwania w interpretacji wskaźników bazujących na średniej arytmetycznej. W praktyce wynagradzania nie wystarczy posługiwanie się jedynie wskaźnikami ilustrującymi tendencję centralną. Jeśli chcemy prowadzić rzetelną analitykę wynagrodzeń i unikać błędnych interpretacji, wskaźniki dyspersji wynagrodzeń są koniecznym uzupełnieniem wskaźników tendencji centralnej, takich jak średnia czy mediana. Jeśli pominiemy wskaźnik rozproszenia, możemy w efekcie analizy danych o wynagrodzeniach dojść do niepoprawnych wniosków, np. uznać, że struktura wynagrodzeń jest taka sama, bo dwie grupy pracowników mają takie same średnie wynagrodzenia.
Podsumowanie
- Średnia arytmetyczna nie opisuje wynagrodzenia „statystycznego” czy „normalnego” pracownika, ale opisuje całą zbiorowość, do której się odnosi
- Średnia arytmetyczna nie jest wartością najczęstszą w zbiorze wynagrodzeń, który opisuje
- Równość średnich arytmetycznych pomiędzy dwiema grupami nie świadczy o równości struktur wynagrodzenia
- Wskaźniki odwołujące się do średniej czy mediany powinny być podawane wraz z wskaźnikami rozproszenia - dyspersji wynagrodzenia, np. rozstępem, odchyleniem standardowym