Reguła trzech sigm

regula-trzech-sigmReguła trzech sigm w swojej klasycznej postaci jest nieodzownie związana z pojęciem odchylenia standardowego (oznaczanego przeważnie jako σ) i rozkładu normalnego. Metoda ta umożliwia nam błyskawiczne określenie przedziałów, w których znajduje się określony liczba obserwacji, bez konieczności stosowania skomplikowanych wzorów.

W sytuacji, kiedy mamy do czynienia z rozkładem normalnym lub zbliżonym do niego w przedziale:
[μ−1σ,μ+1σ] znajduje się 68,2% wszystkich obserwacji (przedział nazywany czasami „typowym obszarem zmienności”),
[μ−2σ,μ+ 2σ] znajduje się 95,4% wszystkich obserwacji,
[μ−3σ,μ+3σ] znajduje się 99,7% wszystkich obserwacji.
Dodatkowo warto podać przedział dla czterech odchyleń standardowych [μ−4σ,μ+4σ], w którym znajduje się 99,994% wszystkich obserwacji.

Przykłady

Wykorzystamy dane z wpisu o odchyleniu standardowym, oczywiście musimy przyjąć, że posiadaliśmy większa ilość obserwacji do obliczeń, a ich rozkład był normalny. Dla przypomnienia, w Warszawie średni koszt wynajmu lokalu wyniósł 1000 zł z odchyleniem standardowym 231, a w Krakowie średnia wyniosła również 1000 zł lecz z odchyleniem standardowym 100.

Założenie 1
Poszukujemy lokalu do wynajęcia w Krakowie za kwotę od 900 do 1100 zł.

Odchylenie standardowe wynosi w Krakowie 100, więc mamy do czynienia z odchyleniem na plus lub minus o jedno odchylenie standardowe, więc 62,8 wszystkich lokali odpowiada naszym wymaganiom cenowym.

Założenie 2
Lubimy życie w luksusie, więc poszukujemy mieszkania do wynajęcia w Krakowie za ponad 1200 zł.

W tym wypadku stosujemy trochę zmienioną metodologię niż poprzednio, od 100% reprezentujących wszystkie lokale odejmujemy 95,4% (lokale w przedziale cenowym 800-1200 zł), a następnie otrzymany wynik dzielimy przez 2 (pozwali nam to wykluczyć wszystkie lokale tańsze niż 800 zł). Ostatecznie możemy stwierdzić, że 2,3% wszystkich lokali w Krakowie spełnia nasze wymagania.

Założenie 3
Jako biedny przedsiębiorca poszukujemy taniego lokalu z czynszem do 550 zł miesięcznie, dodatkowo jest nam obojętne czy będzie się on znajdował w Warszawie czy Krakowie.

Zacznijmy od Krakowa, w którym znalezienie takiego lokalu jest praktycznie niemożliwe. Wymagany poziom różni się od średniej o ponad 4 odchylenia standardowe więc prawdopodobieństwo  jest mniejsza niż 0,0065 (dokładniejsze oszacowanie wymagało by zastosowania odpowiednich wzorów).

W Warszawie natomiast znalezienie odpowiedniego lokalu jest łatwiejsze i na pewno ponad 2,3% wszystkich lokali spełnia nasz wymóg odnoście wysokości miesięcznego czynszu. Dokładniej mówiąc nasza wartość mieści się gdzieś w przedziale pomiędzy 2,3%, a 15,9% (tutaj również do precyzyjnego oszacowania niezbędne są odpowiednie wzory).

Wnioski i zastosowania

Łatwo zauważyć na podstawie trzeciego przykładu, że reguła trzech sigm ma swoje mankamenty i ograniczenia, w normalnych warunkach przeważnie nie podaje dokładnych wartości, lecz przedziały. Jednakże prosta tego narzędzia sprawia, że jest ono często wykorzystywane na wiele sposobów w różnych dziedzinach.

W sektorze bankowym i sektorze ubezpieczeniowym tworzy się specjalne algorytmy mające wykrywać nietypowe, anormalne zjawiska i zachowania prowadzące np. do wyłudzeń ubezpieczeń. Te często skomplikowane algorytmy nierzadko są po prostu udoskonaloną wersją mechaniki działania reguły trzech sigm dostosowaną do indywidualnych potrzeb przedsiębiorstwa.