Drzewa decyzyjne w matematyce: jak je rysować i czytać?

0
28
4/5 - (1 vote)

Spis Treści:

Czym jest drzewo decyzyjne w matematyce?

Intuicyjna definicja drzewa decyzyjnego

Drzewo decyzyjne to graficzny sposób przedstawienia procesu podejmowania decyzji krok po kroku. Zamiast trzymać w głowie wszystkie możliwe warianty, rysuje się je jako rozgałęziające się ścieżki. Na początku znajduje się pojedynczy punkt startowy (korzeń), od którego wychodzą gałęzie odpowiadające różnym wyborom lub wynikom losowym. Idąc po gałęziach od lewej do prawej, odtwarza się cały proces decyzyjny.

W matematyce i teorii decyzji drzewo decyzyjne łączy trzy elementy: decyzje, niepewność i skutki (wyniki). Każdy etap decyzji lub losu jest pokazany jako węzeł, a każda możliwa odpowiedź – jako gałąź. Dzięki temu można analizować złożone sytuacje w sposób uporządkowany i obiektywny.

Najważniejsza cecha drzewa decyzyjnego: każda ścieżka od początku do końca odpowiada jednemu kompletnemu scenariuszowi – od pierwszej decyzji aż po końcowy skutek. Dzięki temu łatwo porównać scenariusze między sobą, np. pod kątem zysku, kosztu czy ryzyka.

Elementy składowe drzewa decyzyjnego

Standardowe drzewo decyzyjne składa się z kilku typów węzłów i połączeń między nimi. W wersji matematycznej (stosowanej w teorii decyzji i ekonomii) wyróżnia się przede wszystkim:

  • węzeł decyzyjny – punkt, w którym decydent dokonuje świadomego wyboru spośród kilku opcji,
  • węzeł losowy – punkt, w którym o dalszym przebiegu sytuacji decyduje przypadek (np. pogoda, reakcja rynku),
  • węzeł końcowy (terminalny) – punkt, w którym proces się zatrzymuje i znamy już rezultat,
  • gałęzie – odcinki łączące węzły, oznaczające konkretne decyzje lub wyniki losowe.

Każdy z tych elementów ma swoje znaczenie przy liczeniu wartości oczekiwanej lub przy analizie ryzyka. Żeby drzewo można było czytać i liczyć, wszystkie elementy muszą być logicznie uporządkowane, a dane (prawdopodobieństwa, koszty, zyski) przypisane w czytelny sposób.

Dlaczego drzewa decyzyjne są tak użyteczne?

Drzewa decyzyjne w matematyce pomagają zapanować nad złożonością. Nawet prosta sytuacja z dwiema decyzjami i kilkoma możliwymi wynikami szybko „rozrasta się” w wiele scenariuszy. Bez notacji graficznej człowiek łatwo traci orientację. Drzewo wymusza uporządkowanie:

  • co jest decyzją, a co losowym zdarzeniem,
  • w jakiej kolejności następują po sobie kroki,
  • jakie są konsekwencje każdej ścieżki,
  • jakie wartości trzeba policzyć (koszt, zysk, wartość oczekiwana).

Graficzna forma ułatwia wspólną dyskusję w zespole, prezentację wariantów przełożonemu, a także obronę przyjętych założeń. Z matematycznego punktu widzenia drzewo decyzyjne pozwala zastosować zasady rachunku prawdopodobieństwa i wartości oczekiwanej w sposób przejrzysty i możliwy do sprawdzenia krok po kroku.

Podstawowe symbole i notacja w drzewach decyzyjnych

Węzły decyzyjne, losowe i końcowe

Aby drzewo decyzyjne było czytelne, używa się umownych symboli graficznych. W świecie praktyki (ekonomia, zarządzanie, inżynieria) stosuje się najczęściej:

  • Kwadratwęzeł decyzyjny. W tym miejscu podmiot podejmuje wybór. Od kwadratu odchodzą gałęzie reprezentujące dostępne strategie lub działania.
  • Kółkowęzeł losowy. Tutaj o dalszym przebiegu decyduje los. Do każdej gałęzi wychodzącej z kółka przypisuje się prawdopodobieństwo.
  • Trójkąt lub „goły” koniec liniiwęzeł końcowy. Często oznacza się go po prostu końcem gałęzi z dopisanym wynikiem (np. wartością wypłaty).

Nie ma jednego „świętego” standardu symboli, ale w matematyce stosowany jest powyższy zestaw. Dzięki niemu osoba patrząca na drzewo od razu widzi, gdzie podejmowana jest decyzja, a gdzie pojawia się niepewność.

Gałęzie decyzji i przebieg zdarzeń losowych

Od węzłów odchodzą gałęzie w prawo. Każda gałąź powinna być krótko opisana. Dla węzłów decyzyjnych opis gałęzi to nazwa działania, np.:

  • „Inwestycja A”,
  • „Inwestycja B”,
  • „Rezygnacja”.

Dla węzłów losowych opis gałęzi to wynik losowy, np.:

  • „Wysoki popyt”,
  • „Średni popyt”,
  • „Niski popyt”.

W pobliżu gałęzi losowych dopisuje się prawdopodobieństwo wystąpienia danego wyniku. Można je zapisać jako ułamek, liczbę dziesiętną lub procent, np. 0,3 lub 30%. Ważne, aby suma prawdopodobieństw gałęzi wychodzących z jednego węzła losowego była równa 1. To podstawowy warunek poprawności matematycznej drzewa decyzyjnego.

Oznaczanie kosztów, zysków i wypłat

Drzewa decyzyjne są konstruowane po to, aby porównywać skutki różnych decyzji. Skutki te najczęściej opisuje się liczbami, np.:

  • zyskiem lub stratą finansową,
  • kosztem całkowitym,
  • czasem realizacji,
  • liczbą błędów lub awarii.

W klasycznej teorii decyzji te liczby nazywa się wypłatami. Wypłatę przypisuje się do każdej końcowej gałęzi drzewa (do węzła końcowego). Można je oznaczać nad lub pod końcem gałęzi, np. „+100”, „-20”, „1500 zł”, „czas = 5 dni”.

Jeśli w trakcie procesu podejmowania decyzji ponoszone są koszty (np. koszt badań, koszt opóźnienia), można je zapisywać przy odpowiednich gałęziach lub w specjalnych komentarzach obok węzłów. Istnieją dwa podejścia:

  • sumowanie wszystkich kosztów w wypłacie końcowej – węzeł końcowy ma już „rozliczoną” wartość,
  • oddzielne zaznaczanie kosztów i przychodów – a dopiero w analizie matematycznej liczy się wartość netto.

Najważniejsze, by w całym drzewie stosować spójny sposób zapisu, tak aby łatwo można było zrozumieć, skąd biorą się ostateczne wyniki.

Jak krok po kroku narysować proste drzewo decyzyjne?

Określenie problemu i decyzji początkowej

Rysowanie drzewa decyzyjnego zaczyna się zawsze od precyzyjnego zdefiniowania problemu. Aby drzewo dało się w ogóle skonstruować, trzeba jasno określić:

  • kto podejmuje decyzję,
  • co dokładnie ma zostać wybrane,
  • jakie są możliwe działania na pierwszym etapie.

Następnie po lewej stronie kartki (lub ekranu) rysuje się węzeł początkowy. Jeśli od razu mamy do czynienia z wyborem, jest to kwadrat – węzeł decyzyjny. Od niego w prawo wychodzą proste linie – gałęzie – odpowiadające poszczególnym opcjom. Każdą gałąź opisuje się krótką nazwą decyzji.

Na tym etapie nie rysuje się jeszcze zdarzeń losowych ani wyników końcowych. Najważniejsze jest uchwycenie struktury decyzji: jakie są możliwe pierwsze kroki i w jakiej kolejności następują kolejne decyzje.

Dodawanie zdarzeń losowych i prawdopodobieństw

Kolejny etap to wprowadzenie niepewności. W miejscach, gdzie rezultat nie zależy już od woli decydenta, lecz od czynników losowych, wstawia się kółko – węzeł losowy. Od niego odchodzą gałęzie reprezentujące różne możliwe wyniki.

Polecane dla Ciebie:  Zastosowania teorii decyzji w ekonomii

Dla każdego węzła losowego trzeba ustalić:

  • kompletną listę możliwych wyników,
  • prawdopodobieństwo każdego wyniku,
  • czy wyniki są wzajemnie wykluczające się (zwykle tak).

Obok każdej gałęzi z węzła losowego zapisuje się prawdopodobieństwo. Jeśli prawdopodobieństwa pochodzą z danych historycznych, modeli statystycznych lub subiektywnych ocen eksperta – należy stosować jeden wybrany sposób szacowania w całym drzewie.

Po dodaniu zdarzeń losowych i prawdopodobieństw drzewo zaczyna przypominać pełny model – mamy już zarówno świadome wybory, jak i elementy losowe.

Wprowadzanie wypłat w węzłach końcowych

Ostatni krok rysowania prostego drzewa decyzyjnego to określenie wypłat w węzłach końcowych. Dla każdej ścieżki od korzenia do końca trzeba ustalić jedną liczbę opisującą skutek tej ścieżki. Często jest to wartość finansowa, ale może to być dowolna wielkość, którą chcemy optymalizować.

Aby poprawnie zdefiniować wypłatę dla ścieżki, trzeba:

  1. zidentyfikować wszystkie koszty i zyski związane z daną ścieżką,
  2. przeliczyć je do wspólnej jednostki (np. złotówki, godzin),
  3. zsumować je (z uwzględnieniem znaków plus/minus).

Uzyskaną wartość zapisuje się przy węźle końcowym. Jeśli drzewo jest większe i ma kilka poziomów, ten krok może być najbardziej pracochłonny – ale bez niego nie da się potem drzewa poprawnie „czytać” i analizować pod kątem wyboru najlepszej decyzji.

Czytanie drzewa decyzyjnego: ścieżki, scenariusze i logika

Jak prześledzić pojedynczą ścieżkę decyzyjną?

Czytanie drzewa decyzyjnego polega na śledzeniu ścieżek od lewej do prawej. Pojedyncza ścieżka reprezentuje jeden scenariusz, czyli ciąg zdarzeń: decyzja – wynik losowy – kolejna decyzja – kolejny wynik – … – rezultat końcowy.

Żeby odczytać sens ścieżki, wykonuje się serię prostych kroków:

  1. start od węzła początkowego,
  2. odczytanie wybranej decyzji (gałęzi od kwadratu),
  3. odczytanie wyniku losowego (gałęzi od kółka),
  4. kontynuacja, aż do węzła końcowego,
  5. odczytanie wypłaty końcowej.

Dzięki takiemu prześledzeniu można opisać scenariusz słownie, np.: „Jeśli wybierzemy inwestycję A, a popyt okaże się wysoki, otrzymamy zysk 200 jednostek”. Każda gałąź to jedno „jeśli”, a węzeł końcowy to „wtedy”.

Relacja między gałęziami: alternatywy i rozłączność

W drzewie decyzyjnym gałęzie wychodzące z jednego węzła opisują alternatywy. Z interpretacji matematycznej wynika kilka ważnych reguł:

  • Gałęzie z węzła decyzyjnego to wykluczające się działania – decydent wybiera jedną gałąź (jeden sposób postępowania).
  • Gałęzie z węzła losowego to wykluczające się zdarzenia – w rzeczywistości zrealizuje się dokładnie jedna z gałęzi (jeden wynik losowy).
  • Zbiór gałęzi od węzła losowego powinien być zupełny – uwzględnia wszystkie możliwe wyniki.

Dzięki temu drzewo decyzyjne ma właściwości modelu probabilistycznego: ścieżki są rozłączne, a ich prawdopodobieństwa można sumować. Bez tej rozłączności i zupełności interpretacja matematyczna byłaby rozmyta, a obliczenia wartości oczekiwanych – błędne.

Jak interpretować wypłaty i porównywać scenariusze?

Węzły końcowe z przypisanymi wypłatami tworzą listę wszystkich możliwych rezultatów wraz z odpowiadającymi im scenariuszami. Czytając drzewo, można wybrać:

  • najlepszy scenariusz pod względem samej wypłaty (ignorując prawdopodobieństwa),
  • scenariusze realistyczne – te, które mają łączną wysoką szansę realizacji,
  • scenariusze skrajne – np. największy zysk i największa strata.

Jednak pełna analiza matematyczna wymaga uwzględnienia prawdopodobieństw. Czytając drzewo decyzyjne, nie porównuje się bezpośrednio tylko wypłat końcowych, lecz także to, jak często mogą się one zdarzyć. Tu pojawia się pojęcie wartości oczekiwanej, o której więcej w kolejnej sekcji.

Sprzedawca omawia szczegóły auta z klientem w salonie samochodowym
Źródło: Pexels | Autor: Gustavo Fring

Wartość oczekiwana: jak policzyć „średni” wynik decyzji?

Definicja wartości oczekiwanej w drzewie

Wartość oczekiwana (oznaczana często jako EV, od ang. expected value) to średni rezultat, jakiego można się spodziewać przy wielokrotnym powtarzaniu tej samej decyzji w identycznych warunkach losowych. W kontekście drzewa decyzyjnego łączy ona wypłaty końcowe z prawdopodobieństwami ścieżek.

Jeśli dana ścieżka ma wypłatę (X) i prawdopodobieństwo zajścia (p), to jej wkład do wartości oczekiwanej wynosi (p cdot X). Wartość oczekiwaną całego węzła losowego otrzymuje się, sumując takie iloczyny dla wszystkich gałęzi wychodzących z tego węzła.

Obliczanie wartości oczekiwanej w węźle losowym

Algorytm liczenia wartości oczekiwanej w węźle losowym jest zawsze taki sam:

  1. Dla każdej gałęzi od węzła losowego ustalić wypłatę końcową ścieżki.
  2. Przypomnieć sobie prawdopodobieństwo tej gałęzi.
  3. Policzyć iloczyn: wypłata × prawdopodobieństwo.
  4. Zsumować wszystkie iloczyny.

W zapisie matematycznym wygląda to tak:

(EV = p_1 cdot X_1 + p_2 cdot X_2 + dots + p_n cdot X_n),

gdzie (X_i) to wypłata przy wyniku nr (i), a (p_i) to jego prawdopodobieństwo.

Jeśli prawdopodobieństwa zostały poprawnie zdefiniowane (suma równa 1, rozłączność wyników), taki rachunek daje jednoznaczny „średni” rezultat losowej części drzewa.

Porównywanie decyzji na podstawie wartości oczekiwanej

Węzły decyzyjne analizuje się inaczej niż losowe. Tutaj decydent wybiera gałąź, więc nie sumuje się wyników ważonych prawdopodobieństwem, tylko porównuje się całkowite wartości oczekiwane ścieżek wychodzących z węzła.

Procedura jest wtedy dwuetapowa:

  1. Dla każdej gałęzi od węzła decyzyjnego policzyć wartość oczekiwaną „dalej” po prawej stronie (uwzględniając wszystkie kolejne węzły losowe i decyzje).
  2. Porównać uzyskane wartości i wybrać gałąź z najlepszym wynikiem (np. największym zyskiem lub najmniejszym kosztem).

Jeśli drzewo mierzy zyski, zaznacza się przy węźle decyzyjnym maksimum z tych wartości. Jeśli analizowanym kryterium jest koszt, szuka się minimum.

Rozwiązywanie drzewa „od końca”: metoda wstecznej indukcji

Na czym polega analiza od końca?

Formalne „czytanie” drzewa, aby wybrać najlepszą decyzję, wykonuje się od prawej do lewej, krok po kroku. Ta metoda nosi nazwę wstecznej indukcji (ang. backward induction). Zamiast od razu porównywać całe, często rozbudowane scenariusze, upraszcza się drzewo, zastępując fragmenty jego wartościami liczbowymi.

W praktyce wygląda to jak systematyczne „zwijanie” drzewa:

  • najpierw przelicza się węzły najbardziej prawe – te, po których od razu występują węzły końcowe,
  • następnie przesuwa się obliczenia o poziom w lewo,
  • całość kończy się w węźle początkowym, gdzie otrzymujemy wartość oczekiwaną każdej głównej decyzji.

Kroki wstecznej indukcji

Stosuje się naprzemiennie dwa rodzaje operacji – w zależności od tego, czy węzeł jest losowy, czy decyzyjny.

  1. Węzeł losowy (kółko) – liczenie średniej ważonej:

    • dla każdej gałęzi zna się już wypłatę lub wartość oczekiwaną na końcu gałęzi,
    • mnoży się ją przez prawdopodobieństwo danej gałęzi,
    • suma tych iloczynów to wartość oczekiwana węzła losowego.
  2. Węzeł decyzyjny (kwadrat) – wybór maksimum lub minimum:

    • dla każdej gałęzi zna się już wartość oczekiwaną „dalej”,
    • porównuje się te wartości,
    • wybiera się najlepszą i przypisuje ją do węzła decyzyjnego.

Taki cykl powtarza się aż do osiągnięcia korzenia drzewa. W efekcie cada z głównych decyzji początkowych ma jedną liczbę – swoją wartość oczekiwaną – oraz wiemy, która ścieżka jest optymalna przy założonym kryterium.

Zaznaczanie optymalnej ścieżki na rysunku

Po wykonaniu obliczeń dobrze jest wyraźnie pokazać na rysunku, jaki ciąg decyzji jest najlepszy. Stosuje się tu prostą konwencję graficzną:

  • optymalne gałęzie od węzłów decyzyjnych podkreśla się grubszą linią lub kolorem,
  • pod węzłami decyzyjnymi można dopisać: „wybierz: Inwestycja A” itp.,
  • warianty odrzucone pozostawia się cienką linią, bez dodatkowych oznaczeń.

Dzięki temu nawet osoba, która nie śledzi wszystkich obliczeń, widzi „trasę” rekomendowaną przez model matematyczny.

Ryzyko i niepewność w drzewach decyzyjnych

Nie tylko średni wynik: rozrzut i skrajności

Wartość oczekiwana to jedno kryterium. Często jednak równie ważne jest, jak bardzo wyniki mogą się różnić od tego średniego. Dwa warianty o tej samej wartości oczekiwanej mogą mieć zupełnie inny profil ryzyka: jeden „bezpieczny” (małe odchylenia, brak skrajnych strat), drugi „hazardowy” (szansa na duży zysk, ale też duża możliwa strata).

Analizując drzewo, dobrze jest więc spojrzeć na:

  • najlepsze i najgorsze wypłaty dostępne przy danej decyzji,
  • prawdopodobieństwo bardzo niekorzystnych wyników (np. strat),
  • „rozkład” wyników – ile ścieżek prowadzi do strefy zadowalającej, a ile do nieakceptowalnej.

To ważne np. w decyzjach finansowych: projekt o większej wartości oczekiwanej, ale z wysokim ryzykiem bankructwa, może być odrzucony na rzecz spokojniejszej alternatywy.

Postawy wobec ryzyka: awersja, neutralność, skłonność

Matematycznie można założyć, że decydent:

  • jest neutralny wobec ryzyka – wtedy patrzy wyłącznie na wartość oczekiwaną,
  • wykazuje awersję do ryzyka – preferuje bezpieczniejsze warianty, nawet kosztem niższej średniej wypłaty,
  • ma skłonność do ryzyka – jest gotowy zaakceptować niebezpieczeństwo dużej straty w zamian za szansę wyjątkowo wysokiego zysku.
Polecane dla Ciebie:  Reguła Laplace’a, Hurwicza i Savage’a – porównanie modeli

Drzewa decyzyjne same z siebie nie narzucają postawy wobec ryzyka – jedynie porządkują możliwe scenariusze i ułatwiają wprowadzanie kryteriów zgodnych z preferencjami decydenta.

Wprowadzenie funkcji użyteczności

Jeśli zwykłe sumy pieniędzy nie oddają preferencji dotyczących ryzyka, można przypisać każdej wypłacie nie jej „surową” wartość, lecz użyteczność (subiektywną wartość dla decydenta). Wtedy w drzewie zamiast kwot liczy się wartości oczekiwane użyteczności.

Metoda jest podobna:

  1. Każdej możliwej wypłacie (X) przypisuje się wartość użyteczności (u(X)) – np. w skali 0–1.
  2. Wartość oczekiwaną w węzłach losowych liczy się jako (EV_u = sum p_i cdot u(X_i)).
  3. Węzły decyzyjne porównuje się na podstawie wartości oczekiwanej użyteczności, a nie pieniędzy.

Takie podejście pozwala formalnie modelować np. niechęć do dużych strat lub ograniczoną satysfakcję z bardzo wysokich zysków.

Typowe błędy przy rysowaniu i interpretacji drzew decyzyjnych

Niekompletne lub nakładające się scenariusze

Częsty problem to niepełne rozpisanie możliwych wyników losowych. Jeśli do węzła losowego wpisze się tylko „Wysoki popyt” i „Niski popyt”, pomijając „Średni”, model nie obejmuje wszystkich realnych sytuacji. Drzewo będzie wtedy matematycznie i logicznie niepełne.

Drugi błąd to scenariusze nakładające się, np.: „Wzrost sprzedaży powyżej średniej” i „Wzrost sprzedaży powyżej 10%”, gdy „średnia” jest nieprecyzyjna. Wtedy trudno przypisać im poprawne, rozłączne prawdopodobieństwa.

Sprzeczne lub źle znormalizowane prawdopodobieństwa

Bardzo łatwo o błąd, gdy prawdopodobieństwa pochodzą z różnych źródeł lub są zaokrąglane w mylący sposób. Typowe kłopoty:

  • suma prawdopodobieństw w węźle losowym różna od 1 (np. 0,95 albo 1,05),
  • stosowanie procentów i ułamków bez przeliczenia (np. „30%” i „0,7” w tym samym węźle),
  • przenoszenie prawdopodobieństw z innego kontekstu bez sprawdzenia, czy nadal opisują te same zdarzenia.

Każdy węzeł losowy warto osobno skontrolować: czy opisy gałęzi są rozłączne, a prawdopodobieństwa dodają się dokładnie do 1.

Mieszanie różnych jednostek i kryteriów

Wypłaty końcowe powinny być wyrażone w jednym, spójnym kryterium. Jeśli część ścieżek opisujemy w złotówkach, a część w godzinach pracy, porównywanie ich wartości oczekiwanych nie ma sensu. Podobny problem pojawia się, gdy w jednym drzewie chcemy jednocześnie minimalizować koszt i maksymalizować jakość, bez zdefiniowania wspólnej miary.

Rozsądnym podejściem jest:

  • przekształcenie wszystkich skutków do jednej jednostki (np. „koszt całkowity” w pieniądzu),
  • lub zdefiniowanie funkcji oceny, która łączy różne aspekty w jedną wartość liczbową (np. ocena = zysk – kara za opóźnienie – kara za niską jakość).

Ignorowanie kolejności decyzji i informacji

Drzewo decyzyjne zakłada określony porządek czasowy: najpierw jedna decyzja lub zdarzenie, potem kolejne. Błędem jest rysowanie drzewa w sposób, który nie odzwierciedla realnej sekwencji zdarzeń – np. traktowanie informacji, która będzie dostępna później, jakby była znana przy pierwszej decyzji.

Przykład z praktyki: firma najpierw musi zdecydować o budowie prototypu, a dopiero potem otrzyma wyniki testów rynkowych. Jeśli drzewo sugeruje, że najpierw znamy wyniki testów, a dopiero potem decydujemy o prototypie, cały model prowadzi do zbyt optymistycznych wniosków.

Drogowskaz wśród bezlistnych drzew w spokojnym jesiennym krajobrazie
Źródło: Pexels | Autor: Elina Volkova

Zastosowania drzew decyzyjnych w praktyce

Planowanie inwestycji i projektów

Przy większych decyzjach finansowych drzewo decyzyjne porządkuje możliwe etapy: badania wstępne, pilotaż, wejście na rynek, rozwinięcie lub zakończenie projektu. Każdy etap może wiązać się z innym kosztem i innym zestawem ryzyk.

Przykładowy schemat:

  • węzeł decyzyjny: „Czy robić badania rynku?” (tak/nie),
  • węzeł losowy: „Wynik badań” (pozytywny/negatywny z określonym prawdopodobieństwem),
  • kolejne węzły decyzyjne: „Czy uruchamiać inwestycję?” zależne od wyniku,
  • węzły końcowe: zyski lub straty z uwzględnieniem kosztów badań i samej inwestycji.

Taki model pomaga zrozumieć, czy koszty rozpoznania (np. badań, testów) „zwracają się” poprzez lepsze wybory później, czy może są zbędnym obciążeniem.

Diagnostyka i medycyna

W medycynie drzewo decyzyjne może odzwierciedlać sekwencję badań i decyzji terapeutycznych. Węzły losowe opisują tu np. wynik testu (pozytywny/negatywny) z określoną czułością i swoistością, a wypłaty końcowe mogą zawierać zarówno koszty leczenia, jak i statystyczny wpływ na zdrowie pacjenta.

Dzięki takiemu drzewu można porównać np. dwie ścieżki:

  • zastosowanie drogiego, ale dokładnego testu przed terapią,
  • Porównywanie strategii diagnostycznych krok po kroku

    Weźmy prostą sytuację: lekarz rozważa, czy przed włączeniem leczenia wykonywać dodatkowy test, czy od razu podjąć decyzję terapeutyczną. Drzewo może wyglądać następująco:

    • węzeł decyzyjny: „Testować czy leczyć od razu?”
    • gałąź „Testuj”: węzeł losowy „Wynik testu” (pozytywny/negatywny z określoną czułością i swoistością),
    • z każdego wyniku testu – kolejny węzeł decyzyjny: „Leczyć?” / „Obserwować?”
    • węzeł końcowy: łączny skutek (koszt testu, koszt leczenia, ryzyko powikłań, przeoczenie choroby).

    Na drugim ramieniu drzewa („leczyć od razu”) końcowe wypłaty uwzględniają inne połączenie kosztów i korzyści: brak wydatku na test, ale większe ryzyko niepotrzebnego leczenia części pacjentów.

    Po przypisaniu prawdopodobieństw (np. częstość choroby w populacji, dokładność testu) i wartości liczbowych (koszty finansowe, punkty za jakość życia) można policzyć wartość oczekiwaną każdej ścieżki. Różnica kilku procent na korzyść jednej strategii bywa argumentem przy tworzeniu zaleceń klinicznych.

    Procesy biznesowe i podejmowanie decyzji operacyjnych

    Poza wielkimi inwestycjami drzewa decyzyjne pomagają w codziennych decyzjach operacyjnych: zarządzaniu zapasami, obsadzie zmian, reagowaniu na reklamacje. Schemat jest podobny, choć skala inna.

    Przykładowa decyzja magazyniera lub planisty produkcji:

    • węzeł decyzyjny: „Zamówić większą partię czy minimalną?”
    • węzeł losowy: „Popyt w następnym okresie” (niski/średni/wysoki),
    • węzły końcowe: zysk po uwzględnieniu kosztu magazynowania i ryzyka braku towaru.

    Rozrysowanie takich wariantów pozwala lepiej zobaczyć, kiedy opłaca się „grać bezpiecznie”, a kiedy uzasadnione jest agresywne zamówienie pod spodziewany wysoki popyt.

    Edukacja i trening myślenia probabilistycznego

    Drzewa decyzyjne świetnie sprawdzają się jako narzędzie edukacyjne, zwłaszcza przy nauczaniu prawdopodobieństwa i statystyki. Zamiast abstrakcyjnych wzorów uczniowie widzą konkretną strukturę: od decyzji, przez losowość, do wyniku.

    Typowe ćwiczenia szkolne i studenckie wykorzystują np.:

    • gry losowe (rzuty kostką, losowania kart) z alternatywnymi strategiami,
    • scenariusze wyboru ścieżki kariery (studia vs praca, różne szanse awansu),
    • problemy diagnostyczne typu „test na chorobę” z obliczaniem prawdopodobieństwa warunkowego.

    Przeliczenie takiego drzewa krok po kroku pomaga zrozumieć, skąd biorą się wzory na prawdopodobieństwo całkowite czy twierdzenie Bayesa. Uczeń widzi, że to nie „magia”, tylko formalne ujęcie kolejnych gałęzi drzewa.

    Jak samodzielnie zbudować proste drzewo decyzyjne

    Etap 1: Jasne zdefiniowanie problemu i celu

    Punkt wyjścia to jedno precyzyjne pytanie, np. „Którą ofertę projektu wybrać?” albo „Czy kupić dodatkowe ubezpieczenie?”. Warto od razu określić:

    • co dokładnie ma być zoptymalizowane (zysk, koszt, czas, użyteczność),
    • jakie ograniczenia muszą być spełnione (budżet, terminy, minimalny poziom bezpieczeństwa),
    • horyzont czasowy – czy decyzja dotyczy jednego roku, całej żywotności projektu, czy jeszcze innego okresu.

    Dopiero gdy wiadomo, „o co gra toczy się matematycznie”, ma sens przejście do rysowania gałęzi.

    Etap 2: Wypisanie wszystkich możliwych decyzji początkowych

    Następny krok to spisanie realnych opcji, którymi dysponuje decydent. Wiele osób od razu ogranicza się do dwóch wariantów („tak/nie”), choć w praktyce dostępne są modyfikacje pośrednie: mniejsza skala inwestycji, etapowanie, outsourcing części zadania.

    Dla każdej realnej opcji można stworzyć osobną gałąź wychodzącą z korzenia drzewa. Lepiej zacząć od nieco szerszej listy i ewentualnie później uprościć, niż od razu wyciąć sensowną alternatywę.

    Etap 3: Identyfikacja punktów losowych i informacji

    Po każdej decyzji warto zadać pytanie: „Od czego dalej będzie zależał wynik, a na co nie mam już pełnego wpływu?”. Zwykle prowadzi to do węzłów losowych: popytu rynkowego, reakcji klientów, awaryjności sprzętu, zmian regulacji.

    Przy każdym takim węźle trzeba zadbać o dwie rzeczy:

    • opis wzajemnie wykluczających się zdarzeń (gałęzi),
    • sensowne źródło prawdopodobieństw (dane historyczne, eksperci, model statystyczny).

    Jeżeli któraś z informacji będzie dostępna dopiero po jakimś czasie (np. wyniki badań, przetarg, decyzja urzędu), ten moment powinien mieć własny węzeł losowy w odpowiednim miejscu drzewa.

    Etap 4: Dodanie kolejnych decyzji warunkowych

    Po węzłach losowych często następują kolejne wybory – zależne od tego, co już wiemy. Przykładowo: po poznaniu wyniku testu rynku firma może zdecydować się na pełne wdrożenie, mniejsze wdrożenie pilotażowe albo rezygnację.

    Na rysunku oznacza się to kolejnymi węzłami decyzyjnymi, z gałęziami opisanymi w taki sposób, aby było jasne, od czego zależy możliwość ich wyboru (np. „Wdrożenie pełne – tylko jeśli wynik badań pozytywny”).

    Etap 5: Przypisanie wypłat końcowych

    Każda ścieżka od korzenia do liścia musi kończyć się konkretną wartością liczbową. Częsty błąd to zatrzymanie się na jakościowych opisach typu „duży zysk”, „mała strata”. Aby móc liczyć wartości oczekiwane, wszystkie te opisy trzeba „przetłumaczyć” na liczby.

    Praktyczny sposób:

    • najpierw policzyć jawne wielkości (koszty, przychody, czas),
    • następnie, jeśli to potrzebne, przekształcić je do jednej miary (np. zaktualizowana wartość netto, punkty użyteczności),
    • na końcu zaokrąglić do sensownej dokładności, ale dopiero po obliczeniach, a nie przed nimi.

    Etap 6: Analiza od końca i interpretacja wyników

    Gdy drzewo jest kompletne, stosuje się opisane wcześniej „zwijanie” od liści do korzenia. Wynik nie powinien jednak sprowadzać się wyłącznie do wyboru jednej gałęzi. W praktyce analizuje się także:

    • wrażliwość na zmianę kluczowych parametrów (np. prawdopodobieństw, kosztów),
    • rozrzut możliwych wyników przy wybranej strategii,
    • czy rekomendowana ścieżka jest zgodna z ograniczeniami (np. nie przekracza budżetu w żadnym scenariuszu).

    Dopiero zestawienie wyniku liczbowego, ryzyka i ograniczeń daje pełny obraz tego, czy dana decyzja jest rzeczywiście akceptowalna.

    Rozszerzenia: drzewa decyzyjne w bardziej złożonych sytuacjach

    Drzewa z wieloma kryteriami oceny

    W wielu decyzjach jedno kryterium to za mało. Np. w projektach transportowych liczą się jednocześnie: koszt, czas podróży, bezpieczeństwo, wpływ na środowisko. W takiej sytuacji drzewo można połączyć z prostym modelem wielokryterialnym.

    Jedna z możliwości polega na tym, że przy każdym liściu zapisuje się wektor wartości, np. ((text{koszt}, text{czas}, text{emisja CO}_2)). Następnie:

    1. uzgadnia się z decydentem wagi poszczególnych kryteriów (np. jak ważne jest skrócenie czasu w porównaniu z redukcją kosztu),
    2. buduje się funkcję oceny – np. ważoną sumę albo inną znormalizowaną miarę,
    3. każdy liść przekształca się do jednej liczby zgodnie z tą funkcją i dopiero wtedy liczy wartości oczekiwane.

    Pozwala to zachować prostotę rachunków drzewowych, a jednocześnie nie ignorować istotnych aspektów poza samymi finansami.

    Aktualizacja prawdopodobieństw: podejście bayesowskie

    Drzewo można wykorzystać nie tylko do jednorazowej decyzji, lecz także do dynamicznego uczenia się z danych. W podejściu bayesowskim po otrzymaniu nowej informacji zmienia się rozkład prawdopodobieństwa zdarzeń w kolejnych węzłach losowych.

    Przykład z praktyki badawczej: zespół farmaceutyczny prowadzi badania kliniczne w kilku etapach. Po wynikach fazy wstępnej prawdopodobieństwo sukcesu w kolejnych fazach jest korygowane. Na drzewie odpowiada to zmianie etykiet prawdopodobieństw przy gałęziach „Sukces fazy 3” / „Niepowodzenie fazy 3”, w zależności od tego, co zaobserwowano wcześniej.

    Tego typu modele pozwalają zaplanować adaptacyjne strategie: wstrzymanie projektu przy niekorzystnych sygnałach, zwiększenie próbki badanej populacji itp.

    Drzewa wpływu: kompaktowa alternatywa dla złożonych drzew

    Gdy drzewo staje się bardzo rozbudowane, na diagramie zaczyna panować chaos. Jedną z odpowiedzi są drzewa wpływu (ang. influence diagrams) – pokrewne konstrukcje, w których zamiast rozgałęziającej się struktury rysuje się zależności między zmiennymi w postaci grafu.

    W drzewie wpływu występują zwykle trzy typy węzłów:

    • decyzyjne (prostokąty),
    • losowe (owale),
    • wartości (romb lub inny wyróżniony kształt) – opisujące funkcję celu.

    Strzałki między nimi pokazują, które zmienne wpływają na które decyzje lub wypłaty. Drzewo wpływu jest często bardziej zwięzłe niż rozwinięte drzewo decyzyjne, ale w tle obowiązują te same zasady liczenia wartości oczekiwanych.

    Ograniczenia klasycznych drzew i sposoby ich omijania

    Mimo licznych zalet, drzewa decyzyjne mają swoje ograniczenia:

    • błyskawicznie rosną wraz z liczbą decyzji i zdarzeń losowych,
    • źle radzą sobie z sytuacjami, w których decyzje mogą się powtarzać cyklicznie (np. co rok ta sama decyzja inwestycyjna),
    • nie są naturalnym narzędziem do modelowania interakcji wielu decydentów (gry strategiczne).

    W takich przypadkach stosuje się często powiązane narzędzia: procesy decyzyjne Markowa, teorię gier, programowanie dynamiczne lub symulacje Monte Carlo. Drzewo bywa wtedy wykorzystywane jako prosty szkic pomagający uporządkować scenariusze przed zbudowaniem bardziej zaawansowanego modelu.

    Samodzielna praktyka: jak ćwiczyć rysowanie i czytanie drzew

    Proste zadania „z życia” jako materiał treningowy

    Do nauki najlepiej nadają się krótkie, codzienne dylematy. Kilka przykładów, które łatwo przerobić na drzewa:

    • „Jechać samochodem czy komunikacją miejską, gdy prognoza pogody jest niepewna?” – losowe zdarzenia to korki, awaria, brak miejsca w autobusie, opóźnienia.
    • „Kupić bilet bezzwrotny czy elastyczny?” – węzły losowe opisują, czy wyjazd faktycznie się odbędzie, czy trzeba będzie zmienić termin.
    • „Zgłosić się do trudniejszego, ale lepiej płatnego projektu w pracy?” – losowością są wynik rekrutacji, sukces projektu, reakcja przełożonych.

    Rozpisanie takich sytuacji na 2–3 poziomowe drzewa, z poglądowymi prawdopodobieństwami, pomaga wyrobić nawyk myślenia „gałęziami” zamiast wyłącznie intuicją.

    Automatyzacja obliczeń w arkuszu kalkulacyjnym

    Nawet niewielkie drzewo szybko generuje kilkanaście ścieżek końcowych. Żeby uniknąć mechanicznych pomyłek, wygodnie jest przenieść obliczenia do arkusza (np. Excela, LibreOffice, Google Sheets):

    1. każdą ścieżkę reprezentuje się jednym wierszem,
    2. w kolumnach zapisuje się: decyzje, stany losowe, ich prawdopodobieństwa i wypłaty cząstkowe,
    3. w dodatkowej kolumnie liczy się ogólną wypłatę danej ścieżki,
    4. w kolejnej – łączną wartość (p(text{ścieżki})) jako iloczyn prawdopodobieństw wzdłuż gałęzi,
    5. na końcu sumuje się (p(text{ścieżki}) cdot text{wypłata}) dla tych ścieżek, które odpowiadają danej decyzji na korzeniu.

    Taka tabela jest dobrym uzupełnieniem graficznego drzewa: diagram pokazuje strukturę, a arkusz wykonuje żmudną część rachunków.

    Ćwiczenie „co jeśli”: analiza wrażliwości bez skomplikowanych narzędzi

    Najczęściej zadawane pytania (FAQ)

    Czym jest drzewo decyzyjne w matematyce i teorii decyzji?

    Drzewo decyzyjne to graficzny model procesu podejmowania decyzji krok po kroku. Zaczyna się od jednego punktu startowego (korzenia), z którego wychodzą gałęzie reprezentujące kolejne decyzje i zdarzenia losowe.

    Każda ścieżka od początku do końca drzewa odpowiada jednemu pełnemu scenariuszowi: od pierwszej decyzji, przez możliwe wyniki losowe, aż po efekt końcowy (np. zysk, koszt, czas). Dzięki temu można porównywać scenariusze i wybierać opcję najbardziej opłacalną lub najmniej ryzykowną.

    Jakie są podstawowe elementy drzewa decyzyjnego?

    W klasycznym drzewie decyzyjnym wyróżnia się trzy główne typy węzłów:

    • węzeł decyzyjny (kwadrat) – miejsce, w którym podejmujemy świadomy wybór,
    • węzeł losowy (kółko) – miejsce, w którym o dalszym przebiegu decyduje przypadek, z przypisanymi prawdopodobieństwami,
    • węzeł końcowy (trójkąt lub koniec linii) – zakończenie ścieżki z przypisaną wypłatą (np. zyskiem, kosztem).

    Węzły łączą gałęzie, które opisują konkretne decyzje lub wyniki losowe. Do końcowych gałęzi przypisuje się wypłaty, a przy gałęziach losowych – prawdopodobieństwa, których suma przy jednym węźle musi wynosić 1.

    Jak krok po kroku narysować proste drzewo decyzyjne?

    Najpierw definiuje się problem: kto podejmuje decyzję, czego dotyczy wybór i jakie są możliwe działania na pierwszym etapie. Następnie po lewej stronie rysuje się węzeł początkowy (zwykle kwadrat) i gałęzie reprezentujące dostępne decyzje, opisane krótkimi nazwami.

    W kolejnym kroku dodaje się węzły losowe (kółka) tam, gdzie pojawia się niepewność, oraz gałęzie z możliwymi wynikami i ich prawdopodobieństwami. Na końcu do każdej ścieżki od korzenia do końca przypisuje się wypłatę w węzłach końcowych, np. zysk lub koszt.

    Jak czytać drzewo decyzyjne i co oznacza „ścieżka” w drzewie?

    Drzewo decyzyjne czyta się od lewej do prawej, podążając po gałęziach. W każdym węźle decyzyjnym wybiera się jedną z gałęzi (strategię), a w węźle losowym rozważa się wszystkie możliwe wyniki z ich prawdopodobieństwami.

    Ścieżka w drzewie to ciąg kolejnych gałęzi od korzenia do węzła końcowego. Każda ścieżka reprezentuje kompletny scenariusz: konkretne decyzje + realizacje zdarzeń losowych + efekt końcowy. Analizując ścieżki, można porównywać ich wypłaty i obliczać wartości oczekiwane dla poszczególnych decyzji.

    Jak w drzewie decyzyjnym oznacza się koszty, zyski i wypłaty?

    Wypłaty (np. zyski, straty, koszty, czas) przypisuje się do węzłów końcowych, zwykle jako liczby przy końcu gałęzi, np. „+100”, „-20”, „1500 zł”, „czas = 5 dni”. Opisują one ostateczny efekt danej ścieżki.

    Jeśli koszty pojawiają się również w trakcie procesu (np. koszt badań, wdrożenia), można je:

    • albo zsumować i wpisać tylko w wypłacie końcowej,
    • albo zaznaczać przy odpowiednich gałęziach, a końcową wartość netto wyliczyć osobno.

    Najważniejsze jest zachowanie spójnego sposobu zapisu w całym drzewie, aby źródło każdej liczby było jasne.

    Do czego wykorzystuje się drzewa decyzyjne w ekonomii i zarządzaniu?

    W ekonomii, zarządzaniu i inżynierii drzewa decyzyjne służą do analizy wariantów działania przy niepewności. Pozwalają porównywać projekty inwestycyjne, strategie wejścia na rynek, warianty planowania produkcji czy decyzje dotyczące ryzyka technologicznego.

    Dzięki graficznej formie ułatwiają dyskusję w zespole, prezentację scenariuszy przełożonym oraz uzasadnianie wyboru konkretnego rozwiązania. Z matematycznego punktu widzenia umożliwiają uporządkowane zastosowanie rachunku prawdopodobieństwa i wartości oczekiwanej.

    Jak sprawdzić, czy drzewo decyzyjne jest poprawne matematycznie?

    Podstawowe warunki poprawności to:

    • każdy węzeł losowy ma komplet możliwych wyników, wzajemnie wykluczających się,
    • suma prawdopodobieństw gałęzi wychodzących z jednego węzła losowego wynosi 1,
    • każda ścieżka kończy się węzłem końcowym z przypisaną wypłatą,
    • koszty i zyski są zapisywane w spójny sposób w całym drzewie.

    Jeśli te warunki są spełnione, można bezpiecznie stosować metody obliczania wartości oczekiwanej i analizować ryzyko dla poszczególnych decyzji.

    Najważniejsze lekcje

    • Drzewo decyzyjne to graficzna reprezentacja procesu podejmowania decyzji, w której każda pełna ścieżka od korzenia do końca odpowiada jednemu kompletnemu scenariuszowi.
    • Podstawowe elementy drzewa to: węzeł decyzyjny (wybór), węzeł losowy (przypadek), węzeł końcowy (rezultat) oraz gałęzie łączące te węzły, opisujące decyzje lub wyniki losowe.
    • Drzewo pomaga uporządkować złożone problemy, jasno rozdzielając decyzje od zdarzeń losowych, pokazując kolejność kroków oraz konsekwencje każdej możliwej ścieżki.
    • W standardowej notacji stosuje się: kwadrat dla węzła decyzyjnego, kółko dla węzła losowego i trójkąt lub koniec linii dla węzła końcowego, co ułatwia szybkie „czytanie” struktury drzewa.
    • Gałęzie wychodzące z węzłów losowych muszą mieć przypisane prawdopodobieństwa, których suma dla jednego węzła losowego równa się 1, aby drzewo było poprawne matematycznie.
    • Do końcowych gałęzi przypisuje się wypłaty (zysk, strata, koszt, czas itd.), przy czym ważne jest konsekwentne oznaczanie kosztów i przychodów, by można je było łatwo zsumować i porównać.
    • Drzewa decyzyjne umożliwiają zastosowanie rachunku prawdopodobieństwa i wartości oczekiwanej w przejrzysty sposób, wspierając analizy ryzyka, dyskusję w zespole i prezentację wariantów decyzyjnych.