BLOGCZEJNalpha

Pułapka Bayesa

Załóżmy, że na Steem istnieje inteligentny bot bazujący na sieciach neuronowych, którego zadaniem jest flagowanie postów, naruszających ogólnie przyjęte zasady. Niech taki post trafia się 1 na 1000. Bot jest dość skuteczny, myli się tylko w 1% przypadków. Od decyzji bota można się odwołać, wtedy kilku użytkowników o wysokiej reputacji ręcznie analizuje sytuację i w razie potrzeby cofa flagę.

Pewien nowo zarejestrowany użytkownik dodaje swojego pierwszego posta, jednak po chwili zauważa, że post ten został doszczętnie zakopany. Była to flaga własnie od tego bota. Użytkownik obraża się na platformę i postanawia nigdy więcej już tutaj nie zawitać. Czy jego decyzja była słuszna? Okazuje się, że prawdopodobieństwo, że flaga była zasłużona wynosi tylko około 9%.

Można to obliczyć na podstawie wzoru:
P(H|E) = (P(E|H) * P(H)) / P(E)
gdzie:
H - hipoteza (hypothesis)
E - zdarzenie, dowód (evidence)
P(H) - prawdopodobieństwo hipotezy H
P(E) - suma prawdopodobieństw zdarzenia E
P(H|E) - prawdopodobieństwo, że hipoteza H jest prawdziwa, jeśli wystąpiło zdarzenie E
P(E|H) - prawdopodobieństwo zdarzenia E, jeśli hipoteza H jest prawdziwa

Po podstawieniu:
P(H|E) = (0.99 * 0.001) / (0.99 * 0.001 + 0.01 * 0.999) ~= 0.09 ~= 9%

image.png

Obrazowo, skuteczność bota to 1%, więc na 1000 postów 10 zostanie oznaczonych flagą bezpodstawnie, a jeden post faktycznie na tę flagę zasłużył. Z czego wynika, że prawdopodobieństwo tego, że oflagowany post posiada zasłużoną flagę to 1/11 = 0.09.

Ciekawostka - jeśli istniałby drugi bot, oceniający w niezależny sposób (na innej zasadzie), ale z taką samą skutecznością i również zaklasyfikowałby dany post do oflagowania to wtedy prawdopodobieństwa, że ta flaga była słuszna wynosi już 93%.

Przykład zainspirowany poniższym filmem:
https://www.youtube.com/watch?v=R13BD8qKeTg

Źródło obrazka

KOMENTARZE

  • lagria.daren

    Awesome, Upvoted, follow and resteem

  • thedragonnis

    Akurat mam z tego kolokwium. :D

  • properfraction

    Po przeczytaniu Twojego postu, ogarnęło mnie lekkie przerażenie.
    Od końca moich studiów minęło wcale nie tak dużo lat. a o twierdzenie Bayesa musiałem sobie praktycznie przypominać od zera. Obecnie zamiast takich fajnych informacji mam głowę pełną nie praktycznej wiedzy o różnych frameworkach do programowania :(

  • pjkober

    @jacekw dobrze, że w dzisiejszym czasie, gdy prawie wszystko opiera się na matematyce są osoby tłumaczące te zagadnienia. Jak widzi się w praktyczny sposób wykorzystanie wiedzy, to chętniej się ją pogłębia.

  • kurator-polski

    Cześć! Redakcja Tygodnika Kuratorskiego jest pod wrażeniem Twojej twórczości i chcemy prosić Cię o zgodę na publikację opisów oraz linków do Twoich postów w przyszłych numerach. Zależy nam na promocji wartościowych treści poprzez tworzenie cotygodniowego artykułu zbiorczego. Więcej możesz przeczytać tutaj: Tygodnik Kuratorski #0

  • anka

    @jacekw w sieciach neuronowych? Jak?