Jak rozprzestrzeniają się choroby?

- autor: tsissput

Niniejszy wpis ma traktować o rozprzestrzenianiu się chorób, modelach epidemiologicznych i związku tych zagadnień z sieciami.

Przed przejściem do jakichkolwiek konkretów należy w kilku słowach przedstawić związek pomiędzy tematyką naszego przedmiotu a epidemiologią, co na pierwszy rzut oka może się wydawać dosyć nieprawdopodobne. Otóż nie do końca – połączenie dwóch dziedzin nauki spowodowało znaczny wzrost skuteczności przewidywania dynamiki oraz kierunku rozprzestrzeniania się chorób zakaźnych.

Wczesne modele epidemiologiczne opierały się na losowym zarażaniu się osób w obrębie całej populacji, co nawet przy pierwszym kontakcie z tym podejściem wydaje się nieintuicyjne. Każdy z nas ma świadomość, że raczej nie zarazi się bezpośrednio od nieznajomej osoby żyjącej i przebywającej w innej części Polski – chyba że wirusem komputerowym, ale nie o tym piszę. Właśnie dlatego pojawiła się potrzeba udoskonalenia sposobu przewidywania epidemii.

Przed przystąpieniem do omówienia sposobów wykorzystania modeli sieci w epidemiologii muszę napisać kilka słów na temat samej epidemiologii – trudno się spodziewać, żeby informatycy posiadali jakąś wiedzę na ten temat.

Podstawowy, najprostszy model opiera się wyłącznie na liczbach. Podaje on liczbę osób w danej populacji, które są:

  • Narażone na zarażenie.
  • Zarażone.
  • Wyleczone z choroby.

Pomijane tutaj są wszelkie inne czynniki, takie jak sposób rozprzestrzeniania się choroby, jej przebieg, czas reakcji na zarażenie. Tak znaczne uproszczenie mimo wielu potencjalnych wad w praktyce sprawdzało się, głównie ze względu na uniwersalność. Powstały dwa istotne modele:

  • SIR – model zakładający kolejność narażony -> zarażony -> zdrowy.
  • SIS – model zakładający kolejność narażony -> zarażony -> narażony.

Pierwszy model zakłada całkowitą odporność osoby po przebyciu choroby, natomiast w drugim przypadku dopuszczalne (oraz prawdopodobne) jest kolejne zarażenie. W modelach tych brane są pod uwagę następujące parametry:

  • Wielkość populacji.
  • Liczba osób narażonych, zarażonych i wyleczonych w populacji o ustalonej wielkości.
  • Przyrost naturalny.
  • Śmiertelność.
  • Prawdopodobieństwo wyzdrowienia.
  • Prawdopodobieństwo zarażenia osoby narażonej.

SIR oraz SIS są modelami liniowymi, gdzie zakłada się, jak już wcześniej wspomniałem, losowe kontakty pomiędzy osobami.  Powstawały dosyć liczne modyfikacje modeli, polegające w szczególności na uwzględnieniu szerszego spektrum wiedzy biologicznej dotyczącej poszczególnych chorób – podziale grup narażonych, zarażonych oraz wyleczonych na mniejsze podgrupy. W konkretnych przypadkach sprawowały się one rzeczywiście coraz lepiej, jednak problem z podstawą zbudowaną na założeniu o losowych kontaktach pozostał nierozwiązany.

Teraz przyszedł czas na kilka słów o sieciach w kontekście pierwszej części wpisu. Istnieje wiele terminologii które można zastosować w celu opisu sieci, jednak mi najbliższa jest związana z grafami, dlatego będę najczęściej posługiwał się pojęciami węzłów i krawędzi. Sieci społecznościowe zazwyczaj analizowane są pod kątem przyczyny połączenia jakichś węzłów (jak np. wspólna praca, wspólna szkoła, sąsiedztwo itp.). Zbudowanie struktury sieci jest efektem pośrednim, a nie głównym przedmiotem badań. Istnieją prace naukowe potwierdzające fakt, że znacznie łatwiej jest dobrze zrozumieć istniejącą sieć zwracając uwagę na przyczynę powstania połączeń, a nie traktując zbiór powiązań jako czarną skrzynkę, która jest nieistotna dla struktury.

Nawiązując do teorii grafów został nałożony pewien nacisk na zbadanie natury połączeń – szczególnie ich dwie własności :

  • symetrii (czy to, że znam Billa Gatesa oznacza, że on również mnie zna?).
  • przechodniości (czy to, że A zna B, a B zna C oznacza że A zna C?).

Wprowadzono również określenia ważności poszczególnych węzłów. Kryteriami mogą być np. ilość połączeń, ilość ścieżek prowadzących przez węzeł. Okazuje się, że ta informacja ma istotne zastosowanie w epidemiologii, ponieważ rola osób ważnych w społeczeństwie, mających kontakt z wieloma innymi osobami, jest bardzo istotna. Można sobie wyobrazić sytuację, gdzie jeden nauczyciel akademicki (ważna osoba) zaraża wszystkie osoby które przyszły na wykład groźną chorobą zakaźną.

Nie zamierzam tutaj przytaczać opisów sposobów definiowania sieci społecznościowych, ponieważ m. in. to właśnie jest przedmiotem wykładów. Warto tutaj jednak zaznaczyć po raz kolejny, czym różni się podejście naukowców zajmujących się sieciami społecznymi, a epidemiologów. Ci pierwsi chcą doskonale zrozumieć sieci, genezę ich powstawania, zależności w nich występujące oraz role poszczególnych osobników. Drudzy z kolei traktują wiedzę o sieciach jako narzędzie – bardzo ważne i pomocne, jednak narzędzie. Oznacza to, że matematycy i informatycy dostarczają instrumentarium osobom przewidującym szybkość i kierunek rozprzestrzeniania się groźnych chorób zakaźnych.

Ważnym pojęciem jest teoria przesiąkania. Formalnie można ją określić jako badanie zachowań połączonych klastrów węzłów w grafach. Przechodząc do dziedziny sieci społecznościowych mówimy o zależnościach pomiędzy sieciami.

Przykładowo można o tym myśleć, jako o badaniu zależności pomiędzy obsługą supermarketu (sieć A) a klientami tego sklepu (sieć B). Od razu staje się oczywiste, dlaczego ten fragment wiedzy dziedzinowej jest tak bardzo istotny w przypadku epidemiologii – eliminuje on wady najprostszych modeli opisanych na początku mojego wywodu. Nie ma tutaj już mowy o przypadkowych połączeniach wewnątrz całych społeczności – istnieją mniejsze grupy społeczne oraz opisane związki pomiędzy nimi, dlatego modelowanie wchodzi na wyższy poziom.

Do tej pory wszystko wyglądało różowo, jednak pojawia się trapiący informatyków od zawsze problem – w celu zbudowania doskonałej sieci potrzebna jest ogromna ilość danych. Należałoby uzyskać personalne informacje od każdej osoby w danej społeczności, co jest po prostu niemożliwe.

Zbieranie potrzebnych danych jest zadaniem trudnym, jednak jeszcze bardziej kłopotliwą kwestią jest zdefiniowanie i opisanie powiązań pomiędzy osobami. W przypadku każdej osoby należy się zastanowić, w jaki sposób możliwe jest zarażenie się. Zadanie może pozornie wydawać się proste, jednak w obliczu ilości sieci w jakich znajduje się lub ma kontakt każdy z nas, sprawa przestaje być taka prosta. Jak określić, w jakiej relacji trzeba być, żeby zarazić się daną chorobą? W jaki sposób określić dla danej relacji, na jaką odległość zbliżamy się do drugiej osoby? To są przykładowe pytania, które sprawiają, że pozornie proste zagadnienie jest bardzo wymagające. Oczywiście należy uwzględnić fakt prawdopodobieństwa zarażenia się – to, że się zbliżę do jakiejś chorej osoby na niebezpieczną odległość wcale nie oznacza, że będę miał daną chorobę. Ilość możliwych kombinacji nie tylko wpływa na złożoność modelu, lecz także powoduje powstanie dodatkowych trudności podczas zbierania danych. Ten problem dotyczy zwłaszcza chorób wenerycznych, gdzie pytania pomagające zbudować sieć naruszają strefę osobistą. Problem można częściowo rozwiązać stosując ograniczoną dziedzinę dostępnych związków między ludźmi – powoduje to pewną generalizację (coś na kształt dyskretyzacji zmiennej ciągłej), ale umożliwia praktyczne zastosowanie modeli.

Na zakończenie chciałbym jeszcze przedstawić trzy stosowane sposoby zbierania informacji o budowie sieci.

Pierwszym z nich jest śledzenie infekcji. Budowanie modelu następuje po epidemii jakiejś choroby – przykładem może być SARS w Hongkongu i Kanadzie. Lekarze szczegółowo badają każdy przypadek wystąpienia choroby i analizują, skąd osoba się zaraziła i komu przekazała chorobę. Zaletą metody jest niewrażliwość na problemy związane z definicją relacji, natomiast wadą jest pomijanie potencjalnie zagrożonych przypadków, w których choroba jednak nie wystąpiła.

Drugą metodą jest śledzenie kontaktów. W tym przypadku badane są również potencjalne wystąpienia choroby. Zarażeni dostarczają informacji na temat osób, które mogłyby się zarazić i idąc dalej tym tropem, analizowane są kolejne węzły w sieci. Dzięki takiemu podejściu eliminowana jest podstawowa wada pierwszej metody, natomiast powstaje problem z definiowaniem związków między ludźmi.

Ostatnim podejściem jest prowadzenie dzienników przez osobników w opisywanej społeczności. Pozwala to na zrzucenie obowiązku zbierania danych na członków populacji, jednak niesie za sobą istotne ryzyko różnych interpretacji tych samych danych. Ponieważ ciężko jest zdefiniować możliwe relacje między ludźmi, opisywanie ich zawsze będzie niejednoznaczne.

Mam nadzieję, że mój wpis pozwolił zainteresowanym na krótkie zapoznanie się z najciekawszymi moim zdaniem aspektami wykorzystywania sieci społecznych w epidemiologii. Jest to zagadnienie ciekawe, pozwalające na przekonanie się, jak można w praktyce wykorzystać wiedzę którą zdobywamy w trakcie zajęć.

Źródła:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1578276/

Autor:
Piotr Starobrat (79415)

Reklamy

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: