Analiza behawioralna

- autor: tsissput

W ostatnim czasie, miałem okazję zapoznać się z dwoma artykułami Longbing Cao [1] [2] oraz jednym tego samego autora napisanym razem z Philipem Yu, opisującymi BIA – czyli Behavioral Informatics and Analytics (Informatyka i Analiza Behawioralna). Jest to nowa, zaproponowana przez nich gałąź informatyki, która koncentruje się na analizie wzorców zachowania ludzi, na podstawie zebranych uprzednio danych.

W przeciwieństwie do tradycyjnego podejścia, zaproponowana w artykule metoda bierze pod uwagę nie same dane transakcyjne i demograficzne (czyli wyrwane z szerszego kontekstu pojedyncze zdarzenia – takie jak np. sprzedaż akcji na rynku kapitałowym), ale sekwencje zachowań, ich cel, otoczenie, czas, miejsce, a także osiągnięty efekt. Inaczej mówiąc, autorzy artykułów proponują zebrane dane o zachowaniach ludzi traktować jako sekwencję zdarzeń, w której branych jest pod uwagę wiele czynników jednocześnie. Na przykład analizując dane dotyczące transakcji finansowych, byłyby brane pod uwagę nie tylko dane dotyczące pojedynczych operacji zakupu lub sprzedaży aktywów, ale sekwencje takich zdarzeń, wraz z towarzyszącym im kontekstem (jak choćby cel transakcji). Jedno takie zdarzenie nazywane jest wektorem behawioralnym i może on składać się z takich elementów jak:

  • Podmiot wykonujący aktywność;

  • Obiekt, na którym aktywność jest wykonywana;

  • Kontekst aktywności;

  • Cel;

  • Informacja o wiedzy podmiotu o świecie;

  • Akcja;

  • Plan działania podmiotu;

  • Skutek aktywności;

  • Ograniczenia;

  • Czas wystąpienia aktywności;

  • Miejsce wystąpienia aktywności;

  • Aktualny status aktywności;

  • Powiązane akcje.

Do pełnej analizy zazwyczaj jest potrzebna sekwencja takich wektorów. W celu przygotowania wektora, konieczne jest uprzednie zebranie danych, które posłużą do jego budowy. Dane te mogą być zaczerpnięte z tradycyjnej, transakcyjnej bazy danych i po odpowiednim połączeniu można je wykorzystać do budowy wektorów behawioralnych.

Po przygotowaniu sekwencji wektorów behawioralnych, metoda koncentruje się na wykryciu wzorców zachowań operujących na sekwencjach w/w wektorów. Cały proces można podzielić na następujące kroki:

  1. Modelowanie zachowań – czyli stworzenie właściwego dla rozwiązywanego problemu i oczekiwanych wyników wektora behawioralnego, przy ograniczeniach wynikających z dostępnych danych.

  2. Konwersja danych do modelu behawioralnego.

  3. Analiza wzorców behawioralnych oparta o stworzoną dla danego zbioru danych metodę, która następnie jest zastosowana do stworzonych wektorów w celu wyodrębnienia konkretnych wzorców zachowań.

  4. Stworzenie reguł biznesowych na podstawie opracowanych wzorców zachowań.

Według zapewnień autorów, takie podejście pozwala na osiągnięcie dużo lepszych rezultatów w ocenie przyczyn i skutków badanych zachowań.

Ponieważ samo zagadnienie i metodologia jest szczegółowo opisana w artykule, pozwolę sobie nie podejmować w tej chwili dalszych detali tej metody, ale przejść do moich spostrzeżeń, które nasunęły mi się podczas lektury.

Analiza behawioralna nie jest w bezpośrednim zakresie moich zainteresowań w sensie naukowym, niemniej jednak jest to dziedzina, z którą moim zdaniem każdy styka się w mniejszym lub większym stopniu – dokonując jej często czysto intuicyjnie. Z tego powodu koncepcja BIA sama w sobie nie wydała mi się szczególnie rewolucyjna ani odkrywcza, jest raczej inkrementacyjnym podejściem do dotychczasowych metod analizy.

Nieco zaskoczyło mnie, że proponowana przez autorów artykułu analiza ma opierać się w całości o dotychczas zebrane dane transakcyjne, które jedynie są transformowane do nowej postaci. Takie podejście ma oczywiście tę zaletę, że analizie można poddać wiele opisanych wcześniej zjawisk i porównać wyniki z tradycyjnymi metodami, jednak nie mogłem się oprzeć wrażeniu, że analiza biorąca pod uwagę cele i kontekst działania człowieka, powinna opierać się na bardziej kompletnych przesłankach.

Można posłużyć się tutaj wcześniej wspomnianym przykładem transakcji finansowych. W budowanym przez autorów modelu, biorą oni pod uwagę tylko dane przechowywane przez systemy finansowe, które zapisują jedynie informacje bezpośrednio związane z działaniem giełdy. Na podejmowane decyzje wpływa dużo szerszy wachlarz czynników i choć oczywiście ciężko wziąć pod uwagę je wszystkie, próby stworzenia dokładnego modelu behawioralnego na tak ograniczonym zestawie wejściowym wydają mi się zbyt ograniczone.

Problem ten może jednak być trudny do rozwiązania, ze względu na pojawiający się w tej sytuacji paradoks Boniniego, który mówi że może być niemożliwe zbudowanie dokładnego modelu o stopniu skomplikowania mniejszym niż system, który staramy się symulować.

Mimo wszystko uważam jednak, że nie można uznać tego za wadę proponowanego rozwiązania, gdyż wynika po prostu z założeń przyjętych podczas pracy i metodę można w prosty sposób rozszerzyć o dodatkowe dane wejściowe.

Aspektem, który utrudnia pełną ocenę tej pracy jest jej mocno teoretyczny charakter. Praca koncentruje się na ogólnych założeniach nowej metody, na razie dość pobieżnie tylko opisując sposoby wnioskowania w modelu.

Autor pokusił się o analizę dwóch konkretnych przypadków[1]: zachowań inwestorów na rynku finansowym oraz zachowań związanych z pobieraniem świadczeń socjalnych (a w szczególności kwestie wychwytywania niesłusznie nadpłaconych przez państwo świadczeń na rzecz obywatela).

W pierwszym przypadku brano pod uwagę operacje związane ze sprzedażą i zakupem papierów wartościowych, analizując przy tym zarówno sekwencję takich decyzji podejmowanych przez inwestora oraz szereg dodatkowych czynników takich jak wielkość transakcji czy jej skutek.

Drugi przypadek obejmował takie czynniki jak rejon wypłacanych świadczeń, płeć osoby pobierającej świadczenie, jej sytuację rodzinną, wykształcenie czy pochodzenie.

W każdym przypadku autor artykułu starał się wykryć reguły prowadzące do takich a nie innych zachowań. Reguły te mogłyby być następnie wykorzystane do przeciwdziałania niepożądanym zachowaniom i stymulowania tych pożądanych.

Wyniki eksperymentu zaprezentowane są w artykule jako obiecujące, jednak ich praktyczna użyteczność nie jest udowodniona, ani też nie są one w bezpośredni sposób porównane z alternatywnymi metodami analizy zachowań. Brakuje również kompleksowego przedstawienia wyników eksperymentów i konkretnych przykładów wynikających z nich konkretnych korzyści.

Podsumowując, zaprezentowana metoda sama w sobie wydaje się ciekawym rozszerzeniem istniejących metod analizy, jednak trudno na tym etapie oceniać, na ile wpłynie na dotychczasowe podejście do badań ludzkich zachowań. BIA przypomina w założeniach podejście do analizy, które jest bardziej intuicyjne dla człowieka – czyli branie pod uwagę wielu powiązanych czynników i traktowanie ich jako sekwencje zdarzeń, a nie oderwane od siebie dane statystyczne.

W mojej ocenie, zaprezentowana metoda może borykać się z problemami związanymi z zebraniem odpowiednich danych do analizy, jak również z nadmiernym skomplikowaniem tworzonych wzorców. Z tego powodu może być ona podatna (choć czy jest tak rzeczywiście, nie można ocenić bez dokładniejszych eksperymentów) na efekty związane z przeuczeniem, czyli stworzeniem zbyt specjalistycznych wzorców, które nie będą miały szerszego praktycznego zastosowania.

Ze względu na postępującą informatyzację kolejnych dziedzin życia, analiza behawioralna będzie miała coraz szersze spektrum danych do przetworzenia, a co za tym BIA może zyskać na znaczeniu. Być może okaże się przydatna podczas analizy ogromnej ilości danych zebranych przez portale społecznościowe, które w połączeniu z konkretnymi danymi dotyczącymi działań biznesowych mogą dać ciekawe rezultaty. Okaże się to jednak dopiero, jeśli dyscyplina będzie się dalej rozwijać i będzie stosowana szerzej w praktyce.

Cao, L. (2010). In-depth behavior understanding and use: The behavior informatics approach Information Sciences, 180 (17), 3067-3085 DOI: 10.1016/j.ins.2010.03.025

Longbing Cao (2008). Behavior Informatics and Analytics: Let Behavior Talk IEEE International Conference on Data Mining Workshops

Longbing Cao, & Philip S. Yu (2009). Behavior Informatics: An Informatics Perspective for Behavior Studies IEEE Intelligent Informatics Bulletin

Reklamy

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s

%d blogerów lubi to: