Crowd Computing, czyli parę słów o wykorzystaniu użytkowników Internetu.

- autor: tsissput

Ideą crowd computing jest wykorzystanie wiedzy, doświadczenia i zwyczajnej inteligencji „tłumu” do podejmowania decyzji oraz znajdowania rozwiązań problemów, z którymi współczesne komputery nie zawsze dają sobie radę.

reCAPTCHA

Idealnym przykładem jest reCAPTCHA, system stworzony przez gwatemalskiego informatyka, Luisa von Ahna.

Chyba każdy przeglądając strony internetowe natknął się przynajmniej raz na CAPTCHA, której celem jest ochrona strony internetowej przed botami, np. podczas rejestracji na danej stronie, bardzo często użytkownikowi pokazywany jest obrazek ze zniekształconym tekstem, który należy poprawnie przepisać, aby przejść dalej. Dla zwykłego komputera jest to bariera nie do pokonania, natomiast człowiek jest w stanie poprawnie odczytać taki tekst.

Właśnie z tej właściwości ludzkiego mózgu korzysta reCAPTCHA, w której wykorzystywane są wyrazy ze starych dokumentów, których komputer nie jest w stanie odczytać. Konkretnie   użytkownikowi na obrazku pokazywane są dwa wyrazy: pierwszy, wybrany z grona kilkuset tysięcy, które są maszynie znane oraz drugi, który został odczytany przez dwa osobne   programy w odmienny sposób. Wystarczy, że człowiek poprawnie przepisze pierwszy z nich, to drugi zostanie uznany również za poprawnie odczytany. Jeżeli zdecydowana większość osób dany wyraz przeczyta tak samo, to uznaje się go za poprawny i wykorzystuje do odczytu dokumentu. W ten sposób,
w ciągu kilku miesięcy, przeniesiono na wersję cyfrową dwadzieścia roczników dziennika New York Times. Skuteczność samej metody jest na poziomie 99%.

SETI@home

Kolejnym interesującym projektem jest SETI@home. Jego celem jest wyszukiwanie w kosmicznym szumie radiowym sygnałów od pozaziemskich cywilizacji. Niestety komputery dostępne na potrzeby tego projektu nie są wystarczająco potężne, by udźwignąć analizowanie danych spływających w czasie rzeczywistym, przez co chociażby słabsze sygnały w ogóle nie są analizowane. Dlatego projekt zakłada wykorzystanie jak największej liczby domowych komputerów, które jednocześnie analizowałyby dane spływające z obserwatorium w Arecibo. W ten sposób zwiększona zostaje moc obliczeniowa wykorzystywana na potrzeby projektu. Oczywiście nikt nie zmusza nikogo do włączania swojego komputera tylko po to, by był on wykorzystywany na potrzeby obliczeń. Twórcy projektu zauważyli, że na świecie są miliony komputerów, które przez wiele minut, czy nawet godzin, nie wykonują absolutnie żadnej pracy, po prostu są włączone, zużywają energię elektryczną, a na ekranie prezentowany jest co najwyżej wygaszacz ekranu. Jeżeli ktoś odchodzi od komputera np. na obiad albo wychodzi do sklepu zostawiając komputer włączony, może przysłużyć się nauce uruchamiając odpowiedni program (można go pobrać ze strony głównej projektu, jego rozmiar to zaledwie 9 MB), który graficznie będzie wyglądał jak zwyczajny wygaszacz ekranu, w rzeczywistości będzie pobierał małe pakiety danych z Internetu, przeanalizuje je i wyśle wyniki analizy do twórców projektu. Jeżeli dana osoba wróci ze sklepu i będzie chciała kontynuować pracę przy komputerze, działanie programu zostanie zawieszone do czasu, gdy komputer ponownie nie będzie miał nic do roboty.

Ciekawostką jest sam sposób dzielenia danych zarejestrowanych w obserwatorium w Arecibo. W ciągu jednego dnia zapisywane jest około 35 GB danych na taśmie DLT. Ze względu na brak szerokopasmowego łącza internetowego dane te są następnie przesyłane zwykłą pocztą (!) do Berkeley, gdzie są następnie dzielone na pakiety po 250 kB, które są następnie rozsyłane do domowych komputerów, w celu ich przeanalizowania.

Wspominałem, że dane pochodzą z teleskopu w Arecibo. Teleskop ten jest unieruchomiony, sygnały pochodzące z Ziemi albo okołoziemskich satelit są mniej więcej stałe, niezmienne w czasie. Przejście konkretnego punktu na niebie przez ognisko teleskopu trwa 12 sekund. Poszukiwany jest więc sygnał, który, jeżeli miałby być pochodzenia pozaziemskiego, powinien narastać, a następnie słabnąć, łącznie przez 12 sekund. Jest to podstawowy wyznacznik interesującego nas sygnału. Ponadto poszukiwane są sygnały modulowane, sygnały o nieco zmieniającej się częstotliwości, a w szczególności modulowane sygnały o zmiennej częstotliwości. Jeżeli znaleziony zostanie interesujący sygnał, zostanie on przesłany do Berkeley w celu dalszej analizy. W centrali projektu taki sygnał jest badany, czy nie jest on efektem zwyczajnego zakłócenia radiowego. W tym momencie odpada 99,999% wszystkich sygnałów. Wszystkie pozostałe niewyjaśnione sygnały są podstawą do ponownej obserwacji danego fragmentu nieba, jeżeli kilka razy z rzędu zostanie zaobserwowany dany sygnał, poproszona zostanie niezależna grupa naukowców o zbadanie tego sygnału, co może doprowadzić
w efekcie do przełomowego odkrycia.

Mimo, iż projekt działa od 1999 roku, a momentami jednocześnie aktywnych jest nawet 300 tys. komputerów, do tej pory nie udało się odkryć sygnałów od pozaziemskich cywilizacji. Największym sukcesem jest odkrycie kilkunastu interesujących gwiazd, w których szumie regularnie natrafiano na fale nośne i tryplety.

Galaxy Zoo

Dla mnie najmniej ciekawy i najbardziej uciążliwy jest projekt Galaxy Zoo, należący do serwisu Zooniverse, grupującego projekty naukowe, pozwalające internautom brać udział w projektach naukowych. Do Zooniverse należą takie projekty jak np. Planet Hunters, Milky Way Project, Moon Zoo czy Ancient Lives. Są to projekty wykorzystujące inteligencję i spostrzegawczość człowieka, w których udział może wziąć praktycznie każdy.

Wróćmy jednak do Galaxy Zoo. Jest to projekt astronomiczny rozpoczęty w 2007 roku. Celem jest pogrupowanie galaktyk na podstawie zdjęć wykonanych przez teleskop. Początkowo wykorzystywany był teleskop Sloan Digital Sky Survey znajdujący się w Apache Point Observatory w Nowym Meksyku, od kwietnia 2010 roku wykorzystywany jest teleskop Hubble’a, dzięki któremu zdjęcia są znacznie bardziej szczegółowe.

Aby rozpocząć przygodę z Galaxy Zoo wystarczy wejść na stronę internetową projektu i kliknąć przycisk Begin Classify. W tym momencie pokazane nam zostanie zdjęcie galaktyki oraz kilka pytań do tego zdjęcia np. jaki jest kształt przedstawionej galaktyki?  Nie ma w tym żadnej większej filozofii. Zaskakujący, przynajmniej dla mnie, jest sukces tego projektu. Ponieważ w przeciwieństwie to dwóch wcześniej przeze mnie opisanych, działających niejako w tle, wymaga poświęcenia swojego czasu i jest działaniem absorbującym naszą uwagę w danej chwili, podczas gdy SETI@home to po prostu wykorzystanie mocy obliczeniowej komputera, gdy nikt go nie używa, a reCAPTCHA to idealne połączenie pożytecznego (tłumaczenie tekstów) z koniecznością (ochrona stron internetowych przed botami).

Phylo

Nieco ciekawiej od Galaxy Zoo wygląd projekt Phylo. Zrealizowany w formie prostej gry logicznej, polegającej na jak najdokładniejszym dopasowaniu kliku rzędów kolorowych klocków. Z jednej strony całkiem fajna gierka, z drugiej strony wspaniale narzędzie wykorzystywane w badaniach naukowych. Jak to działa? Otóż każdy rząd klocków symbolizuje sekwencje nukleotydów u danego gatunku. Internauta przestawiając klocki pomaga w odnalezieniu relacji między różnymi gatunkami, np. jeżeli pierwszy rząd przedstawiał jakiś gen królika, a inny rząd gen łososia, możemy odkryć jakieś powiązanie pomiędzy królikiem a łososiem. Najlepsze uszeregowania są wykorzystywane chociażby w leczeniu chorób genetycznych.

Istnieje jeszcze wiele innych projektów w podobny sposób wykorzystujących zwyczajnych internautów. Wydaje się, że największe szanse powodzenia mają te, które są zrealizowane w formie interesującej gry albo takie, które zwyczajnie nie absorbują za dużo uwagi użytkowników.

Autor wpisu: Tomasz Dżumaga

Advertisements

2 komentarze to “Crowd Computing, czyli parę słów o wykorzystaniu użytkowników Internetu.”

  1. Jeszcze w szkole średniej bawiłem się swojego czasu w Galaxy Zoo. Fajna sprawa dla kogoś zainteresowanego astronomią, a na pewno lepsze klikanie w galaktyki niż odświeżanie facebooka 🙂

    Ilość danych zbieranych obecnie przez astronomów jest faktycznie, nomen omen, astronomiczna. Galaxy zoo to tylko jeden z najbardziej znanych projektów, w dużej mierze dzięki dostępności w postaci aplikacji webowej. Kilka polskich szkół bierze udział w innych programach, w ramach których uczniowie otrzymują do analizy zdjęcia z teleskopów na całym świecie i przeglądają je przy pomocy dedykowanych aplikacji desktopowych. Można na przykład poszukiwać nieznanych obiektów na rubieżach układu słonecznego lub pomagać w precyzyjnym określaniu orbit znanych już ciał niebieskich w ramach „Killer asteroid project” (tak, to się naprawdę tak nazywa 🙂 ). W tym drugim przypadku chodzi o tak zwane Near Earth Objects, czyli planetoidy mogące potencjalnie zagrażać Ziemi.

    Swoją drogą działania „tłumu” pomagają nie tylko w samym rozwiązywaniu problemów, ale także w uczeniu algorytmów, które w znacznej mierze nas wyręczają.

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: