Archive for ‘Artificial Intelliegence’

Grudzień 3, 2012

Komputer gra w „Va Banque”

- autor: tsissput

Watson

 

Od wielu lat próbujemy skonstruować komputery, które jak najlepiej zasymulują działanie pewnych obszarów ludzkiego umysłu. Naturalnym kryterium sukcesu staje się tutaj zdolność do nawiązania równej rywalizacji z człowiekiem. Wielu z nas słyszało o słynnym pojedynku arcymistrza szachowego Garriego Kasparowa z superkomputerem Deep Blue stworzonym przez IBM. Pierwsza potyczka odbyła się w 1996 roku i zakończyła wynikiem 4-2 dla Kasparowa. W rewanżu w 1997 w meczu wzięła udział ulepszona wersja maszyny Deep Blue. I tutaj już maszyna ten pojedynek wygrała.

W 2011 kolejna maszyna IBM stanęła w szranki z człowiekiem. Był to Watson.

 

Czym jest Watson i co potrafi?

Watson jest potężnym superkomputerem. 2880 rdzeni (http://en.wikipedia.org/wiki/Embarrassingly_parallel), 15 TB pamięci operacyjnej. 80 TeraFLOPs plasowało go w pierwszej setce najszybszych komputerów. Taka moc była konieczna, aby komputer był w stanie znajdować odpowiedzi szybciej, niż mistrzowie konkurencji, w której wystąpił- mistrzowie teleturnieju Jeopardy! (którego polskim odpowiednikiem swego czasu był Va banque). Brad Rutter wygrał najwięcej- w sumie ponad 3,4 mln dolarów, Ken Jennings był najdłużej niepokonany- 74 zwycięstwa z rzędu. Naprzeciwko nich uzbrojony w 4 terabajty danych (w tym cały tekst Wikipedi) Watson. Komputer nie był nieomylny, miał problemy w odpowiadaniu na pewne rodzaje pytań- mimo to, jego zwycięstwo było pewne. Zgromadził 77 147$ w porównaniu do 24 000$ i 21 600$ swoich rywali.

 

Cała Wikipedia, 3000 rdzeni- co w tym specjalnego, że pokonał człowieka?

Wydaje się, że to nic wyjątkowego. Tak jakby dać nam dostęp do Internetu i kazać odpowiadać na zadawane pytania. Wiadomo, znalezienie informacji może chwilę zająć, ale przecież nie od dziś wiadomo, że proste operacje komputer wykonuje zdecydowanie szybciej od nas. I wcale nie trzeba do tego superkomputera. Co więc takiego niezwykłego było w tym osiągnięciu?

Należy zauważyć, że pytania w teleturnieju wymagały precyzyjnych odpowiedzi. Nie wystarczyło znaleźć źródła, w którym odpowiedź się znajduje- potrzebna była jego analiza i zlokalizowanie precyzyjnej odpowiedzi na pytanie. Trzeba zauważyć, że „zagadki” w Jeopardy! nie zawsze mają charakter typowych pytań (a raczej odpowiedzi- tak jak w Va banque, to zawodnik „odpowiada” pytaniem). Często przybierają formę wskazówek, bazują na skojarzeniach. Wskazówki często mają rolę edukacyjną czy rozrywkową i nie są niezbędne dla znalezienia odpowiedzi. Nie jest wcale powiedziane, że źródło, w którym znajdziemy odpowiedź będzie zawierało frazy, które dostaliśmy jako podpowiedź. Widać więc, że wchodzimy tu w strefę zupełnie nie kojarzącą nam się z chłodnym „rozumowaniem” komputera- pytanie należy precyzyjnie zrozumieć, łączyć fakty za pomocą skojarzeń tak, aby sformułować krótką, precyzyjną odpowiedź.

Co więcej- w grze częste są gry słów. A w nich wszystko zależy od kontekstu- te same słowa potrafią nabrać zupełnie innego znaczenia. Watson musiał „nauczyć się”, jak używamy języka, jak znaczenie ma kontekst i powiązania między słowami. Czyli Watson nie tylko posiadł umiejętność wyszukiwania informacji- potrafi także zrozumieć nasz naturalny język, dać nam dokładną odpowiedź, nie tylko zbiór dokumentów, gdzie odpowiedź możemy znaleźć sobie sami.

 

Jak Watson potrafi to robić?

Watson wykorzystuje techniki przetwarzania języka naturalnego, wyszukiwania informacji, reprezentacji wiedzy, wnioskowania i uczenia maszynowego. Jego rdzeniem jest technologia IBM o nazwie DeepQA (QA- Question Answering).

123

 

 

Jak wygląda architektura DeepQA możemy zobaczyć powyżej.

Pierwszym etapem przygotowawczym jest pozyskanie zawartości, która będzie mogła zostać wykorzystana w dalszym procesie jako źródło odpowiedzi i dowodzenia jej prawdopodobności- czyli zbudowanie bazy wiedzy dla maszyny. Oprócz wielu encyklopedii, dokumentów niosących najwięcej informacji (ich zebranie wymagało zarówno „ręcznego” przejrzenia typów pytań jak i automatycznego, statystycznego zbadania dziedziny), do bazy wiedzy trafiły bazy danych, taksonomie i ontologie takie jak dbPedia, WordNet i Yago .

Pirerwszym etapem wykonywanym już podczas działania mechanizmu jest analiza pytania. System analizuje pytanie w celu określenia dalszego sposobu jego przetwarzania- stara się zrozumieć, jaki jest jego sens. W jego skład wchodzi m.in.:

  • Klasyfikacja pytania- odnajdywanie części wymagających specjalnego przetworzenia, o potencjalnie podwójnym znaczeniu, o specjalnym funkcji syntaktycznej lub semantycznej. Pytanie może zostać sklasyfikowane jako zagadka, zadanie matematyczne, definicja.
  • Wykrywanie relacji
  • Dekompozycji pytania na podpytania

Kolejny krok to generacja hipotez. Na podstawie wcześniejszej analizy system skanuje dostępne dokumenty wyodrębniając fragmenty mogące stanowić odpowiedź. Każdy fragment stanowi odrębną hipotezę, której pewność system dalej stara się obliczyć. Żródła są wstępnie przeszukiwane, znajdywany jest jak największy zbiór danych mogących potencjalnie nieść odpowiedź. Następnie wybierany jest z nich podzbiór odpowiedzi- kandydatów. Jako że sytuacja, w której prawidłowa odpowiedź nie pojawi się w tym zbiorze implikuje fakt, że system nie będzie w stanie prawidłowo odpowiedzieć na pytanie, akceptowany jest tutaj duży szum, precyzja spada na drugie miejsce. Po tym etapie algorytm posiada zbiór kilkuset potencjalnie poprawnych odpowiedzi, które następnie przechodzą przez filtr, który na podstawie wielu współczynników (np. na ile prawdopodobne jest, że odpowiedź jest spodziewanego typu leksykalnego: tak jak roszada jest typu manewr) pozwala wyekstrahować grupę ok 100 najbardziej prawdopodobnych.

Następnie dla każdej potencjalnej odpowiedzi przeprowadzany jest proces zbierania potwierdzających dowodów, które zwiększają szanse, że dany kandydat będzie odpowiedzią prawidłową. Wyliczany jest współczynnik pewności, określający, jak odnaleziony dowód wspiera kandydydata. Do punktacji wykorzystywane jest ponad 50 mechanizmów oceniających.

W końcu, odpowiedzi są scalane, jako że z nich może być równoznacznych. Wymaga to użycia mechanizmów przetwarzania języka naturalnego, system musi odnaleźć frazy znaczeniowo tożsame. Lider rankingu, jeśli jego wsparcie jest wystarczające, zgłaszany jest jako interesująca nas odpowiedź.

Jest to oczywiście krótko naszkicowane działanie mechanizmów stojących za działaniem Watsona. W celu pogłębienia tematu, warto zacząć od przeczytania artykułu pod tym linkiem: http://www.scribd.com/doc/48793380/Watson-DeepQA

 

Komputer wygrał teleturniej i milion dolarów. A co my z tego mamy?

Kolejnym planowanym krokiem w rozwoju Watsona jest wyposażenie go w mechanizm rozpoznawania mowy i uzbrojenie w wiedzę medyczną, co umożliwi zastosowanie go jako wsparcie w diagnostyce medycznej. IBM bada też możliwość wykorzystania Watsona jako wsparcie dla prawników. No i jak to IBM- niewiele jest rzeczy, których IBM nie robi w celu uzyskania dużych pieniędzy (w czym nie ma nic złego, szczególnie, jeśli niesie to za sobą ogromy rozwój, z którego korzystamy wszyscy). Planowana jest sprzedaż systemu wielkim korporacjom. Szacowana cena- kilka milionów dolarów.

 

Czy Watson myśli?

Niestety- Watson jest tworem czysto technologicznym. To wysokowydajny system analityczny, nie jest tworem poznawczym, myślącem. Potrafi się uczyć, przetworzyć dane i podać nam trafną odpowiedź. Istnieje inny projekt IBM finansowany przez NASA skupiony na przetwarzaniu kognitywnym, na odtworzeniu zachowania ludzkiego umysłu. Być może kognitywne zdolności nowego projektu zostaną połączone z potężną analityczną mocą Watsona. Najpopularniejsze wyzwanie komputerów próbujących stanąć do zawodów z człowiekiem- test Turinga- wciąż pozostaje niezaliczone.

 

A potem:

http://en.wikipedia.org/wiki/Technological_singularity

 

Autor: Kacper Skory

 

Źródła;

http://en.wikipedia.org/wiki/Watson_(computer)

http://www.aaai.org/Magazine/Watson/watson.php

https://www.ibm.com/developerworks/mydeveloperworks/blogs/InsideSystemStorage/entry/ibm_watson_how_to_build_your_own_watson_jr_in_your_basement7?lang=en

http://www.research.ibm.com/deepqa/faq.shtml

http://www-03.ibm.com/innovation/us/watson/watson-for-a-smarter-planet/building-a-jeopardy-champion/how-watson-works.html

Reklamy