„Why the Semantic Web will never work”

- autor: tsissput

Zebranie i analiza informacji przedstawionych na wykładzie Jim’a Hendler’a
pt.: „Why the Semantic Web will never work”

Jim Hendler

Ideą organizowanej od 2011 konferencji Extended Semantic Web Conference (ESWC) jest zebranie osób zaangażowanych w różne aspekty technologii semantycznych, a także innych obszarów Informatyki, które wiążą się z pojęciem Semantic Web. Ma ona na celu sprowokowanie wymiany informacji pomiędzy różnymi społecznościami wewnątrz i spoza dziedzin Informatyki i Telekomunikacji.

Konferencja ta powstała jako rozwinięcie European Semantic Web Conference. Wykład wprowadzający, tzw. keynote,  prowadził profesor Jim Hendler, znany ze swojego znaczącego wkładu w zakresie Semantic Web, a także całej dziedziny Informatyki oraz Kognitywistyki. Zapowiadający nazywa go nawet Papieżem Semantic Web. Aktualnie pełni stanowisko Tetherless World Senior Constellation Professor na wydziałach Department of Computer Science oraz Cognitive Science Department  Rensselaer Polytechnic Institute (RPI), w Troy w Nowym Yorku.

Tytuł wykładu ma prowokacyjne brzmienie i został celowo umieszczony w cudzysłowie, ze względu na dwuznaczność. Jim Hendler dokonuje przeglądu aktualnych sukcesów technologii semantycznych względem wczesnej wizji Semantic Web oraz identyfikuje problemy dotyczące aktualnych rozwiązań oraz najnowszych próbach ich rozwiązania. Pokazuje więc aktualne dokonania z dwóch perspektyw:

wyjaśnienie tytułu

Początkowa wizja

W 1994 roku  na konwencji WWW Tim Berners-Lee dokonał prezentacji, w której pokazał swoją wizję sieci web. Część tego czym sieć jest określił w następujący sposób: „Dokumenty w sieci web opisują prawdziwe obiekty i wyimaginowane pojęcia oraz nadają szczególne związki pomiędzy nimi”. Tim Berners-Lee wymyślił więc to, co dzisiaj nazywamy Semantic Web, a hyperlinki nie miały być zwykłymi wskaźnikami na inne strony internetowe, lecz miały reprezentować relacje pomiędzy stronami.

Innm pomysłem, zaprezentowanym w 1999 roku przez Jim’a Hendler’a, był Agent markup language, który polegał na zbudowaniu semantycznego języka, który wiązałby informacje na stronie internetowej z semantyką (ontologią) odczytywalną maszynowo. Obecnie pomysł ten rozwijany jest w ramach projektów OWL, SHOE, I3 lub ARPI.

Co wiąże oba te pomysły, to koncepcja, by pewne elementy na stronach web opisywały jakie treści one zawierają i co one znaczą.

schemat współdziałania ontologii sieciowych

schemat współdziałania ontologii sieciowych

Wyobrażano sobie również, że ontologie webowe, czy też semantyka umieszczona na stronach web będzie miała charakter zgoła inny od tradycyjnych systemów reprezentacji wiedzy (KR). Różne dokumenty sieci web, mogły by być opisywane przez różne słowniki, które były by wobec siebie w różnym stopniu mapowalne. Częściowa mapowalność i niespójność tychże ontologii powodowała by więc błędy takie błędy jakie można spotkać przeglądając strony internetowe, np. 409, lecz taki schemat umożliwiałby dużą skalowalność, elastyczność, a w rezultacie dużą ilość użytkowników i duży wpływ na sieć web.

Do innych wczesnych koncepcji dotyczących Semantich Web należały:

  • przeszukiwanie sieci w poszukiwaniu konkretnej odpowiedzi, nie w poszukiwaniu dokumentu, który wydaje się adekwatny
  • użycie istniejących ontologii w ramach
  • use x ontology on webpages
  • aspekt usługi
  • active notion – a way of exchanging information “This term came from here” linking

Zwycięstwo Semantic Web

Gdy Semantic Web dopiero się rozwijało, myśl o tym, że rząd wielkości o jakim należy myśleć w przypadku technologii semantycznych to przynajmniej miliony, wzbudzała śmiech.  Aktualnie liczba stron internetowych, które zawierają informację semantyczną i liczba trójek semantycznych – triple (URI obiektu, URI obiektu, URI związku), które są generowane oraz zbiorów danych które są dostępne przekroczyła nawet najśmielsze oczekiwania.

Aktualnie wiele z dużych firm zajmuje się technologiami semantycznymi. Są one pozytywną siłą dla rozwoju pewnych obszarów Semantic Web, przykładowo semantycznego wyszukiwania (np. Google Knowledge Graph) o którym szerzej mówi Peter Mika w swojej prezentacji Making the Web searchable, a także dla promocji, reklamy i marketingu. W szczególności, bardzo prężnie rozwijają się nowe firmy, które służą jako pośrednicy pomiędzy jednostkami dostarczającymi usługi lub produkty (w szczególności treści), a konsumentami. Pośrednictwo to polega na budowaniu informacji preferencyjnej użytkowników na podstawie danych semantycznych i kierowaniu do nich odpowiednich ofert.

Innym dużym czynnikiem wpływającym na postęp Semantic Web są implementacje idei o nazwi Open Data, przykładowo  Facebook Open Graph lub Open Goverment Data. W przypadku Facebook Open Graph, jedną z możliwości umieszczenia przycisku „Lubię to” na stronie internetowej jest użycie RDF’a, który generuje trójki danych semantycznych. W Październiku 2010 Facebook zarejestrował około 3 miliony „Lubię to” dziennie pochodzące z tego źródła, gdzie pojedyńcze kliknięcie może generować więcej niż 1 trójkę semantyczną (triple). Estymowano wtedy, że jedynie około 10%-15% przycisków „Lubię to” na stronach było umieszczone w postaci RDF’a, a Facebook bardzo silnie stara się, by zachęcić jak największą ilość osób do zmiany na ten typ przycisków. Okazuje się, że przyciski Facebook’a same generują więcej trójek z informacją semantyczną niż  kiedykolwiek przewidywano dla całej sieci, a zyski z reklamy przeprowadzanej na podstawie tej informacji są głównym źródłem dochodów Facebook’a, a także innych firm – np. Zynga, która zarabia więcej pieniędzy niż jakakolwiek inna firma wytwarzająca gry komputerowe, ponieważ jako pierwsza znalazła sposób na wykorzystanie tej informacji.

Krytyka Semantic Web

Pomimo zaangażowania ze strony dużych graczy na rynku wyszukiwarek internetowych, aktualnie nadal wyszukiwanie wykonywane jest w tradycyjny sposób, po słowach kluczowych, w celu znalezienia dokumentów, które wydają się adekwatne i mogą zawierać wyszukiwaną odpowiedź.

Początkowo wydawało się, że folksonomia okaże się najlepsza do umieszczania informacji semantycznej, jednak w dużej mierze technologie związane z tagowaniem zawiodły poza zastosowaniami w sieciach społecznościowych. Podstawowym problemem, dla tagowania był brak kontekstu, a więc zatracenie znaczenia wśród wielu innych obiektów otagowanych w ten sam sposób. W przypadku sieci społecznościowej tag, przykładowo imię i nazwisko, będzie miał konkretne znaczenie ponieważ będzie on na stronie osoby, która mówi o osobie ze swojej listy znajomych.

most used

Zarzuty dotyczące braku skalowalności, elastyczności i stabilności Semantic Web okazały się nieuzasadnione, co potwierdzają wcześniejsze przykłady. Co więcej, liczba ogólnie dostępnych URI, które mają swoją semantykę, przykładowo z Open Goverment Data rośnie bardzo szybko.

Pewnym problemem aktualnego rozwoju Semantic Web, jest to, że większość zastosowań korzysta głównie z technologii semantycznych „niższego poziomu”, podczas gdy wiele z ciekawych, użytecznych, a co więcej ustandaryzowanych z nich nie jest znana lub nie jest używana przez większość osób.

Konkluzja

Dlaczego Semantic Web miało by nigdy nie działać? Jim Hendler odpowiada, że nie ma żadnego powodu, aby tak było – Semantic Web istnieje, działa i będzie działać. Nie jest to jednak Semantic Web, z pierwotnej wizji. Konieczny jest powrót i uaktulanienie do pierwotnych pomysłów i unifikacja aktualnie konkurujących ze sobą modeli powiązanych danych (linked-data) i odczytywalnych maszynowo słowników. W szczególności problemem, który musi zostać rozwiązany jest integracja ontologii i rozój mechanizmów pracy z danymi, które mogą zawierać poważne, nierozwiązywalne sprzeczności.

Wg mojej oceny sukces Semantic Web jest potwierdzony przez, to z jakim zaangażowaniem zajmują się technologiami semantycznymi duże firmy takie jak Facebook, Google, Oracle, Amazon, czy też Microsoft, a w szczególności w jaki sposób użytkownicy zarówno generują i konsumują informację semantyczną, poprzez korzystanie z aplikacji społecznościowych, aplikacji mobilnych i webowych (w tym np. gier na Facebook’u). Innym aspektem, który w dużym stopniu napędzia rozwój Semantic Web jest sposób w jaki niektóre z firm zaangażowane w tworzenie i gromadzenie informacji semantycznej współpracują z innymi firmami – przykładowo umieszczanie przycisków „Lubię to” na stronie udostępnia informacje, zarówno dla Facebook’a, jak i dla właściciela strony internetowej. Innym przykładem jest sposób w jaki Facebook i Google umożliwiają deweloperom publikowanie aplikacji, które potencjalnie mogą być agentami przetwarzającymi lub generującymi informację semantyczną.

Autor: Michał Turek

Źródła: opisywany wykład, strona Jim’a Hendler’a, artykuł o Google Knowledge Graph, strona konferencji ESWC , artykuł wiki o Clay’u Shirky, artykuł wiki o KR, artykuł o Open Data, Facebook Open Graph, Open Government Data.

 

Advertisements

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: