Web 3.0 – czyli semantyczny Internet.

- autor: tsissput

W dzisiejszych czasach technologie informatyczne bardzo szybko wkraczają do naszego codziennego życia. Każdego dnia bez żadnego problemu możemy znaleźć informacje dotyczące otaczającego nas świata, sprawdzić pocztę, a to wszystko bez wychodzenia z domu. Możemy również kupić bilet lotniczy, kolejowy, zapisać się do lekarza, kupić wycieczkę zagraniczną; po prostu dzięki technologii możemy to wszystko załatwić bez wychodzenia z domu. A gdyby te wszystkie codzienne sprawy wykonywał za nas komputer? Według Tima Bernersa-Lee, którego można nazwać twórcą sieci WWW, w swoim artykule z 2001 roku, napisał że w niedalekiej przyszłości powstaną aplikacje, które za nas ludzi będą wykonywać codzienne sprawy. Takie aplikacje kupią za nas bilet lotniczy, zapiszą nas na wizytę u lekarza oraz zarezerwuje bilety do kina na weekend. Taki rozkład zajęć zostanie zsynchronizowany z kalendarzem na naszym laptopie i przesłany do naszego podręcznego urządzenia czy też telefonu.

W chwili obecnej wizja aplikacji, które wykonują za nas codzienne sprawy wcale nie jest aż tak odległa jak by się to mogło wydawać. Dynamiczny rozwój technologii informatycznych może spowodować, że już niedługo takie oprogramowanie będzie można mieć w każdym podręcznym urządzeniu: czy to w telefonie, urządzeniu PDA czy laptopie. Aby zrozumieć, jak mogłyby działać takie aplikacje, należy spojrzeć w inny sposób na Internet. Internet, w którym witryny, linki, elementy multimedialne i bazy danych uzupełnione są o semantyczne informacje, dzięki którym sieć staje się inteligentna, zdolna nie tylko do przechowywania i przesyłania, ale również rozumienia danych i wnioskowania, to właśnie jest obraz Web 3.0.

Technologie Web 3.0 – pozwalają na informowanie sieci, czym są informacje, znajdujące się na dyskach serwerów w postaci baz danych czy stron WWW. Dzięki tworzeniu i publikowaniu metadanych w postaci dokumentów RDF, OWL, oraz odpowiedniego otagowania w kodzie HTML, aplikacje mogą zrozumieć, z jakimi danymi mają do czynienia i mogą umiejętnie je spożytkować. Obecnie najczęściej do opisu zasobów Internetu wykorzystuje się takie standardy jak RDF, OWL czy Mikrotechniki.

RDF (ang. Resource Description Framework) – jest to język opracowany przez konsorcjum W3C, bazujący na składni standardu XML, który pozwala na opisywanie zasobów sieci Web identyfikowanych za pomocą URI. Założeniem standardu RDF jest prezentacja danych zawartych w zasobach Web w sposób łatwo przetwarzany przez programy komputerowe, a nie na ich wyświetlaniu użytkownikom. Strukturę każdego wyrażenia RDF stanowi zbiór trójek. Każdy zbiór składa się z tematu (podmiotu), predykatu i obiektu. Taki zbiór trójek (ang. triples) można zaprezentować w postaci grafu RDF (Rys. 1).

 

Rys. 1 Struktura danych RDF

 

Rys. 2 Przykładowy dokument RDF

Na Rys. 2 przedstawiono przykładowy dokument RDF, w którym podmiot [1] stanowi opisywany zasób, predykat [2] określa, jaka jego własność jest opisywana, zaś obiekt [3] stanowi wartość tej własności. Podstawowym mechanizmem stosowanym w języku RDF do identyfikacji podmiotu, predykatu i obiektu jest URI.

Język OWL – (ang. Web Ontology Language) – również jest standardem konsorcjum W3C i jest przeznaczony do definiowania semantyki dokumentów poprzez specyfikowanie wiedzy dziedzinowej. Innymi słowy jest rozszerzeniem RDF, formalnie mogącym zapisać ontologie. Standard OWL jest dzielony na trzy odmiany:

  • OWL Lite;
  • OWL DL (rozszerzenie OWL Lite);
  • OWL Full (rozszerzenie OWL DL).

Język RDF i OWL są bardzo podobne i dotyczą tego samego problemu, jednak OWL jest językiem bardziej rozbudowanym, z większym słownikiem i mocniejszą składnią.

Oprócz RDF i OWL do opisu zasobów Internetu stosuje się mikroformaty. Mikroformaty – są to wzory kodu HTML, które reprezentują powszechnie publikowane informacje takie jak: informacje adresowe, dane personalne, dane o wydarzeniach, spotkaniach. Taka reprezentacja pozwala w efektywny sposób prezentować i przetwarzać informacje w sieci. Mikroformaty nie są częścią specyfikacji języka HTML czy XHTML, są to zasady stosowania klas i elementów XHTML, w taki sposób, aby informacje zapisywane dzięki nim były czytelne zarówno dla człowieka jak i maszyny. To właśnie mikroformaty są najprostszą i najłatwiejszą drogą do opisu semantycznego zamieszczanych w Internecie danych. Dobrze zapisane mogą zapewnić zgodność informacji z urządzeniami mobilnymi oraz innymi aplikacjami tworzonymi w dziedzinie technologii Semantic Web. Na witrynie poświęconej mikroformatom http://microformats.org/wiki/Main_Page-pl publikowane są na bieżąco najnowsze wiadomości związane z tą technologią. W mikroformatach stosowany jest atrybut class tagów HTML ( często <span> i <div>) w celu przypisania krótkich i opisowych nazw do elementów oraz ich właściwości. Aby przybliżyć działanie mikroformatów, przedstawiono przykład krótkiego bloku HTML zawierającego podstawowe dane kontaktowe w postaci wizytówki osoby Dariusza Boczka i poniżej ten sam kod HTML opisany przy użyciu wizytówki: hCard – jednego z wielu rodzajów mikroformatów.

<div>
   <img src="www.przyklad.pl/dariuszboczek.jpg" />
   <strong>Dariusz Boczek</strong>
   Dyrektor działu Marketingu
   ul. Torowa 15
   Tarnowo, woj. mazowieckie, 65-123
</div>
Ten sam przykład opisany za pomocą hCard.
<div>
   <img src="www.przyklad.pl/dariuszboczek.jpg" />
   <strong>Dariusz Boczek</strong>
   <span> Dyrektor </span> działu
<span>Marketingu</span>
   <span>
      <span> ul. Torowa 15</span>
<span class="locality">Tarnowo</span>,
<span class="region">woj. mazowieckie</span>,
      <span>65-123</span>
   </span>
</div>

hCard – przekłada pola wizytówek w formacie vcard na nazwy klas. Wizytówka musi być zawarta w elemencie z klasą vcard. W tej klasie zawartość poszczególnych elementów z odpowiednimi klasami jest interpretowana jako pola wizytówki. W naszym przykładzie:

  • class=”photo” – wskazuje adres URI do zdjęcia,
  • class=”fn” – imie i nazwisko,
  • class=”title” – opis stanowiska,
  • class=”org” – organizacje,
  • class=”adr” – dane adresowe,
    • class=”street-address” – nazwa ulicy i numer mieszkania
    • class=”locality” – nazwa miejscowości
    • class=”postal-code” – kod pocztowy

I tak dzięki kilku klasom udało nam się zapisać wizytówkę w formacie hCard. Oprócz użytych wyżej elementów w formacie hCard istnieja takie typy jak:

  • class=”email” – adres mailowy (stosowane w znaczniku <a>)
  • class=” country-name” – kraj
  • class=”tel” – może zawierać bezpośrednio numer telefonu albo kilka numerów w elementach określających ich typ (czy domowy/do pracy, czy ma fax)

Elementy, które nie mają nadanej klasy specyficznej dla formatu hCard po prostu nie będą częścią wizytówki. Można to wykorzystać do nadania dodatkowego formatowania, nagłówków pól, itp.

Podsumowując, Web 3.0, czyli semantyczna sieć,  jest dopiero w początkowej fazie rozwoju. Należy jeszcze poczekać aż wszystkie zasoby internetowe będą opisywane w sposób zrozumiały dla maszyn. Aby to było możliwe, należy każdy zasób w Internecie opisać za pomocą takich standardów jak RDF, OWL czy mikroformaty. Niestety, obecnie jest jeszcze wiele stron, które nie są opisywane za pomocą ww. języków, czyli nie mogą być wykorzystywane przez maszyny. Web 3.0 ma pozwalać kreować nową wiedzę z istniejących zasobów Internetu przy pomocy specjalnego oprogramowania wyposażonego w mechanizm wnioskowania. Niestety założenie to nie będzie spełnione, jeśli zasoby nie będą odpowiednio opisane.


Źródła:

http://www.w3.org/RDF/

http://www.w3.org/2004/OWL/

http://microformats.org/wiki/Main_Page-pl

http://pl.wikipedia.org/wiki/Semantic_Web

 

Autor: 103890

Reklamy

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s

%d blogerów lubi to: