Mikroformaty – pierwszy krok w kierunku sieci semantycznej

- autor: tsissput

Mikroformaty to internetowe podejście do semantycznych znaczników, które ma na celu reużycie istniejących tagów (X)HTML aby przekazać metadane oraz inne informacje na stronach internetowych, a także innych źródłach korzystających z (X)HTML, takich jak RSS. Takie podejście pozwala programom automatyczne przetwarzanie danych przeznaczonych dla użytkowników końcowych. Choć zawartość stron internetowych jest już, technicznie rzecz biorąc, przygotowana do automatycznego przetwarzania, to jednak jest ono trudne. Dzieję się tak dlatego, że znaczniki nie opisują w żaden sposób tego, jakie zawierają w sobie informacje. Celem mikroformatów jest wypełnienie tej luki poprzez dołączenie semantyki, a tym samym uniknięcie bardziej skomplikowanych metod automatycznego przetwarzania, takich jak chociażby przetwarzanie języka naturalnego. Zastosowanie i przetwarzanie mikroformatów umożliwia proste indeksowanie danych, a co za tym idzie, ich łatwe zapisywanie, wyszukiwanie i linkowanie. Dzięki temu informacje te mogą być reużywane lub łączone.

Mikroformaty pojawiły się jako inicjatywa, mająca na celu uczynienie danych, takich jak wydarzenia, dane kontaktowe czy geolokalizacyjne, rozpoznawalnymi i przystosowanymi do automatycznego przetwarzania przez oprogramowanie, jednocześnie pozostając zrozumiałymi przez użytkowników końcowych. Najpierw pojawiły się mikroformaty oparte na odnośnikach. Zaliczają się do nich tzw. „vote links”, które pozwalają wyrażać opinię o zwróconych przez wyszukiwarkę odnośnikach. Dzięki temu użytkownik może wyrazić czy znaleziona strona odpowiada jego zapytaniu.
Kiedy środowisku skupione wokół mikroformatów rozrosło się, CommerceNet, organizacja non-profit, promująca handel w internecie, zaczęła sponsorować i promować tę technologię. CommerceNet pomogła także w założeniu strony społeczności, Microformats.org.
Ani CommerceNet, ani Microformats.org nie zajmują się tworzeniem standardów. Społeczność mikroformatów funkcjonuje poprzez otwarte wiki, listy mailingowe oraz IRC. Większość z istniejących mikroformatów powstała właśnie na wiki Microformats.org oraz listach mailingowych poprzez zbieranie informacji i przykładów zachowań znajdowanych w internecie, a następnie ich kodyfikacji. Niektóre mikroformaty zostały przedstawione lub rozwinięte gdzie indziej.

Dotychczas zostało opracowanych wiele mikroformatów, umożliwiających zawieranie konkretnych danych semantycznych:

  • adr – do oznaczania informacji adresowych
  • geo – do oznaczania danych geolokalizacyjnych w systemie odniesienia WGS 84
  • hAtom – oznaczający dane epizodyczne
  • hAudio – dla plików audio i odniesień do wydanych nagrań
  • hListing – opisujący aukcje i oferty
  • hMedia – pojedynczy format publikacji mediów, który odnosi się do zdjęć, plików audio oraz video
  • hNews – opisujący informacje
  • hProduct – do oznaczania produktów
  • hRecipe – opisywanie przepisów kulinarnych
  • hResume – do publikacji życiorysów i CV
  • hReview – opisujący recenzje
  • rel-directory – aby wskazać, że dany odnośnik kieruje do katalogu wskazującego na bieżącą stronę
  • rel-enclosure – do opisywania załączników
  • rel-home – oznaczajacy odnośnik kierujący do strony głównej danego serwisu
  • rel-payment – opisuje mechanizm płatności
  • robots exclusion – opisuje informacje dla robotów (crawlerów) sieciowych
  • xFolk – pozwala otagowywać i udostępniać zakładki

Standard (X)HTML pozwala na osadzanie i kodowanie semantyki w atrybutach znaczników. Mikroformaty korzystają z tego, używając atrybutów class i rel w celu przekazania metadanych.
Na przykład zdanie: „Gniezno (52.542955, 17.589111) jest położone niedaleko Poznania.” jest zrozumiałe dla człowieka, jednak nie do końca przez komputer. Dzięki zawarciu nazwy miasta w elementy HTML, takie jak na przykład span z odpowiednimi nazwami klas, można dokładnie określić jego położenie. W tym przypadku należy skorzystać z klas geo, latitude i longitude, które są częścią specyfikacji geo microformat:

       Gniezno (
     <span class="geo">
        <span class="latitude">
           52.542955
        </span>,
        <span class="longitude">
           17.589111
        </span>
     </span>) jest położone niedaleko Poznania.

Można ukryć przed użytkownikiem niektóre informacje, zawierając je w atrybucie title elementu zagnieżdżonego klasy value-title :

     <span class="geo">
        <span class="latitude">
           <span class="value-title" title="52.542955"></span>
        </span>
        <span class="longitude">
           <span class="value-title" title="17.589111"></span>
        </span>
       Gniezno
     </span> jest położone niedaleko Poznania.

Więcej przykładów można znaleźć na stronie projektu oraz, po polsku, na stronach google.

Używanie mikroformatów w kodzie HTML zapewnia dodanie danych semantycznych, które mogą być wykorzystywane przez aplikacje. Na przykład roboty sieciowe mogą zbierać konkretne dane. Pozwala to też czynności takie jak na przykład eksportowanie wszystkich lokalizacji geograficznych i wizualizacja ich za pomocą chociażby Google Maps.
Rozszerzenia do przeglądarek, takich jak Operator dla Firefoxa, czy Oomph dla Internet Explorera, umożliwiają wykrywanie mikroformatów w dokumentach (X)HTML. Po odnalezieniu hCard lub hCalendar, pozwalają one na wyeksportowanie ich do formatów zgodnych z programami nimi zarządzającymi, np. Microsoft Outlook. Gdy znajdziemy współrzędne geograficzne, możemy je wykorzystać w aplikacjach udostępniających mapy, np Google Maps. 12 maja 2009 roku, Google ogłosiło, że będzie parsować mikroformaty: hCard, hReview i hProduct, a następnie używać ich do wyszukiwania. Później do powyższej trójki dołączyli także hCalendar i hRecipe. Podobnie, mikroformaty wykorzystuje Yahoo! i Bing. Microsoft oraz inne przedsiębiorstwa, wyraziły chęć włączenia mikroformatów do swoich kolejnych projektów.

Alex Faaborg, główny projektant UI Firefoxa, przedstawił następujące argumenty za tym, aby odpowiedzialność za interfejs mikroformatów narzucić przeglądarkom, zamiast zaszywać go w kodzie (X)HTML:

  • Tylko przeglądarka zna preferencje i programy używane przez użytkownika
  • Ułatwia to wejście mikroformatów na rynek, zwalniając webmasterów od obowiązku obsługiwania „look and feel”
  • Pozwala zachować wsteczna zgodność z przeglądarkami nie obsługującymi mikroformatów
  • Przeglądarka pozostaje jedynym programem pobierającym dane z internetu, co zwiększa bezpieczeństwo

Miało miejsce wiele dyskusji dotyczących zasad projektowania i praktycznych aspektów mikroformatów. Zostały one porównane do innych podejść oferujących tą samą, lub podobną, funkcjonalność. Od czasu do czasu pojawiają się krytyczne głosy w kierunku jednego, bądź wszystkich mikroformatów. Da się jednak zauważyć również opinie popierające i rozpowszechniające projekt. Dyrektor techniczny Opery i twórca CSS Håkon Wium Lie powiedział w 2005 roku: „Zobaczymy jeszcze rozwój wielu mikroformatów i wierzę, że właśnie tak zbudujemy sieć semantyczną.” Jednak w 2008 rku, Toby Inkster, twórca parsera mikroformatów Swignition, zauważył, że w ciągu ostatnich trzech lat nie pojawił się żaden nowy mikroformat.
Informatyk i przedsiębiorca, Rohit Khare stwierdził, że zasada 3R (reduce, reuse, recycle) jest skrótem kilku zasad projektowania, który przyświecał autorom mikroformatów. Aspekty te można opisać następująco:

  • Reduce – tworzyć jak najprostsze rozwiązania i skupić się na specyficznych problemach
  • Reuse – wzorować się na doświadczeniach i przykładach obecnych w użyciu
  • Recycle – wykorzystać modułowośc i możliwość do wstawiania, ponieważ poprawny kod (X)HTML może być reużyty na blogach, forach, przez RSS i wszędzie, gdzie jest dostęp do sieci

Mikroformaty nie są jedynym rozwiązaniem zapewniającym „bardziej inteligentne dane” w internecie. Istnieją alternatywne podejścia, które także są cały czas rozwijane. Na przykład, wykorzystanie składni XML i standardów Semantic Web są wymieniane jako alternatywne podejścia. W porównaniu z mikroformatami, nie korzystają one jednak w takim stopniu z zasady 3R. Jeden ze zwolenników mikroformatów, Tantek Çelik, opisuje problem alternatywnych podejść w następujący sposób: „Oto nowe języki, których chcemy, żebyście się nauczyli. Chcemy też, żebyście dodali nowe pliki na wasz serwer. To problem. Mikroformaty mają mniejszą pracę wejścia.”.
Dla niektórych aplikacji stosowanie alternatywnych metod może być poprawne. Jeśli ktoś zechce użyć mikroformatów do opisu danych, dla których takowy nie istnieje, może on użyć RDFa (Resource Description Framework – in – attributes). Przykładem takich danych są: dane naukowe, zoologiczne lub chemiczne, dla których nie istnieją odpowiednio zdefiniowane mikroformaty. Ponadto standardy takie jak GRDDL (Gleaning Resource Descriptions from Dialects of Languages) pozwalają konwertować mikroformaty w dane kompatybilne z sieciami semantycznymi. Inny zwolennik mikroformatów, Ryan King, przedstawia kompatybilnośc mikroformatów z innymi podejściami w ten sposób: „Mikroformaty dostarczają wielu ludziom możliwość łatwego tworzenia semantycznych danych w internecie. Z GRDDL wszystkie te dane są dostępne dla narzędzi RDF sieci semantycznych. Mikroformaty i GRDDL mogą być wykorzystywane razem do budowy lepszego Internetu.”.

Karol Kosiński (103892)

Reklamy

One Trackback to “Mikroformaty – pierwszy krok w kierunku sieci semantycznej”

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: