Archive for Styczeń, 2012

27 stycznia, 2012

Kilka argumentów na korzyść technologii semantycznych

- autor: tsissput

Mike Bergman, CEO i współzałożyciel firmy Structured Dynamic LLC w ciekawy sposób opisał kilka zalet technologii semantycznych, najważniejszych z biznesowego punktu widzenia.

Kanoniczny zapis dowolnych informacji
Model danych RDF i jego zdolność do reprezentowania najprostszych danych za pomocą skomplikowanych schematów dziedzinowych i słowników opartych na ontologicznym języku OWL sprawia, że każdy istniejący schemat czy struktura mogą mieć swoją reprezentację. Dzięki tej ekspresywności i elastyczności, każde istniejące dotychczas źródło danych lub schemat mogą być zapisane za pomocą jezyka RDF i jego rozszerzeń. Spektrum użycia tego języka umożliwia wyrażenie wspólnej reprezetancji dla dowolnego, istniejącego schematu danych; dzięki takiej ekspresywności z kolei możliwe jest zapisanie w kanonicznej postaci dowolnej reprezentacji danych.

Wspólna, kanoniczna reprezentacja wszystkich istniejących schematów i typów danych oznacza, że wszystkie te informacje mogą zostać powiązane i wzbogacone o wzajemne relacje. Kanoniczność ta, oparta o powiązanie dowolnych danych za pomocą modelu RDF, jest podstawową zaletą technologii semantycznych. Dodatkowo, praktyka nadawania identyfikatorów w formie URI wszystkim składowym elementom w tym podejściu sprawia, że idealnie pasuje ono do rozproszonych danych dostępnych za pośrednictwem sieci Internet.

Obsługa istniejących struktur danych
Każdy istniejący dotychczas format lub struktura danych mogą być reprezentowane za pomocą modelu RDF; model ten jest w stanie łatwo przedstawiać informacje zawarte w ustrukturyzowanych (konwencjonalne bazy danych), pół-strukturyzowanych (strony internetowe, strumienie danych w formacie XML) czy nieustrukturyzowanych (dokumenty, obrazy) źródłach informacji. Użycie ontologii wraz z instancjami obiektów jako rekordów w modelu RDF jest potężnym narzędziem dla systemów ekstrakcji wiedzy, coraz bardziej powszechnych przy tagowaniu informacji ze źródeł o nieokreślonej strukturze.

Prostota reprezentacji jakiegokolwiek formatu czy struktury danych i możliwość wyodrębnienia struktury z nieustrukturyzowanych źródeł czyni model RDF „uniwersalnym rozpuszczalnikiem” dowolnych informacji. Stąd, z niewielkim nakładem pracy na konwersję/wyodrębnianie, wszystkie informacje w ich istniejącej formie mogą zostać zorganizowane i powiązane relacjami dzięki RDF.

Adaptacyjny, elastyczny schemat
Dość osobliwą różnicą pomiędzy technologiami semantycznymi i systemami relacyjnymi jest wykorzystanie podejścia „otwartego świata”. Model relacyjny jest paradygmatem, w którym informacja musi być kompletna oraz opisana zgodnie z narzuconym z góry schematem. Model ten zakłada, że jedynymi obiektami i relacjami pomiędzy nimi, istniejącymi w danej dziedzinie są obiekty i relacje jawnie zapisane w bazie danych. Ten „zamknięty świat” systemów relacyjnych utrudnia łączenie informacji z wielu źródeł, radzenie sobie z danymi niepewnymi lub niekompletnymi czy próby integracji wewnętrznych, zastrzeżonych informacji z danymi pochodzącymi z zewnątrz.

Z kolei technologie semantyczne umożliwiają modelowanie różnych dziedzin w sposób inkrementacyjny: kiedy pozyskiwana jest nowa wiedza, bądź przeprowadzane są nowe integracje, leżący u podstaw danych schemat może być dodany i zmodyfikowany bez naruszania informacji obecnej w systemie. Ta adaptacyjność jest w zasadzie największym źródłem korzyści ekonomicznych dla firmy, które wynikaj z użycia technologii semantycznych. Ponadto dodatkowym atutem jest możliwość „eksperymentowania” z danymi bez większego ryzyka awarii.

Bezkonkurencyjna wydajność
Możliwość posiadania informacji w jednolitej, kanonicznej formie powoduje, że różnej maści narzędzia generyczne czy aplikacje mogą być projektowane pod kątem tej formy. To z kolei zwiększa wydajność zarówno użytkowników jak i twórców aplikacji. Nowe zbiory danych, struktury i relacje mogą być w dowolnym momencie dodane do systemu, natomiast sposób w jaki narzędzia manipulują tymi informacjami pozostaje taki sam.

Wydajność użytkowników wzrasta dzięki konieczności opanowania jedynie niezbędnej liczby narzędzi. Relacje w składowych zbiorach danych są modelowane na poziomie schematu (tj. ontologii). Ponieważ manipulowanie informacją na poziomie interfejsu użytkownika składa się z ogólnych paradygmatów dotyczących selekcji, podglądu czy modyfikacji prostych konstrukcji zbiorów danych, typów i instancji, dodanie lub zmiana nowych danych nie spowoduje konieczności wprowadzenia jakichkolwiek zmian w funkcjonalności interfejsu. Te same czynności związane z manipulacją danymi mogą być z powodzeniem stosowane niezależnie od zbiorów danych, typów obiektów istniejących wewnątrz nich czy relacji pomiędzy nimi. Zachowanie aplikacji opartych o technologie semantyczne jest mocno zbliżone do ogólnych mashupów (tj. stron internetowych, które łączą w sobie aplikacje on-line udostępniane publicznie z różnych źródeł).

Wydajność pracy deweloperów aplikacji wynika natomiast z wykorzystania generycznych interfejsów oraz API, bez konieczności tworzenia nowych mechanizmów za każdym razem, gdy zajdzie potrzeba dodania nowych danych do systemu. Z tego względu, aplikacje ontologiczne, które powstały na bazie poprawnie zaprojektowanych frameworków semantycznych działają również na prostych konstrukcjach zbiorów danych, typów i instancji. Wynikające stąd uogólnienie pozwala programistom skupić się na tworzeniu logicznych „pakietów”, agregujących funkcjonalność (mapowanie, podgląd, edycja, filtrowanie, etc.) zaprojektowaną do operowania na poziomie konstrukcji, a nie na poziomie danych atomowych.

Naturalne, połączone systemy wiedzy
Wszystkie wymienione wyżej czynniki łączą się, umożliwiając złożenie i powiązanie relacjami większej ilości rozproszonych danych. Realizuje to ideę ujmowania całych dziedzin wiedzy, które mogą być rozszerzane i przemieszczane do woli.

Dowolny rodzaj informacji, relacji między nimi oraz dowolny widok zdefiniowany na tej informacji może być ujęty i zamodelowany. Następnie, informacja ta może podlegać nadzorowi oraz być dowolnie manipulowana przez zbiór generycznych narzędzi. Stosunkowo nieskomplikowane i bezpośrednie konwertery są w stanie przenosić informację kanoniczną do innych formatów, używanych przez istniejące, zewnętrzne narzędzia. Podobnie, zewnętrzną informację zapisaną w różnych formach można łatwo przekonwertować do wewnętrznej, kanonicznej postaci.

Wymienione możliwości stoją w pewnej opozycji do stosowanych dotychczas technologii magazynowania informacji. Technologie semantyczne doskonale nadają się bowiem do ujmowania naturalnych połączeń systemów wiedzy oraz samej ich natury.

Podsumowanie
Trudno jest znaleźć w branży IT inne podejścia dostępne dla biznesu, które miałyby wszystkie wymienione zalety. Idea totalnej integracji informacji, zarówno publicznej jak i prywatnej z możliwością przyrostowych zmian obejmujących zbieranie, manipulację i łączenie danych, jest na prawdę fascynująca. Ale co najważniejsze, jest ona już dzisiaj dostępna. Dzięki techologiom semantycznym możemy zrobić więcej i zrobić to szybciej. Z mniejszym ryzykiem.

Jednakże, świadomość tego wśród klientów nie jest jeszcze zbyt szeroka. Brak tej świadomości wynika z kilku czynników; technologie semantyczne są stosunkowo nowe i ucieleśniają inną mentalność. Firmy dopiero zaczynają zdawać sobie sprawę z tkwiących w nich możliwości. Należy więc nie tylko nauczać je nowych koncepcji, ale także kwestionować stare praktyki oraz przesądy.

Źródło: http://www.mkbergman.com/974/making-the-argument-for-semantic-technologies/

84817

26 stycznia, 2012

Internet – kolektywna świadomość

- autor: tsissput

Psychologia tłumu w ujęciu sieci społecznościowych i narzędzi masowej i globalnej komunikacji

Różnorodność społeczności internetowych

Obecnie w internecie możemy spotkać całą masę różnego rodzaju portali społecznościowych, które łączą ludzi o podobnych zainteresowaniach, poglądach, orientacjach, czy po prostu położeniu geograficznym. Portale te najczęściej bazują na możliwości swobodnego wypowiadania się, pozyskiwania wiedzy, udostępniania jak i pobierania różnych materiałów multimedialnych jak zdjęcia, muzyka, czy filmy.
Portale społecznościowe takie jak nasza-klasa, Facebook, czy google+ pozwalają na odszukanie znajomych, dzielenie się z nimi różnymi zasobami, informowanie ich o swoich sukcesach, porażkach i życiu codziennym. Inne portale jak np. myspace nastawione są na poszukiwanie i nawiązywanie nowych znajomości z ludźmi z całego świata, z kolei np.:  portal grono.net oferuje zacieśnianie więzi między małą grupą ludzi o bardzo sprecyzowanych, wspólnych poglądach i pielęgnowanie wartościowej dla obu stron znajomości. Niektóre portale nastawione są na dzielenie się konkretnymi zasobami ze społecznością, np.: YouTube, fotka.pl, filesonic.com, flickr.com inne natomiast służą do wymiany plików o najróżniejszej treści, np.: chomikuj.pl, rapidshare.com. W celu dzielenia się różnymi informacjami a w szczególności rozwiązaniami technicznymi powstają fora internetowe o tematyce ogólnej i sprecyzowanej takie jak, np.: elektroda.pl. Inne portale łączą w sobie możliwości for dyskusyjnych i rozwiązań z zakresu portali społecznościowych, przykładem tu może być stackoverflow.com, który służy do publikowania problemów technicznych programistów, udostępniania rozwiązań tych problemów i oceny ich skuteczności – serwis ten jest bardzo pomocny przy programowaniu w niemal każdym języku. Dodatkowo użytkownicy najczęściej pomagający w rozwiązywaniu tych problemów dostają różnego rodzaju odznaki i tytuły, które niejako motywują do rozwiązywania cudzych problemów a zarazem świadczą o wiedzy i „jakości” pomocy danego użytkownika. Warto tutaj wspomnieć o jednym z najbardziej wartościowych portali w internecie jakim jest wikipedia, która gromadzi i systematyzuje w formie elektroniczej całą dostępną wiedzę ludzką z każdej możliwej kategorii i dziedziny nauki. Powstają też oczywiście o wiele mniej użyteczne portale, które nie mniej jednak przyciągają wielu ludzi chcących się odprężyć, pooglądać jakieś śmieszne filmy i zdjęcia. Przykładami „na topie” w Polsce są sadistic.pl, kwejk.pl, czy demotywatory.pl. Kolejna grupa portali zajmuje się dostarczaniem świeżych i ważnych informacji, lub tych najciekawszych. Najczęściej poszczególni użytkownicy portalu oceniają dane informacje powodując utworzenie naturalnego rankingu rzeczy ważnych, ciekawych i wartościowych. Przykładami tego typu portali są wykop.pl, reddit.com lub chociażby digg.com.

Tłum

Mianem tłumu określa się ludzi gromadzących się w skupiska w pewnym czasie w niezorganizowanej formie. Osoby te muszą przebywać w bliskości fizycznej i mieć wspólny obiekt zainteresowania.

Socjolog amerykański Herbert Blumer podzielił tłum na następujące kategorie:

 • Tłum przypadkowy – zbiór osób przypadkowych, nie posiadających wspólnego określonego celu.
 • Tłum konwencjonalny – jednostki zebrane w danym miejscu dążące do osiągnięcia wspólnego celu ale każda z osób osiąga go indywidualnie.
 • Tłum ekspresyjny – bazuje na ładunku emocjonalnym który jest cechą wspólną jednostek.
 • Tłum aktywny – cechuje się działalnością niszczycielską. Celem takiego tłumu jest rozładowanie emocji lub walka ze wspólnym przeciwnikiem.

Dodatkowo wyróżnia się tłum protestujący, który przejawia zachowania tłumu aktywnego i konwencjonalnego.

Psychologia tłumu

Bezpośrednio z powyższymi zjawiskami wiąże się dość mocno już oklepane przez współczesne środki masowego przekazu pojęcie psychologii tłumu.
Pierwsze prace na temat psychologii tłumu ukazały się w latach 90-tych XIX w.
Pojęcie psychologii tłumu zapoczątkował włoski prawnik Scipio Sighele w swojej pracy naukowej zatytułowanej „La folla delinquente” (w wolnym tłumaczeniu z j. wł. bandycki tłum), która ujżała światło dzienne w roku 1891.
Następnie w roku 1892  ukazała się kolejna publikacja francuskiego lekarza Henri Fournial pt.: „La psychologie des foules” (fr. psychologia tłumu).
W tym samym roku francuski sędzia i psycholog społeczny Gabriel Tarde napisał esej, który został opublikowany później w zbiorze „L’opinion et la foule” (fr. opinia i tłum).
Trzech powyższych autorów zainspirowało francuskiego lekarza i pisarza popularno naukowego Gustave Le Bon do napisania monogramu „La Psychologie des foules” w 1895r., który to stał się światowym bestsellerem i powszechnie cytowaną pracą naukową w tym zakresie.

Tłum a społeczności internetowe

Pytanie brzmi – czy społeczności internetowe możemy określić mianem „tłumu”?
Oczywiście, że nie. Wg. powyższej definicji z tłumem mamy do czynienia tylko w przypadku, gdy występuje bezpośredni kontakt fizyczny jednostek. Duże społeczności internetowe przejawiają jednak bardzo wiele wspólnych cech z tłumem w tradycyjnym tego słowa znaczeniu.
Internauci bardzo często przejawiają cechy konformistyczne. Zachowują się w taki sposób jak większość społeczności aby się nie wyróżniać, czy przypodobać większości. Dobrym przykładem jest aplikacja „Śledzik” wprowadzona do portalu nasza-klasa. Mial on pozwalać na śledzenie znajomych i ich upodobań oraz obecnych aktywności. Niestety aplikacja była dość uciążliwa w działaniu – spamowała użytkownika setkami niechcianych wiadomości, miała słabe ustawienia prywatności publikowanych aktywności, a przede wszystkim – nie było można jej w żaden sposób wyłączyć. Takie podejście administratorów i programistów do użytkowników portalu spotkało się ze szczerą niechęcią internautów, którzy zaczęli wymyślać przeróżne metody, które miały pomóc i wyłączyć „Śledzika”. Mimo iż nie każdy miał tak krytyczne nastawienie do tej aplikacji to po pewnym czasie „śledzikowa nienawiść” rozprzestrzeniła się wśród użytkowników portalu i już praktycznie nie było można trafić w internecie na jej zwolenników. Internauci stosowali różnego rodzaju prośby i petycje do administratorów naszej-klasy, co niestety spotkało się z zerowym odzewem ze strony „władz” portalu.
Internauci ze zaczęli więc walczyć ze śledzikiem wyimmaginowanymi sposobami, które to rzekomo miały go wyłączyć, czy usunąć z naszej-klasy. Mimo iż wiele z tych metod było totalnie absurdalnych to jednak były one powtarzane przez coraz większą liczbę osób urastając do rangi mitu, który „może jednak zadziała”. Ludzie wklejali na swoje profile różnego rodzaju łańcuszki, które to miały zapewnić wyłączenie niechcianej aplikacji. Następnie pojawiły się łańcuszki pisane rzekomo przez administrację, a nawet podpisywane konkretnie z imienia i nazwiska autorów naszej-klasy i administratorów. Oczywiście, żaden administrator nie miał z tym nic wspólnego – to użytkownicy dokonywali takich wpisów. Pojawiły się nawet rozwiązania pseudo-techniczne typu „Wklej ten tekst i wciśnij ALT przez 5 sek a śledzik zniknie”. Mimo, że absurdalne, rozwiązania te były powtarzane przez wielu internautów masowo. Jednym z ciekawszych był tekst dla ludzi mniej obeznanych z internetem: „Wklej na swój profil anstępujący kod a śledzik zostanie wyłączony: J3273M-D38113M Administracja NK.” Kod ten to oczywiście nic innego jak tekst „JESTEM-DEBILEM”, gdzie poszczególne litery zastąpione są cyframi podobnymi do nich graficznie.
Przykłady te pokazują, że w społecznościach internetowych ludzie podobnie jak w rzeczywistości stają się konformistami, podążającymi za tłumem, bez znaczenia, czy dane zachowanie jest logiczne i sensowne, czy nie.

Od społeczności internetowych do wymiaru fizycznego

Innym przykładem konformizmu są ostatnie wydarzenia w sprawie umowy o obrocie towarami podrobionymi (ACTA – ang. Anti-Counterfeiting Trade Agreement). Bardzo wielu internautów przyłączyło się do walki o wolność słowa i internetu zapewne w ogóle nie czytając powyższej umowy. Nie ma znaczenia czy ACTA jest tak naprawdę dobra, czy zła – „najważniejsze, że wszyscy twierdzą, że to ograniczy moje prawa”. Co więcej manifestacje przyjęły również wymiar materialny w postaci organizowanych pikiet i strajków, gdzie społeczności internetowe zaczęły gromadzić się w rzeczywiste tłumy na ulicach miast. Internauci głównie za pomocą portalu Facebook zorganizowali się by walczyć ze wspólnym wrogiem – w tym przypadku rządem oraz umową ACTA. Jest to typowy przejaw tłumu zorganizowanego i konwencjonalnego (czyli tłum strajkujący).

Nie jest to przypadek odosobniony, gdy portale społecznościowe gromadzą ludzi w wymiarze fizycznym. Najgłośniejszym przykładem w ostatnich czasach było zorganizowanie rewolucji przez mieszkańców Egiptu na portalu Facebook. Tego typu działalności można przyporządkować do tzw. smart mob (ang. bystry tłum). W tym przypadku ludzie inicjują i dzielą się w penwym sensie namiastką globalnej świadomości za pomocą dostępnych technologii telekomunikacyjnych (sms, portale społecznościowe, telefony itd) dążąc do wspólnego celu.
Bardzo często internauci wykorzystują sami możliwość zainicjowania różnych wydarzeń i spotkań za pomocą wszechobecnych portali społecznościowych w celu rozrywkowym. Jednym z najpopularniejszych form organizowania się ludzi w celu zapewnienia sobie rozrywki za pośrednictwem internetu jest tzw. flash mob (ang. szybki tłum). Zabawa polega na

skrzyknięciu się jak największej ilości osób zupełnie się nie znających w jedno miejsce fizyczne (w tzw. „realu”) i zachowywanie się w identyczny, z góry określony sposób. Przykładem może być podążanie za jednym upatrzonym osobnikiem setek pozornie przypadkowych osób. Osoba z początku jest całkowicie sama na ulicy, gdy nagle z różnych zakątków zaczynają wychodzić setki osób naśladujących ruchy i zachowania swojej ofiary. Innym przykładem jest tzw. pillow-fight (czyli wojna na poduszki), zombie walk (ludzie idąc ulicą udają

zombie), czy free-hugs (darmowe przytulanie przechodniów :D)

Analiza zachowań w sieci

Z analizy zachowań społeczności internetowych skrzętnie korzystają różne firmy, które dostrzegają tempo oraz kierunek zmian w internecie. Nie są już nowością kampanie marketingowe, które opierają się na „zarażaniu” swoją treścią internautów, jest to tzw. marketing wirusowy lub bardziej znane określenie „viral” z ang. viral marketing. Marketing wirusowy polega na tym aby zrobić ciekawą lub kontrowersyjną reklamę, którą użytkownicy sieci będą sami sobie przesyłali w formie ciekawostki. Bardzo często wykorzystuje się też bardzo popularne memy, które funkcjonują i są obecnie popularne w internecie. Koszt takiej kampanii marketingowej jest dużo niższy od tradycyjnej a i efekty są zazwyczaj o wiele korzystniejsze. Znajomi sami przesyłają sobie reklamę, często oglądając ją po kilka, czy kilkanaście razy nie czując przy tym znurzenia ani zniechęcenia do produktu. Bardzo wiele kampanii wirusowych można znaleźć na portalu najbardziej.com pod adresem http://najbardziej.com/kreatywne/najlepsze-kampanie-wirusowe/

Podsumowanie

Wydaje się, że mimo iż portale społecznościowe organizują ludzi w duże skupiska, co symuluje zachowania tłumu, a czasem i nawet materializuje ten tłum w formie protestu lub zwykłej zabawy, jest to pozytywna zmiana w kulturze i dorobku ludzkości, nawet biorąc pod uwagę to, że tłumy same w sobie mogą być niebezpieczne i skrajnie nieprzewidywalne (oraz przejawiać nielogiczne zachowania). Swobodny dostęp do informacji w internecie niejako utrudnia manipulowanie masami ludzkimi w sposób bezpośredni. To internauci określają, czy dany film jest ciekawy, czy nie, czy jakiś mem się przyjmie, czy zostanie tylko zaaprobowany przez garstkę ludzi. Dzięki portalom społecznościowym rozwija się także bardzo szybko świadomość społeczna, co z kolei prowadzi do coraz nowszych i ciekawszych rozwiązań w zakresie tych technologii. Tłum i społeczności internetowe przejawiają wiele wspólnych cech ale i pod wieloma względami się różnią. Warto więc analizować społeczności internetowe pod kątem ich zachowań nie tylko jako pojedynczych użytkowników ale jako społeczności w ogóle.

Bartosz Wieczerzak [79315]

26 stycznia, 2012

Wojna w mikroświecie

- autor: tsissput

Internet cały czas rośnie. Nie tylko dochodzą nowe strony ale istniejące mają coraz więcej treści. Oczywistym stał się fakt, że jeśli komputery nie pomogą nam przefiltrować tego ogromu słów, nic wartościowego nie znajdziemy w relatywnie krótkim czasie. Jeszcze kilka lat temu poważnym problemem był fakt, że maszyny nie rozumiały znaczenia tego całego zlepku literek. Wtedy powstał boom na Semantic Web i powstały technologie dające możliwość programom na rozumienie treści witryn internetowych.

Sztandarowym przykładem może tu być internetowa odmiana RDF, czyli RDFa. Istniejąca już od 2004 roku. Problem polega na tym, że dla zwykłych web developerów jest to zbyt skomplikowana technologia.

<p xmlns:dc="http://purl.org/dc/elements/1.1/"
  about="http://www.example.com/books/wikinomics">
 In his latest book
 <cite property="dc:title">Wikinomics</cite>,
 <span property="dc:creator">Don Tapscott</span>
 explains deep changes in technology,
 demographics and business.
 The book is due to be published in
 <span property="dc:date" content="2006-10-01">October 2006</span>.
</p>

Przeładowanie informacji potrzebnych do opisu wartości sprawiło, że programiści zapragnęli  prostszego rozwiązania. Znaleźli je w postci mikroformatów. Nie będę się o nich rozpisywał bo temat ten został już poruszony na tym blogu tutaj. Nie da się ukryć, że są one niezwykle proste i nie wymagają tworzenia żadnych dodatkowych atrybutów HTML’owych. Ten ich niewątpliwy plus staje się również ich wadą. Co prawda specyfikacja HTML 4.1 odnoście atrybutu class mówi, że może on zostać wykorzystany dla ogólnych potrzeb przetwarzania jednak w powszechnym użyciu funkcjonuje jako selektor arkuszy stylów. Nakłada to większą ostrożność dla projektantów storn i osób odpowiedzialnych za pisanie CSS’ów. Jest to również problem dla parserów, które muszą się domyślić czy dana wartość jest selektorem czy mikroformatem.

Warto się przyjrzeć co w takiej sytuacji zrobili najbardziej zainteresowani a zarazem najwięksi gracze na rynku. Google, Bing i Yahoo!, czyli firmy które czerpią największe zyski z wiedzy o tym co jest czym w sieci. Żeby zapewnić jeszcze lepsze wyniki wyszukiwania, ale również żeby je lepiej opisać wybrali mikrodane. Właśnie o tą technologię Google oparło swoje Rich snippets. Dodatkowo uruchomiono stronę Schema.org, która zawiera kolekcje schematów, gotowych do użycia.

Mikrodane definiowane są poprzez atrybuty HTMLa (szerszy opis i przykłady tu)

 • itemscope – definiuje grupę  par nazwa-wartość, nazywaną item
 • itemprop – dodaje właściwość do item’a (nazwa może być tekstem lub url’em, wartością jest zawartość elementu)
 • itemref – item może zawierać niedziedziczone właściwości poprzez referencje do nich
 • itemtype – definiuje typ item’u  jeśli jest użyte w tym samym elemencie co itemscope
 • itemid – pozwala słownikowi zdefiniować globalny identyfikator dla item’u

Mikrodane są częścią specyrikacji HTML5, rozdział im poświęcony znajduje się tutaj. Dodatkowym plusem, przemawiającym za mikrodanymi jest specyfikacja microdata DOM API. Pozawala ona na używanie skryptów do manipulowania mikrodanymi, udostępnianie ich innym aplikacjią, itp. Możliwości są ograniczone jedynie przez potrzeby twórców aplikacji internetowych. Niestety jedyną przeglądarką, która implementuje microdata DOM API jest Opera. Na szczęście na podstawie specyfikacji powstały już co najmniej dwie biblioteki JavaScript’owe MicrodataJS oraz Microdata-JS. Dodatkowo istnieje też projekt Live Microdata, który pozwala obserwować jak nasz kod HTML wygląda oraz podejrzeć zawarte w nim mikrodane w postaci JSONa.

Jedną z wad mikrodanych jest niemożliwość używania wielu typów jeśli nie pochodzą one z tego samego słownika (mowa o tym tutaj). Można jednak osiągnąć taki efekt w nietrywialny sposób, jak zaprezentowano to tu. W trakcie powstawania jest specyfikacja rozszerzająca która ma dać możliwość łączenia słowników, która nie zmienia składni mikrodanych.

Na blogu Jeni Tennison można znaleźć dużo informacji na temat mikrodanych, jak również i RDFa. Ciekawą serię stanowią artykuły o mapowaniu mikrodanych do RDFa i RDFa do mikrodanych.

<section itemscope itemtype=”http://schema.org/Person”&gt;
<span itemprop=”name”>Dawid Jankowiak</span>
<section itemprop=”affiliation” itemscope itemtype=”http://schema.org/Organization”&gt;
<span itemprop=”name”>Politechnika Poznańska</span>
</section>
<span itemscope>
<time itemprop=”date” datetime=”2012-01-26″>26 stycznia 2012</time>
</span>
</section>

Dawid Jankowiak

Politechnika Poznańska

26 stycznia 2012

26 stycznia, 2012

Co to jest The Open Graph Protocol?

- autor: tsissput


Protokół Open Graph został zaprezentowany po raz pierwszy w 2010 roku przez swojego twórcę – firmę Facebook. Jego głównym zadaniem jest zaprezentowanie strony internetowej w taki sposób, aby stała się ona obiektem w społecznym grafie. Co to oznacza? Mianowicie pozwala on, aby nasza strona internetowa posiadała takie same funkcjonalności, jak każdy obiekt na Facebooku. Idea tego przedsięwzięcia wywodzi się z Semantic Web – projektu, który ma wprowadzić ustandaryzowanie sposobu opisu i prezentacji danych w sieci Internet, aby możliwe było odczytanie informacji nie tylko przez ludzi, ale i przez maszyny. Zaletą tego protokołu jest łatwa implementacja. Metody implementacji protokołu zostały zaprezentowane poniżej.

Aby nasza strona mogła stać się obiektem społecznego grafu, należy dodać do niej podstawowe metadane. W protokole Open Graph używa się RDF, co oznacza, że powinniśmy umieścić dodatkowe znaczniki <meta> w sekcji <head> naszej strony. Oprócz odpowiedniego otagowania znacznikami, nasza strona musi posiadać cztery własności:
og:title – tytuł, pod którym obiekt powinien pojawić się w grafie, np. „Protokół Open Graph”.
og:type – typ naszego obiektu, np. „article”.
og:image – adres URL zdjęcia, obrazka, który będzie reprezentować nasz obiekt w grafie
og:url – kanoniczny adres URL naszego obiektu ,który będzie wykorzystywany jako identyfikator w grafie, np. „http://opengraph.net/artykul/co-to-jest-open-graph&#8221;.

Przykład strony z kodem protokołu Open Graph:

<html xmlns:og="http://opengraphprotocol.org/schema/">
<head>
<title>Opis protokołu Open Graph ( The Open Graph Protocol )</title>
<meta property="og:title" content="Opis protokołu Open Graph"/>
<meta property="og:type" content="article"/>
<meta property="og:url" content="http://opengraph.net/artykul/co-to-jest-open-graph "/>
<meta property="og:image" content="http://opengraph.net/opengraph_res/open-graph.png"/>
...
</head>
...
</html>

Oprócz wyżej wymienionych własności, można opcjonalnie dla każdego obiektu grafu społecznego wykorzystać te wymienione poniżej:
og:description – opis naszego obiektu
og:site_name – jeśli nasz obiekt jest częścią większej strony internetowej to należy podać nazwę, która będzie wyświetlana dla całej tej strony np. „opengraph.net”.

Przykład zastosowania og:description i og:site_name:

<meta property="og:type" content="article" />
<meta property="og:description" content=”Open Graph umieszcza ludzi w centrum sieci. Oznacza to, że bla bla bla"/>
<meta property="og:site_name" content="opengraph.net"/>

Ponadto, w protokole Open Graph można określić lokalizację naszego obiektu. Taka opcja jest przydatna, kiedy nasz obiekt ma związek z naszą firmą lub czymś innym w realnym świecie. Położenie może być określone poprzez podanie długości i szerokości geograficznej lub pełnego adresu.

Aby określić współrzędne geograficzne, należy wykorzystać następujące własności:

og:latitude – np. „46.435232”.
og:longitude – np. „-134.234078”.

Natomiast aby podać adres, który jest łatwiejszy do zinterpretowania przez człowieka, powinniśmy użyć tych własności:

og:street-address - np. "Torowa 15"
og:locality - np. "Grudziadz"
og:region - np. "PZ"
og:postal-code np. "34-046"
og:country-name - np. "Polska"

Oczywiście nic nie stoi na przeszkodzie, aby określić lokalizację obiektu na oba wymienione sposoby.
Wprowadzenie informacji kontaktowych dla naszego obiektu jest realizowane poprzez umieszczenie jednej z poniższych własności:

og:email - np. "me@example.com".
og:phone_number - np. "+1-650-123-4567".
og:fax_number - np. "+1-415-123-4567".

Aby nasz obiekt był reprezentowany w grafie, musimy określić jego typ. Służy do tego własność og:type:
<meta property=”og:type” content=”product” />
Podstawowy schemat zawiera następujące typy:

• Aktywności: activity, sport
• Biznes (firmy): bar, company, cafe, hotel, restaurant
• Grupy: cause, sports_league, sports_team
• Organizacje: band, government, non_profit, school, university
• Ludzie: actor, athlete, author, director, musician, politician, public_figure
• Miejsca: city, country, landmark, state_province
• Produkty i rozrywka: album, book, drink, food, game, movie, product, song, tv_show
• Produkty posiadające kod/numer UPC lub numer ISBN możesz dodatkowo określić używając własności og:upc lub og:isbn.

Możliwe, że poszczególne sieci społecznościowe zdecydują się wspierać jedynie pewną grupę tych typów albo stworzą własne dodatkowe typy bazujące na ich niszach.
Poprawność wprowadzenia metadanych można sprawdzić za pomocą parsera:
http://www.opengraph.in/

Źródła:
[1] http://developers.facebook.com/docs/opengraph/
[2] http://en.wikipedia.org/wiki/Facebook_Platform#Open_Graph_protocol
[3] http://ogp.me/
[4] http://www.opengraph.in/?url=&format=html

103890

26 stycznia, 2012

Społeczności motoryzacjyjne

- autor: tsissput

W ciągu ostatnich 25 lat można zaobserwować w naszym kraju całkowitą przemianę rynku motoryzacyjnego. Z szarej, ponurej rzeczywistości (kilka wciąż powtarzających się socjalistycznych modeli) krajobraz na ulicach przerodził się w pełną różnorodność marek i modeli. Kolejni producenci stopniowo zaczęli zakładać swoje przedstawicielstwa w Polsce. Następnie zaczęły powstawać sieci dealerskie (aktualnie w Polsce działa 404 dealerów sprzedających auta 46 marek).

Auta w salonach były jednak drogie i nie mało kogo było na nie stać. Prawdziwa przemiana rozpoczęła się kiedy ruszył masowy import aut używanych z zachodu. Zajęli się tym głównie drobni handlarze którzy zalali rynek wszelkimi dostępnymi za nasza zachodnią granicą (głównie w Niemczech) pojazdami. Od początku lat 90 ubiegłego wieku, bo wtedy zaczęła się wspomniana fala, możemy mówić o całkowitym renesansie na Polskich drogach. Aut zaczęło przybywać w niespotykanym wcześniej tempie. Stopniowo coraz większe grupy społeczeństwa zaczęło być stać na własny pojazd. Siłą rzeczy rynek zaczął się również mocno różnicować. Kupujący nie musiał już wybierać miedzy Polonezem a Fiatem 125p (ewentualnie Zastava), gama marek i modeli powiększała się bardzo szybko. Wraz z autami popularnymi i szeroko spotykanymi zaczęły pojawiać się także auta mniej typowe i kultowe. Wokół obu tych grup pojazdów zaczęły tworzyć się grupy pasjonatów lub po prostu użytkowników i właścicieli którzy pokochali swoje cztery kółka.

Na początku takie kluby, grupy znajomych miały charakter zupełnie nieoficjalny. Ludzie po prostu spotykali się, dyskutowali, podziwiali swoje pojazdy, wymieniali się doświadczeniami, poradami. Często spotkania takie odbywały się na pustych parkingach, placach, opuszczonych torach wyścigowych. Dla przykładu w Poznaniu głównym takim miejscem był teren przylegający do starego już stadionu Lecha Poznań przy ulicy Bułgarskiej. W ciągu sezonu praktycznie przez cały weekend można było zobaczyć tam grupy ludzi zebranych wokół aut konkretnej marki, modelu lub typu.

Zmiana charakteru takich klubów nastąpiła wraz z rewolucją internetową. W naturalny sposób przeniosły się one do sieci. Nie były już potrzebne skomplikowane struktury aby taka organizacja mogła funkcjonować. Wystarczy prosta strona internetowa i w następnym kroku forum dyskusyjne. W ten sposób nawet bariera geograficzna przestała mieć znaczenie, teraz miłośnik forda Capri z Krakowa mógł znaleźć innego właściciela tego rzadkiego i kultowego już pojazdu ze Szczecina i wymienić się z nim swoimi doświadczeniami i opiniami. Kolejne organizacje i stowarzyszenia zaczęły wyrastać jak grzyby po deszczu. Początkowo były to główne grupy złożone z użytkowników aut konkretnej marki bądź bardzo charakterystycznego modelu. Z biegiem czasu społeczności pojawiało się coraz więcej i obecnie praktycznie każda marka i prawie każdy model znanej w Polsce marki ma swój klub i forum.

Wszystkie takie organizacje czerpią jednak z doświadczeń związków i klubów które działały długo przed 1989r. Najbardziej znany związek to:

 • Polski Związek Motorowyhttp://www.pzm.pl/ – powstał w 1950 roku z połączenia Automobilklubu Polski (założonego w 1909r.) oraz Polskiego Związku Motocyklowego (założonego w 1924r.). Zgodnie ze statutem związek zajmuje się propagowaniem wiedzy i kultury motoryzacyjnej, prowadzi działania na rzecz bezpieczeństwa ruchu drogowego, promuje turystykę motorową i caravaningową, a także zajmuje się pojazdami zabytkowymi. Jednym z głównych dziedzin działalności jest organizowanie kursów prawa jazdy oraz świadczenie usług rzeczoznawstwa. W PZM można także nabyć winiety za korzystanie z płatnych odcinków zagranicznych autostrad. Od 1999 roku działa także towarzystwo ubezpieczeniowe PZM TU S.A. Vienna Insurance Group. Ubezpieczenie to jest dostępne dla członków Związku z pokaźnymi rabatami ale każdy może ubezpieczyć swój pojazd w tym towarzystwie. Przed 1989 PZM był główną organizacją zrzeszającą pasjonatów motoryzacji w każdej jej poddziedzinie.

Innym dobrym przykładem społeczności motoryzacyjnej z czasów poprzedniego ustroju (i nawet wcześniej) jest:

 

 • Automobilklub Wielkopolskihttp://www.aw.poznan.pl/ – powstał w 1923 roku jako Wielkopolski Klub Automobilistów i Motocyklistów w Poznaniu. Od 1924 rok nosi obecną nazwę. Obecnie zajmuje się popularyzacją rozwoju wszelkiego sportu motorowego oraz turystyki. Propaguje również bezpieczeństwo w ruchu drogowym (m. In. Organizacja szkoleń dla ratowników drogowych, akcje edukacyjne). Klub prowadzi kursy nauki oraz doskonalenia umiejętności jazdy. Zarządza również Torem Poznań – najlepszym obiektem wyścigowym w Polsce, spełniającym europejskie standardy. Na jego terenie organizowane są liczne imprezy i wydarzenia sportowe i kulturalne. W pobliżu toru klub organizuje również giełdę samochodową oraz kiermasz części używanych. Oba te miejsca jeszcze kilka lat temu spełniały rolę głównej platformy handlu autami oraz podzespołami do nich. Aktualnie nie mają już takiego znaczenia wobec popularności serwisów ogłoszeniowych i aukcyjnych (allegro, otomoto, moto.gratka, tablica.pl).  Obecnie klub zrzesza kilkuset aktywnych członków oraz zatrudnia blisko 100 osób.

Aktualnie można stwierdzić bez zbytniej przesady, że w polskim Internecie znajdziemy społeczność, forum dotyczące każdej marki istniejącej na naszym rynku. W wielu przypadkach będą to kluby zbierające miłośników konkretnego modelu lub nawet generacji danego modelu. Poniżej przykład japońskiej marki Honda, która na dobre zagościła na naszych drogach:

 • HondaTeamPoznanhttp://www.htp.info.pl, forum: http://htp.info.pl/index.phpklub miłośników Hond z Poznania i okolic. Działa od 2006 roku. Obecnie 1449 zarejestrowanych użytkowników (około 200 aktywnie działających). W każdy piątek wieczorem organizowane jest spotkanie klubowiczów połączone z PPM – powolnym przejazdem miastem. Forum pełni rolę wspomagającą organizację spotkań, można tu również zasięgnąć porady technicznej, w dziale giełda sprzedać bądź kupić samochód, części bądź inne przedmioty związane z marką.
 • Stowarzyszenie CivicKlubPolskahttp://www.civicklub.pl/, forum: http://www.civicklub.pl/fi/__vbb/ – Oficjalnie zarejestrowane stowarzyszenie miłośników Hondy Civic z wszelkich generacji i odmian. Można śmiało stwierdzić że jeżeli mamy problem z naszym Cviciem (nie istotne czy wyprodukowanym w 1989 czy 2011 roku) powinniśmy zajrzeć na to forum. Corocznie organizowane są zloty ogólnopolskie stowarzyszenia. Stowarzyszenie liczy 83 członków, na forum zarejestrowanych jest już 19 tysięcy użytkowników.
 • HondaAccordKlubPolska  – http://www.accordklubpolska.pl/ – klub zrzeszający użytkowników Hondy Accord, również z wszystkich kolejnych generacji odmian. Działa od 2008 roku. Obecnie 7673 użytkowników forum.  Można znaleźć tu wszystkie potrzebne informacje dotyczące wszystkich generacji Hondy Accord. W związku z powstaniem grup lokalnych możemy także wybrać się na klubowe spotkanie w naszym mieście.
 • Honda Accord 6gen – http://accord6gen.cba.pl/ – strona I forum  dotyczące tylko I wyłącznie Hondy Accord 6 generacji (europejskie wydanie).  Jeżeli potrzebujemy dokładniejszych informacji dotyczących konkretnie tej wersji auta, to odpowiednie miejsce. Znajdziemy tu wszystko od danych technicznych po książkę serwisową.

Dla przykładu można podać także kilka innych klubów zrzeszających miłośników innych marek:

 • VwZonehttp://www.vwzone.pl/, forum:  http://forum.vwzone.pl/ – kopalnia wiedzy o autach marki Volkswagen. Można śmiało stwierdzić że znajdziemy tam każdą szukaną informację który dotyczy aut tego producenta.

 

 

Zamieszone powyżej kluby i stowarzyszenie to tylko przykłady. Jeżeli chcemy znaleźć taki który zajmuje się autem które posiadamy lub dopiero chcemy kupić wystarczy wpisać w wyszukiwarkę: markę, model i słowo klub lub forum. Bardzo prawdopodobnym jest, ze taka organizacja już w sieci istnieje.

Źródła

 1. http://www.pzm.pl/O_nas
 2. http://www.aw.poznan.pl/o_nas/index.html
 3. http://htp.info.pl/
 4. http://www.civicklub.pl/
 5. http://www.accordklubpolska.pl/
 6. http://accord6gen.cba.pl/
 7. http://www.vwzone.pl/
 8. http://forum.mitsumaniaki.pl/index.php
 9. http://www.celica-club.org.pl/portal.php

79130

26 stycznia, 2012

Semantic Tag

- autor: tsissput

Czym jest Web 2.0 ? 

Określenie Web 2.0 odnosi się do wszystkich serwisów internetowych które zostały utworzone po 2001, w którym najważniejszą rolę odgrywają terści generowane przez urzytkowników danego serwisu. Dlatego też w takich serwisach internetowych wykorzystuje się tagowanie, ponieważ przy tak ogromnej ilości generowanych materiałów przez użytkowników występuje duże prawdopodobieństwo przeoczenia ważnych danych dlatego też wykorzystujemy tagi które służy do prostego opisania obiektu dzięki czemu możemy w bardzo prosty sposób sortować materiały według nazw , kategorii itd.

Czym są tagi ?

Tagi są wspaniałym narzędziem pozwalają na opisywanie dodawanych treści do sieci / internetu. Najlepszymi przykładami sukcesu tagów są strony takie jak Flicker.com, Del.icio.us i Technorati.com które z powodzeniem wdrożyły tagi do pomocy wyszukiwania użytkowników, którzy dodali jakieś materiały.

Tagi, które znajdują się na portalach takich jak Flicker.com , Del.icio.us i Technorati.com są tyko słowami. Dla przykładu Tag „ paris „ ma różne znaczenia i może oznaczać „ paris „ jako stolicę Francji, ale też „ paris ” jako opuszczoną osadę na wyspie Kiritimati ( która znajduję się w pobliżu Poland i Banana ) . Dlatego podczas wyszukiwania materiałów na temat stolicy Francji dostaniemy w odpowiedzi zarówno materiały uwzględniające stolicę Francji jak i opuszczoną wioskę na wyspie Kiritimati. Dlatego jednym z wyjść, aby zawęzić wyniki do szukanej stolicy było by gdyby ludzie podczas dodawania materiałów odnoszących się do miasta Paryż dodawali dodatkowo Tag „ city „ . Niestety takie rozwiązanie jest niedoskonałe i może się nie sprawdzić, ponieważ niektórzy zamiast „ city „ mogą wpisywać „ place „ .

Jak nadać ‘ sens ’ Tagowi ?

Jeżeli tag ma odnosić się do stolicy Francji najlepiej zapisać go w następującej postaci „ city : paris „ wtedy będzie znacząco różnił się od tagu „ celebrity : paris  którym opisalibyśmy osobę Paris Hilton. W ten oto sposób podczas wyszukiwania „ celebrity : paris „ dostaniemy materiały odnoszące Się do osoby Paris Hilton a wyszukując „ city : paris „ otrzymalibyśmy wszystkie dane dotyczące miasta Paryż. Oczywiście takie rozwiązanie nie jest perfekcyjne, ponieważ może się okazać, że jest więcej miast Paryż oraz więcej gwiazd, które posiadają w  nazwie Paris, ale i tak dość znacząco skróciłoby to listę wyników w porównaniu do samego „ paris „.

Jak wyszukiwać ‘ sensowne ’ Tagi ?

Zapytanie takie jak „ celebrity : * „ jest również poprawne dzięki niemu wyszukiwarka zwórci na wszystkie gwiazdy również poprawnym będzie wpisanie „ city : * „ które jak można się domyślić odpowiada wyszukaj wszystkie miasta. Natomiast zapytanie „ celebrity : * „ ∩ „ city : paris „ znajdzie wszystkie gwiazdy znajdujące się w mieście Paryż. Zapytanie „ * : paris „ zwróci nam wszystkie obiekty, które zostały oznaczone słowem „ paris „ zapytanie to jest realizowane tak naprawdę jak zwykły tag, który nie posiada żadnego sensu.

W omawianych wyżej przykładach zostały użyte, tagi reprezentowane „ znaczenie : wartość  „ ale oczywiście nie jest obowiązkiem reprezentować w taki sposób tagów mogę one być reprezentowane na przykład w odwróconej kolejności. Ponieważ reprezentacja tagi może zależeć od tego, w jaki sposób tagi są implementowane.

Jak by to było w XML-u ?

Taki zapis tagów, jaki jest omawiany w artykule może być reprezentowany również w postaci XML ( Extensible Markup Language  ) na przykład :

< tag:celebrity > paris </ tag:celebrity > and < tag:city > paris </ tag:city >

Tagi hierarchiczne oraz jak się je buduje  ?

W ciągłym doskonaleniu tagów przeszliśmy od tagów niemających żadnego sensu ( same słowa ) do tagów, dzięki którym możemy reprezentować jakieś znaczenie i nazwę. Było to swoiste wprowadzenie do hierarchii systemu ‘sensownych’ tagów.  Dla przykładu celebry ta jest osobą taką jak np. Paris Hilton, dlatego też może ona zostać oznaczona dwoma tagami „ celebrity : paris „ i „ person : paris „ chyba, że system jest ‘inteligentny’ i może się sam domyślić, że osoba sławna pasuje do hierarchii znaczeń, co pozwoli na wyszukiwanie osoby i pobranie „ Paris Hilton „.

Obecnie podczas budowania ‘sensownego’ tagu opieraliśmy się na wzorze  „ znaczenie: wartość ” , dana reprezentacja może zostać rozszerzona i wyglądać następująco :

 • Dla Paris Hilton „ person.celebrity:paris
 • Dla Miasta Paryż „ location.city:paris

Przykładowe zapytania dla hierarchicznych tagów mogą wyglądać następująco :

 • Każda osoba „ person.*:* „
 • Każda osoba, która ma w nazwie Paris „ person.*:paris „
 • Każda osoba sławna „ person.celebrity:* „
 • Paris Hilton w Paryżu „ person.celebrity:paris „ ∩ „ location.city:paris „

Problemy podczas wdrażania tagów:

 • Tag Raw input – bardzo łatwy do wdrożenia natomiast jest bardzo trudny w obsłudze. Użytkownik musi poprawnie wprowadzić całe znaczenie na przykład „ person.celebrity:paris „. Błędy ortograficzne stwarzają bardzo dużo problemów.
 • Guided input (prosta wersja ) – Jest możliwość za pomocą rozwijanej listy ( drop down ) tagów wybrać wartości interesujące wraz z polami do wprowadzenia tekstu na przykład ( HTML ) < option value=” person.celebrity ” > Paris Hilton </ option >  
 • Guided input (prosta pełna ) – Trudniejsza do zaimplementowania oraz bardziej restrykcyjna jednak o wiele przyjaźniejsza użytkownikowi końcowemu. Interfejs będzie składać się z komponentów, które będą zawierały wszystkie tagi, czyli pole dla miasta , osób itp.

Gdzie przechowywujemy tagi?

Do przechowywania tagów korzystamy z baz danych relacyjnych.

Wyszukiwanie tagów

Niestety te same problemy, co w tagach wejściowych możemy znaleźć tutaj. Wyszukiwanie powinno zostać wykonane na raw tagach.

Na stronie www nie mogą być tylko przechowywane zdjęcia, filmy lub jedynie artykuły, ale musi być to kompilacja wielu różnych źródeł, które będą musiały zostać wyszukane i otagowane. Najprostszą propozycją do wyszukania różnych źródeł o tej samem tematyce jest stosowanie na początku tagu nazwy źródła:

 • Wszystkie pliki wideo z Paris Hilton – „ video:person.celebrity:paris „
 • Wszystkie zdjęcia z Paryża – „ image:location.city:paris „
 • Wszystkie zasoby o tematyce Paris – „ *:*:paris „

Wyszukiwanie tagów w liczbie pojedynczej i mnogiej ( celebrites / celebrity )

W przypadku wyszukiwania określonego słowa w liczbie mnogiej również zostaną zwrócone wyniki określonego słowa w liczbie pojedynczej ? Jest to prawdopodobne ale zależy w dużej mierze od specyfikacji , na przykład wyszukiwarka może być ustawiona / zaprogramowana do zwracania jedynie wartości tagów które pasują idealnie. Gdyby jednak szukać ‘celebrites’ w zestawie wyników można spodziewać się obiektów które będą w sobie zawierać dane z udziałem gwiazd dlatego niektóre dane które zostaną zwrócone przez wyszukiwarkę powinny uwzględniać tagi związane również z ‘celebrity’.

Wyszukiwanie tagów w oparciu o synonimy

Wyszukiwanie synonimów  powinno być identyczne jak dla wyszukiwania tagów zawierających daną nazwę w liczbie mnogiej. Na przykład szukamy tagów kotami w odpowiedzi powinniśmy dostać tagi zawierające szukaną frazę oraz kot.

JT  103889

22 stycznia, 2012

Kontrola kosztów utrzymania pojazdu na przykładzie portali Spiritmonitor.de oraz Motostat.pl

- autor: tsissput

W dobie szalejących cen paliw oraz coraz to wyższych stawek obowiązkowego ubezpieczenia coraz bardziej popularna staje się tematyka kontroli kosztów utrzymania pojazdu. W sieci od kilku lat pojawiają się portale, które umożliwiają prowadzenia pełnej ewidencji zarówno wydatków dotyczących auta jak i również wszystkich wyjazdów i napraw.

Najbardziej popularnym portalem jest niemiecki Spritmonitor http://www.spritmonitor.de

Serwis ten istnieje od 2001 roku i dostępny jest w trzech językach: niemieckim, angielskim oraz francuskim. Aktualne zasoby portalu to: 315 172 pojazdów, 242 349 użytkowników, 4 431 964 995 zewidencjonowanych kilometrów oraz 345 238 245 l  paliw.

W 2008 roku pojawił się również polski odpowiednik, Motostat http://www.motostat.pl/.

Serwis ten został stworzony jako polska alternatywa dla niemieckiego oryginału. Pod wieloma względami nowy portal przegonił już swojego protoplastę. Obecnie serwis dostępny jest już w 9 językach: polskim, angielskim, niemieckim, szwedzkim, rosyjskim, francuskim, greckim,  portugalskim oraz ukraińskim.

Aktualne zasoby portalu to: 35 586 pojazdów, 28787 użytkowników, 285 336 473 zewidencjonowanych kilometrów oraz 20 835 022 l paliw.

Grono użytkowników obu portali bardzo szybko rośnie. Przyczynia się do tego między innymi szeroka promocja serwisów za pomocą specjalnie przygotowanych obrazków, sygnaturek z aktualnym spalaniem naszego pojazdu który możemy wygenerować i dodać do naszej strony, podpisu na forum.

Konto użytkownika i jego pojazdy

Dla celów przeglądania serwisu (udostępnionych przez użytkowników danych) nie ma potrzeby zakładania konta. Możemy przeszukiwać bazę portalu według różnych kryteriów tak aby znaleźć interesujący nas pojazd i sprawdzić jego koszty utrzymania.

Jeśli jednak chcemy zacząć prowadzić własną ewidencję wydatków związanych z naszym autem, będziemy musieli założyć profil. Po podaniu wymaganych informacji możemy zacząć dodawać pojazdy które będą powiązane z naszym kontem.

Aby zdefiniować nowy pojazd musimy podać jego dane:

 • Typ pojazdu,
 • Marka,
 • Model,
 • Oznaczenie modelu,
 • Rodzaj paliwa,
 • Skrzynia biegów,
 • Rok produkcji,
 • Moc silnik, jednostka mocy,
 • Rejestracja,
 • Jednostka komputera pokładowego.

Istnieje także możliwość skonfigurowania ustawień prywatności dla danego pojazdu (ukrycie niektórych informacji jak np. wydatki, koszty paliwa, przebieg, numer rejestracyjny).

Do danego pojazdu możemy także stworzyć galerię zdjęć. Najbardziej przydatnym grafiką będzie pierwsze zdjęcie używane jako miniaturka która będzie wyróżniać nasze auto spośród innych dostępnych w portalu.

Ewidencja pojazdu

Portal umożliwia ewidencję utrzymania pojazdów za pomocą dopisywania kolejnych zdarzeń takich jak:

1. Tankowanie – Podajemy takie informacje jak:

 • data,
 • miejsce,
 • marka stacji,
 • rodzaj paliwa,
 • ilość paliwa,
 • koszt tankowania lub cenę za litr,
 • przejechany dystans lub przebieg całkowity,
 • rodzaj tankowania,
 • założone opony,
 • styl jazdy,
 • rozkład tras (miasto/poza miastem/autostrada).

Możemy podać także informacje wyświetlane przez komputer pokładowy w naszym pojeździe tak aby zweryfikować ich wiarygodność.

Po zatwierdzeniu informacje zostają dodane bazy danych oraz uaktualnione zostają statystki dotyczące pojazdu.

Przykładowe wpisy dotyczące tankowań:

2. Naprawa lub inny wydatek / koszt (ubezpieczenie, płatne odcinki dróg, myjnie itd.) – podajemy informacje takie jak:

 • Data,
 • Przebieg
 • Rodzaj wydatku – wybór z:
  • Akcesoria,
  • Cena zakupu
  • Przegląd,
  • Opłata za przejazd odcinkiem drogi,
  • Myjnia,
  • Naprawa,
  • Wymian kół,
  • Wymiana oleju,
  • Ubezpieczenie.
  • Koszt
  • Dodatkowe informacje

Podobnie jak w przypadku tankowania, wpisane informacje zostają dodane do bazy danych. Po zatwierdzeniu statystki i analiza dotycząca naszego pojazdu zostaną zaktualizowane.

Statystyki

Oba omawiane portale umożliwiają tworzenie statystyk które można podzielić na dwie główne grupy:

 • Dotyczące konkretnego pojazdu – umożliwiają analizowanie jak zmieniało się zużycie paliwa oraz ceny paliw wraz z kolejnymi tankowaniami.

Sprawdzimy również jaki był nasz przebieg w poszczególnych miesiącach oraz jak odnosił się on do średniego przebiegu miesięcznego.

Możemy także wyświetlić analizę naszego spalania w odniesieniu do różnych czynników takich jak rodzaj opon, rodzaj dróg, styl jazd, rodzaj paliwa, stacje paliw.

 • Ogólne, dotyczące grupy użytkowników, pojazdów – umożliwiają przeglądanie i analizowanie globalnie zebranych danych. Możemy sprawdzić jaki pojazd jest najbardziej ekonomiczny, jakie stacje benzynowe są najbardziej popularne,  jak kształtują się ceny paliw w poszczególnych miejscowościach.

Analiza

Po wprowadzeniu odpowiedniej ilości wpisów istnieje możliwość wygenerowania analizy kosztów utrzymania pojazdu. Możemy sprawdzić ile kosztuje nas pojazd na miesiąc lub rok. Odpowiedni wykres uświadomi nam, jaką częścią wszystkich wydatków jest paliwo, lub jakie koszty są przeważające w naszym pojeździe. Ciekawą pozycją jest również podsumowanie wszystkich wydatków związanych z autem podzielone przez 100 km (najbardziej popularny wyznacznik realnych kosztów utrzymania).

Porównywanie

Portale umożliwiają porównanie statystyk naszego auta z innymi wybranymi według kryteriów takich jak: marka i model, rodzaj paliwa, silnik, rocznik, przebyty przebieg. Po wybraniu odpowiedniej opcji wyświetlane są konta aut o podobnych parametrach do naszych.

W przypadku obu omawianych portali, z uwagi na ogromną ilość pojazdów w bazie możemy łatwo znaleźć interesujący nas pojazd i sprawdzić realne spalania uzyskiwane przez użytkowników. Jest to świetna okazja do skonfrontowania danych katalogowych (podawanych zwykle przez producentów) z prawdziwymi, życiowymi danymi.

Znajomi / Ulubione

Portal umożliwia dodanie profili innych użytkowników jako znajomych. Można wtedy monitorować koszt utrzymania jakie ponoszą nasi ulubieni użytkownicy.  Dodatkową funkcjonalnością obu opisywanych portali jest także możliwość przesyłania wiadomości między znajomymi. Możemy zatem porozumieć się z innym użytkownikiem i np. dowiedzieć się gdzie udało mu się wymienić opony na zimowe w tak niskiej cenie.

Kluby, koła, stowarzyszenia

Serwis Motostat wyróżnia się dodatkowo możliwością zaakcentowania swojej przynależności do klubu, koła lub stowarzyszenia związanego z motoryzacją. W przypadku gdy dana organizacja jest już zarejestrowana na portalu, wystarczy dodać ją w swoim profilu. Jeśli naszego klubu nie ma w bazie, możemy zgłosić go wypełniając specjalny formularz. Po zweryfikowaniu podanych przez nas informacji  nowa pozycja zostanie dodana.

Funkcjonalność ta umożliwia porównywanie kosztów utrzymania wewnątrz naszej grupy użytkowników (np.  CivicKlubPolska, HondaTeamPoznan, FiestaKlubPolska, MazdaSpeed itp.).

Wymiana danych między portalami

Zarówno Spritmonitor jak i Motostat umożliwiają export i import danych dotyczących pojazdów z wykorzystaniem plików CSV. Plik wygenerowany (wyeksportowany) w jednym portalu może zostać bez przeszkód zaimportowany do drugiego. Format danych jest w pełni kompatybilny. Informacje umieszczone w pliku CSV możemy także wykorzystać w jednym z tradycyjnych (działających w trybie off-line) programów  do kontroli kosztów pojazdu dostępnych na rynku.

Aplikacja mobilna na system android

Ciekawą funkcjonalnością dodaną do portalu Motostat w zeszłym roku jest możliwość dodawania informacji dotyczących naszych pojazdów za pomocą bezpłatnej aplikacji dostępnej w serwisie Android Market. Możemy w ten sposób uaktualnić bazę danych od razu po tankowaniu lub wizycie u mechanika. Rozwiązanie takie jest często wygodniejsze i szybsze od tradycyjnego aktualizowania profilu przez przeglądarkę.

 

 

 

 

 

 

 

 

79130

22 stycznia, 2012

ACTA? – NIE!

- autor: tsissput

16 stycznia, 2012

- autor: tsissput

Sieć neuronów a sieci społecznościowe

czyli jak wielkość naszego mózgu wpływa na ilość znajomych w sieci?

Czy grono Twoich znajomych na Facebooku jest znacznie większe niż 150 osób? Jeśli tak, to prawdopodobnie wielu z tych osób tak naprawdę nie znasz i nie jesteś w stanie utrzymywać z nimi więzi, ponieważ Twój mózg (a właściwie jedna z jego struktur – kora nowa) jest za mały!

Kora nowa, to ewolucyjnie najmłodsza część kory mózgowej odpowiedzialna głównie za wyższe procesy poznawcze – takie jak język, świadome rozumowanie, wyobraźnię czasowo-przestrzenną oraz komendy motoryczne. W 1992 roku Robin Dunbar  – brytyjski antropolog i ewolucjonista – zauważył występującą u naczelnych zależność między względną wielkością kory nowej (względem wielkości całego mózgu) a licznością grup społecznych przez nie tworzonych [1]. Na podstawie danych dotyczących tych dwóch wielkości Dunbar zbudował model regresji dzięki któremu, znając wielkość kory nowej u ludzi, przewidział maksymalną wielkość grup tworzonych przez człowieka. Wielkość tę oszacował na 148+/-50. Jest ona powszechnie znana jako „Lizczba Dunbara” i przyjmuje się, że wynosi 150. W swoich następnych pracach Durban starał się zweryfikować trafność tej estymacji analizując dane historyczne dotyczące wielkości m.in. jednostek wojskowych, grup plemion wędrownych, wsi itp. Wyniki tej weryfikacji okazały się zgodne z wielkością estymowaną na podstawie wielkości kory nowej. Wnioski płynące z analizy wyników otrzymanych przez Dunbara są mniej więcej takie: wielkość grup tworzonych przez naczelne jest ograniczona przez zdolności poznawcze jednostek, te zaś są uwarunkowane przez względną wielkość części mózgu zwanej korą nową. Zarówno wielkość mózgu u ludzi jak i wyniki bezpośrednich badań wskazują, że zdolności poznawcze człowieka pozawalają na utrzymywanie relacji z ok. 150 osobnikami.

Liczba Dunbara jako szacunkowa wielkość mocno połączonego (w pewnej miary) fragmentu sieci społecznościowej danej osoby może może być wykorzystana przy tworzeniu portali społecznościowych –  może służyć jako a-priori przyjęty parametr wg którego dostosowują one swoje zachowanie – np. poprzez wyświetlanie na „ścianie” informacji o maksymalnie 150 najmocniej powiązanych z użytkownikiem znajomych. Z drugiej strony – portale społecznościowe są łatwo dostępnym i prostym w eksploracji sztucznym środowiskiem, w którym można dokonywać analiz weryfikujących różne hipotezy dotyczące ludzkich zachować.  Fakt ten wykorzystały dwa zespoły badawcze przeprowadzając badania na temat wielkości grup tworzących się w sieciach społecznościowych i odnosząc wyniki do rezultatów otrzymanych przez Dunbara.

Twitter i agenci

Grupa trzech naukowców z University of Indiana w USA przeprowadziła analizę ponad 380 wpisów na Twitterze [2]. Na ich podstawie stworzono graf modelującą zachowania ponad 1.7 miliona użytkowników. W grafie tym wierzchołki reprezentują użytkowników. Wierzchołki A jest połączony  łukiem o wadze k z wierzchołkiem B jeśli użytkownik A odpowiedział k razy na wpisy użytkownika B w oknie czasowym o pewnej długości. Badając zależność średniej wagi łuków wyjściowych od stopnia wyjściowego wierzchołka (czyli średniej liczby odpowiedzi na tweet jednej osoby od ilości osób, na których tweet odpowiedziano) okazało się, że ta pierwsza rośnie wraz z drugą, ale przestaje rosnąć, gdy stopień wyjściowy osiąga ok. 150-200.  Oznacza to, że gdy odpowiadamy na wpisy grubo ponad 150 osób, to średnio każdej z nich odpowiadamy tym rzadziej im więcej jest tych osób. Autorzy wyjaśnili takie zjawisko odwołując do tak zwanej Ekonomii Uwagi (Attention Economy) , czyli w uproszczeniu twierdząc, że ludzie posiadają skończone zasoby czasowe i uwagowe i dlatego nie mogą z niezmienną uwagą otrzymywać informacji z rosnącej liczby źródeł.

Aby zweryfikować prawdziwość takiego modelu postanowili zamodelować obserwowane zjawisko jako proces dynamiczny zachodzący pomiędzy agentami. W modelu tym agenci są ze sobą połączeni w sieci. Każdy z agentów wysyła wiadomości do swoich sąsiadów. Gdy agent otrzymuje wiadomość, trafia ona do kolejki. W danym kroku czasowym agent odpowiada  na losową liczbę wiadomości. Wiadomości, na które odpowie są usuwane z kolejki. Jeśli kolejka przekroczy ustalony maksymalny rozmiar nowe wiadomości nie są przyjmowane.

Wyniki symulacji z wykorzystaniem opisanego modelu okazały się zbieżne z wynikami empirycznymi uzyskanymi z Twittera (kształt funkcji średniej wagi łuku wychodzącego od stopnia wierzchołka był taki sam – również występowało wyraźnie przegięcie funkcji – punkt, w którym średnia waga łuku wychodzącego przestawała dalej rosnąć).

Rezultaty tego eksperymentu pokazują, że liczba ludzi, z którymi jesteśmy w stanie utrzymywać odwzajemnione relacje na Twitterze jest zbliżona do liczby Dunbara. Ponadto autorzy pokazali prosty ale skuteczny model pozwalający zamodelować zachowania społeczne w Internecie.

Facebook w skanerze MRI

Zespół naukowców z instytutu Cognitive Neuroscience w University College London oraz London School of Medicine and Dentistry pod kierownictwem doktora Ryota Kanai przeprowadził 4 eksperymenty mające na celu zweryfikowanie hipotezy głoszącej, że zróżnicowanie w wielkości utrzymywanych przez nas, zarówno w świecie wirtualnym jak i rzeczywistym, relacji jest powodowane zróżnicowaniem w wielkości pewnych obszarów naszego mózgu.[3]

Pierwszy eksperyment miał na celu sprawdzenie, czy między-osobnicze zróżnicowanie ilości ludzi, z którymi osoby badane utrzymują kontakt na Facebooku pozwala przewidzieć między-osobnicze zróżnicowanie wielkości pewnych struktur mózgu. W tym celu grupę 125 osób przebadano za pomocą rezonansu magnetycznego mózgu (MRI), aby poznać wielkości interesujących badanych struktur mózgowych, oraz sprawdzono liczbę znajomych tych osób na Facebooku.  Wyniki potwierdziły hipotezę: badani znaleźli istotne statystycznie, choć niezbyt mocne (R ok 0.35), korelacje między zróżnicowaniem gęstości istoty szarej różnych regionów mózgu a ilością znajomych na Facebooku. Udało się też zlokalizować, które obszary mózgu są odpowiedzialne za tę korelację – okazały się to być: MTG – środkowy zakręt skroniowy, STS – bruzda skroniowa górna oraz kora węchowa hipokampa.

Eksperyment drugi miał potwierdzić rezultaty eksperymentu pierwszego – zamiast znajdować, które obszary korelują z wielkością sieci społecznościowej sprawdzono jak korelują z nią te obszary, które znaleziono w eksperymencie pierwszym. Przeprowadzono go na 40 osobach, które nie były badane w eksperymencie pierwszym. Wyniki potwierdziły rezultaty poprzedniego badania.

W trzecim eksperymencie zbadano czy liczba znajomych na Facebooku koreluje z wielkością sieci społecznościowych utrzymywanych w normalnym życiu. W tym celu przebadano 28 osób za pomocą specjalnego, stworzonego i przetestowanego wcześniej, kwestionariusza składającego się z 9 pytań mierzącego właśnie ilość ludzi, z którymi osoba utrzymuje kontakty. Pytania zawarte w kwestionariuszu badają wielkość dziewięciu różnych grup (np. ludzie z książki telefonicznej w telefonie, ludzie obecni na ostatniej imprezei urodzinowej itp.) Okazało się, że choć średnia wielkość grup badanych przez kwestionariusz jest znacznie mniejsza od tej z Facebooka (281 Facebook, 80 – książka telefoniczna, 10-18 pozostałe grupy z kwestionariusza) ,  to jednak istotnie koreluje z pięcioma z nich.

Czwarty eksperyment miał za zadanie zbadać zależno między wielkością sieci społecznościowych w rzeczywistym świecie (mierzonej tak jak w eksperymencie 3)  a gęstością istoty szarej w strukturach mózgu badanych w eksperymentach 1 i 2.  W tym celu policzono korelacje między gęstościami struktur a ilością kontaktów utrzymywanych offline. Następnie, aby zobaczyć, które struktury mogą specyficznie wpływać jedynie na ilość kontaktów w Internecie, zbadano ich częściową korelację eliminując wpływ ilości kontaktów utrzymywanych offliine. Wyniki (zebrane na 65 osobach) pokazały, że struktury,  które we wcześniejszych eksperymentach wykazały związek z ilością znajomych na Facebooku nie były powiązane z wielkością sieci społecznych utrzymywanych w prawdziwym świecie.  Odkryto natomiast korelację z gęstością istoty szarej w innej strukturze: prawym ciele migdałowatym. Po usunięciu wzajemnych wpływów wielkości sieci online i offline częściowe korelacje z poprzednio znalezionymi strukturami okazały się istotne zarówno dla grup znajomych z sieci jak i spoza niej.

Podsumowując: londyński zespół badaczy pokazał, że na podstawie wielkości grupy znajomych na Facebooku jak i w rzeczywistym świecie da się przewidzieć gęstość pewnych struktur mózgu. Co więcej, okazało się, że w przypadku znajomości online i offline są to inne struktury, co wskazuje na to, że być może inne umiejętności poznawcze pozwalają nam utrzymywać znajomości w Internecie a inne w normalnym życiu. Ponadto wykazano, że wielkość sieci społecznych off-line i on-line korelują ze sobą, choć te drugie są większe. Autorzy zaznaczają, że otwartym pozostaje pytanie, czy to struktura mózgu wpływa na ilość znajomych, czy też jest odwrotnie i dzięki plastyczności naszego mózgu gęstość pewnych struktur wzrasta gdy utrzymujemy kontakty z większą liczbą osób.

Co z tego wynika?

Zarówno z badań Dunbara jak i współcześnie przeprowadzanych eksperymentów wynika, że liczba relacji jakie możemy utrzymywać, zarówno w sieci jak i w normalnym życiu podlega ograniczeniom ze strony naszych zdolności poznawczych. Możliwe też, że ćwiczenie mózgu w używaniu umiejętności społecznych poprzez utrzymywanie dużej grupy znajomych powoduje rozwój pewnych jego części. Wzajemne oddziaływanie mózg – internet, mózg – technologia, jest niezaprzeczalne i zawsze będzie stanowiło interesujący temat multidyscyplinarnych badań.

84914

[1] R.I.M. Dunbar Neocortex size as a constraint on group size in primates

[2] Goncalves, B., Perra, N., Vespignani, A. (2011-05-28).„Modeling Users’ Activity on Twitter Networks: Validation of Dunbar’s Number”

[3] R.Kanai, B.Bahrami, R.Roylance and G.Rees (2011-10-19) Online social network size is reflected in human brain structure

16 stycznia, 2012

Szukajcie a znajdziecie… kto szuka nie błądzi…

- autor: tsissput

… czyli o słów kilka o tym czym i jak szukamy.

Jest 6 sierpnia 1991 roku pojawia się pierwsza strona internetowa. Postawiona na serwerze HTTPD. Uruchomionym na komputerze z systemem NeXT STEP. W Szwajcarskim CERNie.
Jest stycznień 2010 internet składa się z 206 741 990 stron internetowych
Listopad 2011 liczba ta rośnie do 525 998 433 dostępnych stron.
Najnowszy raport mówi o istnieniu 582 716 657 aktywnych stron!
[Kogo dziwi tak mały wynik odsyłam do metodologii prowadzenia tych badań, wszystko się wyjaśni]

Nie łatwo odnaleźć się w takim gąszczu informacji. Na szczęście nie zostaliśmy pozostawieni sami sobie. Mamy pomoc.
Znowu trochę historii.
Pierwszą wyszukiwarką był WebCrawler który pojawił się 20 kwietnia 1994 roku. Był on wyjątkowy dlatego, że posiadał szukanie pełnotekstowe. Po nim pojawiły się kolejne takie jak Daum, Excite, HotBotYahoo!.
Jednak dla nas najważniejszy jest Google. Kochany wujek Google 🙂 i jego wspaniały PageRank.
Teraz garść suchych faktów na temat tego jak działa. (możecie to pominąć)
Definicja: PageRank to rozkład prawdopodobieństwa służący do zaprezentowania prawdopodobieństwa, że osoba, która przypadkowo kliknie link dotrze do danej strony.
PageRank danej strony opisuje się wzorem Wzór opisujący PageRank danej strony
Gdzie:
PR(pi) – Waga liczbowa określająca dany dokument (PageRank),
d – współczynnik tłumienia, określa prawdopodobieństwo, że dana osoba przestanie klikać w kolejne linki (szacuje się, że jego wartość jest w okolicach 0.85),
N – ilość dokumentów w kolekcji,
M(pi) – określa zbiór stron które linkują do strony pi,
L(pj) – ilość linków wychodzących ze strony pj.

Ze wzoru wynika, że suma PageRank’u wszystkich storn wynosi jeden. Dodatkowo PageRank storony i zależy od wartości PageRank’ów wszystkich stron ze zbioru M(pi) podzielonych przez ilość linków na każdej z nich.

Znaczy to że lepiej linkować strony o dużej wartości PageRank’a oraz małej ilości linków.

A jak jest teraz?

Niestety dziś PageRank nie określa już jednoznacznie naszej pozycji na liście wyszukań. Nawet nie jest już taki ważny. Wszytko przez to co zaczęła robić „konkurencja”. Przez to co zaczęły wyczyniać rozmaite start upy.

Niespodziewanie kilka lat temu wzrosło zainteresowanie semantyką. Do tego pojawił się Facebook i jego „Lubię to!„.

Jedną z pierwszych jaskółek zapowiadających falę zmian był plugin dla Firefoxa o nazwie Semanti. Nie był on wyszukiwarką samą w sobie. Zamiast tego był nakładką na istniejące już wyszukiwarki takie jak Google i Bing. Dodawał im takie funkcje jak semantyczne znaczenie wpisywanych terminów. Tworzył też swoją własną społeczność. Można było przeglądać wyszukania znajomych, a jak zadaliśmy podobne wyszukanie to wyświetlało nam informacje w jakie linki jacy nasi znajomi klikali.

Jak zauważyliście piszę w czasie przeszłym. Ja o Semanti dowiedziałem się dopiero przy okazji pisania tego wpisu, na podstawie tego artykułu. Próbowałem go znaleźć poprzez Google i Binga, ale zawiodłem (może ja nie potrafię zadawać pytań tak jak one [wyszukiwarki] tego chcą). Obie od razu się domyśliły że zrobiłem literówkę w szukanej frazie (tja jasne) i zaprezentowały wyniki dla „semantic search” dodanie „firefox plugin” całkowicie zignorowały.

Tak właśnie działa semantyka dla Google i Microsoftu  (a raczej samego Google, bo nie oszukujmy się MS ściąga niczym student na egzaminie). Znalezienie synonimów i wyłapanie literówek to wszystko na co je obecnie stać.

Semanti nie był jedynym dodatkiem, który służył jako nakładka semantyczna na dobrze nam znane wyszukiwarki innym przykładem jest SenseBot. Co prawda nie ma on tak ciekawych funkcjonalności jak Semanti ale zawsze coś. Pozatym repozytorium dodatków zarówno Chrome jak i Firefox’a zawiera wiele innych ciekawych addon’ów, które wartoprzetestować (choć nie warto tu o nich pisać).

Podejście gigantów do „semantic search” nie jest na szczęście uważane za prawdę objawioną i istnieją konkurencyjne produkty, które mają własną wizję tego jak semantic web powinien wyglądać. Jednym z najbardziej popularnych przykładów jest Hakia. Jedną z postaci stojących za serwisem jest Victor Raskin, który jest uważany za ojca semantyki ontologicznej. Nie jest ona co prawda ukończona i wiele pracy trzeba jeszcze włożyć żeby można powiedzieć, że mamy do czynienia z czymś wyjątkowym ale jest dobrze. Wyniki są trafione (w większości). Ponadto Hakia ma coś czego nie mają Google i Bing, mianowicie chodzi o opcję „Meet Others”. Pozwala ona przejść na dedykowanego czata, gdzie będziemy mogli porozmawiać z innymi, którzy zadali pytanie podobne do naszego. Przynajmniej tak o tym piszą w internecie. Po raz kolejny wina spada na mnie i moje niewłaściwe pytania. Osobiście nie udało mi się skorzystać z tej opcji bo nikt nie szukał tego co ja. Trudno, może kiedyś się uda.

– Kto wie …? – Ja wiem! Mnie, wybierz mnie!

Tym zgrabnym manewrem przejdziemy do tego co zwykło się nazywać „social search”. Czyli gdzie w tym wszystkim są ludzie i ich wiedza. Niezmiernie popularne przez ostatnie lata portale społecznościowe i ich użytkownicy.

Wszytko to tak na prawdę dzięki Facebook’owi i jego „Like It!„. Jego granicząca z szaleństwem popularność otwarła nowe możliwości. Dzięki niemu moża było określić trafność wyszukanych linków na podstawie tego co myślą o nich nasi znajomi, albo znajomi naszych znajomych, albo ludzie których możemy znać, albo ci, których mogą znać nasi znajomi lub po prostu w zależności od tego ile „lajków” dany artykuł, komentarz dostał. Oczywiście to wszystko przy założeniu, że jesteśmy podobni do naszych znajomych, że dzielimy te same zainteresowanie i mamy wspólne spojrzenie na świat.

Doprowadziło to do tego, że gigant wyszukiwania pokroju Google nie mógł przejść obok tego fenomenu obojętnie. Tak więc pojawiło się +1. Przy okazji wyniki naszych wyszukań stały się spersonalizowane. Teraz każdy znajdzie coś innego, coś co go bardziej zainteresuje, coś co łatwiej będzie mu przyswoić. Po prostu coś bardziej dla niego. Tak działa „social search” by Google.

Nie jest to oczywiście jedyna wizja tego czym jest wyszukiwanie społecznościowe. Ciekawym konceptem jest znalezienie osoby, która może pomóc ci znaleźć to co czego szukasz. Jest to popularny trend w technologiach mobilnych. Zamiast godzinami przesiewać wyplute przez Google czy Binga w poszukiwaniu interesującej nas wiedzy. Zamiast marnować czas programistów na lata implementacji maszynowej analizy tekstu, rozumienie pytań zadanych w języku naturalnym, inteligentnego składania dokumentów. Dlaczego by nie znaleźć po prostu osoby, która nie odpowie nam na nasze pytanie. Mniej więcej tak działał mobilny Aadvark zanim został wykupiony przez Google i zamknięty.

O ile abphone i zook nie potrafią znaleźć dobrych restauracji w Poznaniu o tyle aplikacje mobilne takie jak HayStack daje duże nadzieje, oczywiście dla osób bardziej uspołecznionych niż ja. Jeśli ktoś lubi dołączać do nowych społeczności, które są związane z jego wyszukaniami. Niech się zapozna z HeyStack.

Przy okazji wyszło na jaw, że Facebook dodał do swojego portfolio kolejną funkcjonalność „Ask Question” czyli po prostu „Zadaj Pytanie”. Wiem, wiem, dla was to żadna nowość. Na pewno wszyscy o tym wiecie od dawna i korzystacie. Pomysł ogólnie nie jest nowy, na pewno w codziennej pracy nie raz zdarza wam się przewinąć przez Stack Overflow. Oczywiście Facebook zrobił to z sobie dobrze znanym rozmachem. Nasze pytania wylądują na ścianach naszych znajomych. Na ścianach znajomych tych naszych znajomych, którzy śledzą nasze pytanie. Na ścianach znaj… właściwie to się może propagować daleko w głąb społecznego grafu Facebooka. Wszystko zależy od zaangażowania ludzi.

The appearance of Dr. Know

Pamiętacie scenę z filmu „Sztuczna Inteligencja„, w której David pytał się Dr. Know gdzie znajduje się Niebieska Wróżka? Chcieli byście w ten sposób wyszukiwać informacje? Zadać pytanie tak jakbyście pytali kolegi, prowadzącego zajęcia lub przechodnia i dostać odpowiedź (potocznie mówiąc) prosto na twarz. Tak zwyczajnie. Myślę, że w ostateczności do tego zmierza technologia. Jednak to nie nastąpi szybko. Jeszcze wiele pytań pozostanie z błędymi odpowiedziami, a przynajmniej nie takimi jakich się spodziewamy. Tak właściwie to jak zadajemy obecnie pytania wyszukiwarkom? Czy są to prawdziwe pytania, czy po prostu zlepek słów kluczowych jakie kojarzą się nam z danym problemem? Jednak do takiego sposobu szukania odpowiedzi przyzwyczaiły nas współczesne wyszukiwarki. Wynika z tego, że nie tylko technologia będzie musiała się zmienić ale i nasze podejście do zdobywania wiedzy.

Mnie zadowoliłoby gdybym na pytania „How to…” dostał w odpowiedzi listę kroków, żeby „Why…” odpowiedziało mi dlaczego, żebym na pytanie „In what movie was playing Jude Law?” dostał po prostu listę filmów, a nie jego zdjęcia… Czy to wiele?

Na obecny stan technologi semantycznych tak, ale to zostawia spore pole do popisu nowym start upom, nam.

Jeśli chcemy coś znaleźć to musimy tego poszukać samemu (albo poprosić znajomych).

Dawid Jankowiak

P.S. Przepraszam za literówki.

P.S.S. Oraz za liczne powtórzenia. Sami rozumiecie: pozycjonowanie, text mining, wyszukiwarki, Bing, Google, Hakia, Semantic Search, Social Search, Facebook, Microsoft, mobile apps, PageRank, algorytmy wyszukiwania, ontologia