Select * from Internet

- autor: tsissput

W czasach powszechnego i łatwego dostępu do Internetu, wysypu aplikacji mobilnych do komunikowania się ze światem i serwisów społecznościowych zalewanych przez swoich użytkowników ogromną ilością tekstu, obrazków i zdjęć, coraz większym problemem staje się odnalezienie interesujących nas informacji. Problemem staje się wyszukanie relewantnych treści wśród szumu informacyjnego.  O wiele istotniejszym problemem jest fakt, że wyszukiwanie grafik dla podanej frazy coraz częściej nie daje satysfakcjonujących wyników.

Aparat cyfrowy posiada około 2.5 miliarda osób na  świecie a każda z nich robi około 150 zdjęć rocznie. Spora część tych zdjęć ląduje na portalach społecznościowych. Według szacunków 70 miliardów zdjęć (ok. 20% ze wszystkich cyfrowych zdjęć wykonanych w tym roku) trafi na strony niekwestionowanego lidera tej branży – Facebooka, do którego uploadowano już ponad 140 miliardów zdjęć. Poniższa infografika pokazuje proporcje między proporcje między największymi społecznościowymi magazynami zdjęć w Internecie.

Facebook stał się agregatorem wszystkiego i niczego. Obok nielicznych zdjęć mniej lub bardziej „artystycznych” mamy niekończący się strumień „słitaśnych foci” dziewcząt i chłopców pozujących w pełnych powabu pozach koło meblościanki i kanapki z pasztetem bądź w trakcie działań, które nie śniły się nikomu, może poza stróżami prawa i ubezpieczycielami. Część z tych interesujących materiałów jest nawet skrupulatnie geotagowana!

Main stream’owe rozwiązania (czyt. Google) całkiem dobrze radzą sobie z napływem nowych treści „obrazkowych” ze społecznościowych fabryk danych (Facebook, Flikr…). Jednym ze sposobów polepszania współczynników wyszukiwania jest ”program wielkiego tagowania zasobów obrazowych”, innym napływ nowych opcji wyszukiwania grafik.

Ciekawym sposobem na wyszukiwanie interesujących nas treści i powiązanie z dodatkowymi informacjami jak dane GPS jest użycie YQL – Yahoo Query Language. Jest to język oparty na składni SQL, który pozwala wyszukiwać, modyfikować i filtrować dane będące zdjęciami, tekstem, informacjami o geolokalizacji, pogodzie…

Korzystając z konsoli możemy przeszukać poszczególne serwisy w poszukiwaniu zdjęć np. kota. Poniższe polecenie pozwoli na znalezienie 20 zdjęć z tagiem love z portalu Flikr. YQL pozwala na znalezienie zdjęcie po ID, oraz na wyszukanie dodatkowych informacji na temat każdego zdjęcia, w tym tagów Exif. Możliwe jest też wyszukanie użytkowników, grup, miejsc oraz uzyskanie listy najpopularniejszych zdjęć.

Kolejne polecenie pozwoli uzyskać informacje o danych geolokalizacyjnych dla Poznania. W zestawieniu znajdują się też dane o  województwie, kodzie pocztowym itp. Dzięki temu typowi zapytań możemy dowiedzieć się gdzie w Poznaniu zjeść sushi ( ograniczając listę do restauracji z ratingiem>4). Mamy też możliwość  znalezienia ciekawych eventów w danym mieście, sprawdzenia prognozy pogody

select * from geo.places where text=”poznan”

Przeszukiwać możemy także zbiory artystów i piosenek, by uzyskać informację o najpopularniejszych utworach, znaleźć artystów powiązanych z Madonną czy odnaleźć teledysk sprzed latJ. Łącząc zapytania wyszukamy artystów z dużym ratingiem, których koncert odbędzie się niebawem w naszym mieście, dowiemy się o cenie biletów, dacie wydarzenia a także posłuchamy fragmentów utworów powiązanych z nim wykonawców.

Siła YQL tkwi w łatwym sposobie łączenia danych z różnych źródeł. Korzystając z podzapytań możemy w łatwy sposób łączyć dane z heterogenicznych źródeł mając pewność, że są one na bieżąco uaktualniane. Dużym plusem platformy jest liczba obsługiwanych serwisów i całe stado opcji, które możemy wykorzystać podczas budowania swoich zapytań w łatwym i zrozumiałem języku.

YQL może być podstawą do budowania własnej aplikacji dzięki dostępnemu API. Prostą aplikację wyświetlającą zawartość rss z Yahoo opartą o html/js możemy napisać bez klucza API, po zalogowaniu i zdobyciu swojego numeru klucza API możliwości stają się znacznie większe. Korzystać możemy z odwołań do zmiennej „me” oraz „me.ip”.

Zadaniem aplikacji jest odebrać dane od użytkownika, zamienić je na zapytanie YQL i wysłać w świat. Zdobywaniem danych, ich integracją i uszeregowaniem zajmie się  procesor YQL. Nasza aplikacja musi tylko wyświetlić otrzymane dane. Technika ta pozwala w łatwy sposób budować aplikacje korzystające ze składni YQL np. metawyszukiwarkę zawierającą dane z Google, Binga i Yahoo.

Na koniec coś, co zaczerni trochę ten cukierkowy obraz… Platforma YQL jest ciągle modyfikowana i często się zdarza, że coś, co działało wczoraj, nie działa dzisiaj. Dzieje się tak szczególnie po wprowadzeniu możliwości Insert, Update i Delete o których być może napisze ktoś inny:)

Autor: Bartłomiej Słomiński (103894)

Advertisements

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: