Czy warto czytać ten blog?

- autor: tsissput
Obecnie blogosferę stanowią setki milionów blogów prowadzonych na całym świecie. Bloggerzy o podobnych zainteresowaniach tworzą wirtualne społeczności wzajemnie odwołując się do swoich postów.  Z morza nieciekawie pisanych pamiętników, można wyłowić poczytne blogi, których autorzy wywierają silny wpływ na opinie i decyzje swoich czytelników. Pytanie: W jaki sposób można to robić automatycznie? Zadali je sobie N. Agarwal, H. Liu, L. Tang, P.S. Yu w artykule “Identifying the Influential Bloggers in a Community”.
Dokładniej rzecz ujmując, wspomniany wyżej artykuł zajmuje się odnajdywaniem wpływowych bloggerów, na blogach współtworzonych przez wielu autorów. Abstrahujemy tu od tego czy dany blog jest opiniotwórczy, a skupiamy się na jego autorach. Który z nich będzie bardziej wpływowy od pozostałych.

Klasyczne algorytmy oceniające jakość strony internetowej, takie jak HITS czy PageRank, słabo sprawują się przy rankingowaniu blogów. Zastosowany u ich podstawy model swobodnie surfującego internauty nie sprawdza się przy obrazowaniu postów na blogu, które zazwyczaj są słabo powiązane linkami z innymi stronami. Odnajdywanie wpływowych blogów wymaga zastosowania innych miar.

Autorzy omawianego artykułu dzielą blogi na dwa rodzaje. Blog osobisty jest prowadzony przez jedną osobę z jedyną formą interakcji z czytelnikami w postaci komentarzy. Drugim typem blogu jest blog społecznościowy, gdzie więcej autorów publikuje swoje posty. Tsiss@PUT należy właśnie do tej drugiej grupy. Najbardziej wpływowym bloggerem na blogu osobistym jest naturalnie jego autor który inicjuje oraz prowadzi wszystkie dyskusje. Natomiast w blogu społecznościowym odnalezienie najbardziej wpływowego bloggera nie jest już takie oczywiste.

Najprościej byłoby uznać za wpływowego, aktywnego bloggera, który często zamieszcza nowe posty. Produkuje on więcej treści, jednak nie jest to równoznaczne z wysoką jakością tekstów. Nie można przyrównać bloggera aktywnego, do wpływowego. O ile łatwo mierzyć aktywność danego autora przez obserwowanie jak często zamieszcza nowe posty czy komentarze, ciężko jest ocenić opiniotwórczość jego tekstów. Jest to cecha bardziej subiektywna.

Intuicja podpowiada nam, że blogger jest wpływowy, gdy jego teksty cieszą się uznaniem, wzbudzają widoczne reakcje, wyrażają nietuzinkowe opinie oraz są napisane z pewną dozą elokwencji. Wymieniliśmy tu cztery cechy, które wydają się być skorelowane z opiniotwórczością bloggera. Każdej z nich można przypisać jakiś mierzalny atrybut postu na blogu.

  • Uznanie można przełożyć na liczbę linków wskazujących na dany post. Musiał być on na tyle ciekawy, aby inni bloggerzy odwoływali się do niego w swoich tekstach. Dodatkowo możemy uzależnić ważność konkretnych linków wskazujących od wpływu tekstu z którego pochodzą.
  • Za wzbudzenie reakcji uznamy liczbę komentarzy dotyczących danego postu. Im więcej komentarzy tym bardziej wpływowy jest komentowany post.
  • Odkrywczość danego postu mierzymy poprzez ilość linków wychodzących z danego postu w stosunku do długości całego tekstu. Posty, które zawierają stosunkowo więcej linków, uznajemy za mniej nowatorskie, raczej agregujące opinie pochodzące z innych postów.
  • Elokwencja została określona poprzez długość postu.
Model blogu społecznościowego można przedstawić w postaci grafu, gdzie wierzchołki będą odpowiadać kolejnym postom. Natomiast łuki będą oznaczać przepływ „wpływów” pomiędzy postami w postaci linków wchodzących i wychodzących.

Następnie dochodzimy do wzoru odzwierciedlającego wpływ danego postu, opierając się na wcześniej wymienionych cechach. Poniżej widnieje uproszczona, słowna wersja wzoru. Należy dodać, że każdy człon jest zaopatrzony w wagę, którą można manipulować istotność danej cechy w zależności od zastosowania.

Influence(post) = długość * (komentarze + (linki_wchodzące – linki_wychodzące))

Posiadając ten wzór jesteśmy w stanie wyliczyć opiniotwórczość wszystkich postów na danym blogu. W artykule zostało podane założenie, że każdy blogger jest tak wpływowy jak jego najbardziej wpływowy post. Dzięki temu możemy jednoznacznie wyznaczyć wpływy bloggerów oraz stworzyć ranking opiniotwórczości.Mając wspomniany model, zespól N. Agarwala eksperymentalnie zastosował go na istniejącym blogu: The Unofficial Apple Weblog (TUAW). Napisano crawlera który zbierał takie informacje jak długość postu, ilość komentarzy czy linków wychodzących i zapisywał je do ich własnej bazy relacyjnej. W momencie pisania artykułu zebrano ponad 10 000 postów, od początku istnienia blogu do dnia 31 stycznia 2007.

W czasie wykonywania eksperymentu blog TUAW prowadził statystyki najaktywniejszych bloggerów w 30-dniowym okresie. Aby porównać model wpływowego bloggera, do aktywnego, wyznaczono pięciu najbardziej wpływowych autorów, biorąc również pod uwagę tylko posty z ostatnich 30 dni.

Aktywni Wpływowi
1. Erica Sadun 1. Erica Sadun
2. Scott McNulty 2. Dan Lurie
3. Mat Lu 3. David Chartier
4. David Chartier 4. Scott McNulty
5. Michael Rose 5. Laurie A. Duncan

Jak  można zauważyć w powyższej tabeli, lista bloggerów aktywnych nie pokrywa się jednoznacznie z listą bloggerów wpływowych. Jedynie trzy nazwiska pojawiają się na obu listach.  Samo takie doświadczenie mówi nam jedynie że aktywni bloggerzy nie muszą być „wpływowi” i na odwrót. Nie da się na tej podstawie stwierdzić czy sam model opiniotwórczości odzwierciedla rzeczywistość. W celu porównania rzeczywistej popularności bloggerów z zaproponowanym modelem, wykorzystano dane z serwisu Digg. 100 z 535 najwyżej punktowanych postów blogu TUAW ze stycznia 2007 na Digg porównano z czterema kategoriami autorów: aktywni i wpływowi, aktywni i nie wpływowi, nieaktywni i wpływowi oraz nieaktywni i nie wpływowi. Posługując się zbudowanymi modelami wyciągnięto po 20 postów najwyżej punktowanych postów w trzech pierwszych kategoriach oraz losowano 20 postów nie wpływowych postów mało aktywnych bloggerów. Następnie sprawdzono ile postów wybranych przez model pokrywa się z najlepiej punktowanymi na Digg.

Aktywny Nieaktywny
Wpływowy 17 7
Nie wpływowy 3 1

Prawie wszystkie wyselekcjonowane posty autorów, którzy są zarazem aktywni i wpływowi cieszyły się wysoką popularnością na Digg. Posty wpływowych bloggerów miały więcej diggów od autorów, którzy byli jedynie aktywni.

Aktywny Nieaktywny
Wpływowy 21,7% 33,3%
Nie wpływowy 6,1% 20%

Tabelka powyżej pokazuje ile procent z wszystkich postów na TUAW w styczniu 2007 znalazło się wśród 100 najlepiej punktowanych na Digg z podziałem na kategorie autorów. Dla odniesienia 18,7% to wynik przed podziałem na rodzaje bloggerów. Widać w niej wyraźnie, że autorzy aktywni lecz nie wpływowi plasują się znacznie poniżej średniej. Natomiast teksty bloggerów piszących rzadziej, ale osiągających lepszy wynik w modelu opiniotwórczości, są stosunkowo o wiele bardziej popularne na serwisie Digg.

Porównanie modelu zaproponowanego przez zespół N. Agarwala z popularnością postów w serwisie Digg, wskazuje pewną korelację pomiędzy obiema metrykami. „Wpływowość” autora bardziej wiąże się z jego popularnością niż częstotliwość pisanych przez niego postów.

Autorzy artykułu zbadali dodatkowo współczynniki korelacji pomiędzy czterema cechami wykorzystanymi w zaproponowanym modelu, aby sprawdzić czy nie da się go jeszcze bardziej uprościć. Okazało się, że badane cechy, czyli długość postu, ilość komentarzy oraz liczba linków wchodzących i wychodzących są od siebie słabo zależne. Nie można więc wyeliminować żadnej z nich.

Warto też zajrzeć do samego artykułu. Zawiera on sporo pomysłów na inne cechy jakie można wykorzystać przy ocenie jakości postów na blogach oraz wywieranego przez nie wpływu.

Autor: 84791
Advertisements

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Log Out / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Log Out / Zmień )

Facebook photo

Komentujesz korzystając z konta Facebook. Log Out / Zmień )

Google+ photo

Komentujesz korzystając z konta Google+. Log Out / Zmień )

Connecting to %s

%d blogerów lubi to: