AbstractsComputer Science

Examining the structure of the KTH web; Undersökning av KTH webbens struktur

by Alexander Janson




Institution: KTH Royal Institute of Technology
Department:
Year: 2016
Keywords: Netwok science; scale-free; WWW; Natural Sciences; Computer and Information Science; Computer Science; Naturvetenskap; Data- och informationsvetenskap; Datavetenskap (datalogi)
Posted: 02/05/2017
Record ID: 2073447
Full text PDF: http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186373


Abstract

This thesis studies the characteristics of the network structure extracted from the public KTH web. The network structure was extracted with a crawler and consisted of 671,013 nodes and 23,515,683 links. The system is studied by applying statistical concepts from network science such as degree distribution and average path to reveal the characteristics of the network. The aim of the statistical analysis is to explore the robustness of the network and to answer if the network is scale-free. The thesis will examine the results from the study and compare the results to previous similar research. The results indicate that there might have been a change in regards to the network structure of websites since the last major research was done on the subject, likely caused by changes in web design. However, the results still indicate characteristics typical for a scale-free network. Due to irregularities in the crawler results may be slightly unreliable. ; Detta kandidatexamensarbete undersöker de egenskaper i nätverksstrukturen för det allmänna KTH nätet. Denna struktur extraherades med en spindel och bestod av 671,013 noder och 23,515,583 länkar. Systemet studerades genom att applicera statistiska koncept från nätverksteori såsom gradfördelning och genomsnittlig väg för att visa nätverkets egenskaper. Målet med den statistiska undersökningen är utforska nätverkets robusthet och besvara frågan om nätverket är så kallad scale-free. Studien jämför även resultaten med resultat från tidigare studier med liknande undersökningar.   Resultaten indikerar att det kan ha blivit en förändring i avseende på nätverkets struktur sedan den tidigare omfattande studien genomfördes, förmodligen orsakat av ändringar i webdesign. Trots det så indikerar resultaten att nätverket fortfarande har egenskaper typiska för ett scale-free nätverk. På grund av oregelbundenhet i spindeln så kan resultaten vara smått opålitliga.