Affordable Access

Matematično ozadje algoritma PageRank

Authors
  • Spačal, Gregor
Publication Date
Sep 04, 2017
Source
University of Ljubljana
Keywords
Language
Slovenian
License
Green
External links

Abstract

PageRank je Googlov algoritem za rangiranje spletnih strani po pomembnosti. Strani lahko glede na vrednost PageRanka hierarhično uredimo in tako omogočimo boljše rezultate iskanja na spletu. V magistrskem delu obravnavamo pomen, lastnosti in delovanje spletnega iskanja. Predstavljamo slabosti spletnega iskanja, ki so se pojavljale pred nastankom Googla. Eno najpomembnejših vprašanj je zagotovo to, ali lahko delovanje PageRanka formalno matematično utemeljimo ter katere matematične koncepte in teorije za to potrebujemo. Za konec predstavimo primer implementacije algoritma v obliki spletne aplikacije in s tem pokažemo njegovo delovanje na preprostem primeru spleta. V magistrskem delu torej predstavimo matematično ozadje delovanja algoritma PageRank, za kar potrebujemo teoretično znanje s področja linearne algebre in teorije grafov. Poleg formalnega matematičnega opisa ilustriramo tudi njegovo delovanje na primerih. Splet modeliramo z usmerjenim grafom, ki mu priredimo neko matriko. Rezultat algoritma PageRank pa je lastni vektor te matrike pri lastni vrednosti 1, ki ga izračunamo s pomočjo potenčne iterativne metode. Obravnavamo tudi težave, ki lahko nastanejo pri računanju: ali je rezultat potenčne metode vedno smiseln, ali je lahko rešitev za dani primer več in ali je rezultat odvisen od začetnih parametrov. Glavni namen tega magistrskega dela je podati konkreten in širok vpogled v spletno iskanje s poukarkom na PageRanku, tako iz zgodovinskega, računalniškega kot matematičnega vidika, in poiskati ustrezne zglede za ilustracijo delovanja, težav in rešitev potenčne iterativne metode. Algoritem PageRank je tako predstavljen celostno na nivoju, primernem za tiste, ki jim spletno iskanje, linearna algebra in teorija grafov niso tuji, vendar se z nekaterimi zahtevnejšimi pojmi in koncepti še niso spoznali.

Report this publication

Statistics

Seen <100 times