True Bayesian estimate (Zoekmachine optimalisatie)

De "True Bayesian estimate" is het algoritme dat IMDB (The Internet Movie Database) gebruikt om te bepalen wat de hoogst gewaardeerde films zijn. Dit vind je onder andere terug in de IMDB top 250.

Het IMDB algoritme ziet er als volgt uit:

weighted rating (WR) = (v (v+m)) R + (m (v+m)) C

where:

R = average for the movie (mean) = (Rating)
v = number of votes for the movie = (votes)
m = minimum votes required to be listed in the Top 250 (currently 1300)
C = the mean vote across the whole report (currently 6.7)

C is dus een wegings factor net zoals de Damping factor in het pagerank algoritme van Google. Alleen stemmen van gergistreerde leden tellen mee in de weging.

De True Bayesian estimate is een afgeleide van de Recursive Bayesian estimation en Sequential Bayesian filtering. Bij de Recursive Bayesian estimation wordt gekeken naar de waarschijnlijkheid van een weging over een bepaalde periode van tijd. Bij Sequential Bayesian filtering wordt juist gekeken naar de echte waarde naar verloop van tijd.

De IMDB top 5 ziet er op moment van schrijven als volgt uit:

  1. The Shawshank Redemption (1994)
  2. The Godfather (1972)
  3. The Dark Knight (2008)
  4. The Godfather: Part II (1974)
  5. Buono, il brutto, il cattivo., Il (1966)

Gerelateerde woorden

Thema & categorieën