Jeroen.com | weblog | woordenboek | zoeken | contact
Google Weblog    
 

20 Mei '09 - + 0 - 0 Wolfram Alpha, wie op zoek is naar sex moet boekjes lezen


Wolfram AlphaInmiddels is er veel geschreven over Wolfram Alpha. Tijd om er eens heel diep in te duiken. Hoe goed is deze zoekmachine? Is hij snel? Geeft hij de juiste antwoorden op alle vragen en is hij geschikt voor een groot publiek? Kortom, is dit de Google killer?


Derde bronnen, niet altijd wat de gemiddelde mens zoekt


Wolfram Alpha maakt gebruik van allerlei derde bronnen om te berekenen wat de gebruiker zoekt. Zo is er data uit een encyclopedie, is er financiele informatie over beursgenoteerde bedrijven en Alexa informatie over domeinnamen. De resultaten worden zeer snel getoond, maar zijn nog beperkt.

Wolfram Alpha omschrijft zichzelf als volgt:

"Making the world's knowledge computable Today's Wolfram|Alpha is the first step in an ambitious, long-term project to make all systematic knowledge immediately computable by anyone."

Wolfram Alpha is in essentie een wetenschappelijke zoekmachine die probeert op een min of meer academische wijze antwoorden te vinden op door zoekers gestelde vragen. De resultaten zijn dan ook vooral verzamelingen van allerlei vooral openbare bronnen. Daarmee is Wolfram Alpha zeker niet de eerste zoekmachine. Ook het idee om allerlei bronnen te verwerken in zoekresultaten is niet geheel nieuw. A9 van Amazon.com probeerde ook verschillende bronnen te verzamelen en richtte zich op het (grotere) populaire publiek.

wolframalpha




Naar eigen zeggen bevat Wolfram Alpha 10 biljoen stukken data en 50.000 algoritmes en modellen. Het zou het resultaat zijn van 20 jaar studie. Toch leidt dit niet altijd tot goede resultaten. Bij nog heel erg veel vragen die we stellen krijg je het volgende antwoord:

Wolfram|Alpha isn't sure what to do with your input. Tips for good results »


Een van de voorbeelden die wel een resultaat biedt is “last solar eclipse san francisco”. Dit geeft allerlei informatie over het wanneer van deze gebeurtenis, de duur en een mooie afbeelding.

wolframalpha voorbeeld



Uiteraard is dit zeer interessant, maar hoeveel mensen zoeken dit soort informatie nu daadwerkelijk? Ook stel ik me vragen bij de bronnen van de informatie. In veel gevallen is het niet duidelijk waar Wolfram Alpha zijn informatie vandaan haalt. Dit is niet correct gezien er andere mensen moeite hebben gedaan de informatie eerst te verzamelen maar maakt ook de wetenschappelijke betrouwbaarheid van de zoekmachine zeer beperkt.


Maar hoe doet Wolfram Alpha het bij "gewone" zoekopdrachten en is het een Google killer? Tijd voor een zoektest!


Het trefwoord Google in Wolfram Alpha


Wolfram Alpha maakt gebruik van een groot aantal openbare bronnen. Wie zoekt naar "Google" krijgt een soort van Google Financial informatie.

Assuming "google" is a financial entity | Use as a word instead

De gegevens getoond zijn duidelijk, maar zeker niet het meest uitgebreid. Wie via Google Finance had gezocht had dezelfde informatie gevonden evenals uitgebreide trendtabellen en beurs gerelateerd nieuws. Google Finance zou in dit geval Wolfram Alpha verslaan op de hoeveelheid en de volledigheid aan informatie. Nu kun je zeggen, ok, Google Finance is een andere zoekmachine die niet veel gebruikt wordt. Maar door Universal Search zijn de resultaten van Google Finance geïntegreerd in de gewone zoekresultaten op de momenten dat een gebruiker dit eventueel nodig heeft.

Op zich is dit allemaal wel goede achtergrond info, maar wie een trefwoordenanalyse doet zal merken dat dit niet is wat de grote massa zoekt.

Een simpele trefwoorden analyse op het trefwoord "Google" levert ons de volgende resultaten op:

1. google
2. google maps
3. earth google
4. www google n l
5. google video
6. google search
7. google analytics
8. google books
9. google zoek
10. google calendar
11. google mail
12. google sketchup
13. http www google
14. google adwords
15. maps google nl
16. google nederland
17. google eart
18. google maps api
19. google maps com
20. google talk


Dit is een eenvoudig en simpel bewijs van wat de behoefte van de gemiddelde gebruiker is. Wanneer we weer terug gaan naar Wolfram Alpha dan zullen we zien dat vrijwel AL deze info niet direct vindbaar is.

Voor de duidelijkheid: het trefwoord Google is een van de meest gezochte trefwoorden op het Internet. Men mag van een zoekmachine die zich richt op een groter publiek verwachten dat deze toont wat de gebruiker daadwerkelijk zoekt. Wat mij betreft wordt dat niet bereikt.


Het trefwoord Jeroen.com in Wolfram Alpha


Een zoekopdracht naar Jeroen.com(men moet ook wat egosurfen om een zoekmachine te testen ;-)) levert beperkte informatie op. Zo wordt een provider getoond die niet correct is en informatie uit Alexa die toch net iets te hoog ligt:

daily page views | ~~ 31.000
daily visitors | ~~ 16.000
site rank | ~~ 121749th
domain online | 29/10/1997 (12 years ago)
(Alexa estimates)

De schatting van bezoekers is een compliment, maar mijn logfiles geven eerder een aantal tussen de 6000 en 8000 unieke bezoekers per dag. De schatting die dus getoond wordt is een factor 2 er naast en dus niet accuraat. Voor een zoekmachine is dit niet best, zeker niet aangezien dit twee fouten op een rij zijn. Verder is er meer zinvolle informatie te vermelden. Sterker nog, ik vraag me af of bovenstaande info uberhaupt zinvol is.


Het trefwoord Sex in Wolfram Alpha


Een andere -nogal populair- trefwoord is het trefwoord "sex". Wolfram Alpha antwoordt:

Assuming "sex" is a word | Use as a book instead

Ah, wie op zoek is naar sex moet boekjes gaan lezen ;) Vervolgens worden er een aantal woordenboek resultaten getoond. Zoals:

body process | activities associated with sexual intercourse

physiological property | the properties that distinguish organisms on the basis of their reproductive roles

feeling | all of the feelings resulting from the urge to gratify sexual impulses

class | either of the two categories (male or female) into which most organisms are divided


Ook hier geldt dat dit zeer goede informatie is, maar naar alle waarschijnlijkheid niet is wat de grote massa zoekt.

Ik heb me maar beperkt tot de top seks zoekwoorden:

1. seks
2. gratis seks
3. seks de
4. free seks
5. www seks
6. animal seks
7. seks videos
8. seks forum
9. seks man
10. seks movies

Dit is misschien wel het meest duidelijke voorbeeld dat deze zoekmachine niet gezien moet worden als concurrent maar een totaal andere doelgroep aan moet spreken. Overigens is Wolfram|Alpha wel een van de meest veilige zoekmachines. Family filters zijn voorlopig niet nodig.


De doelgroep is de mensen die achtergrond info over bepaalde onderwerpen zoekt. Vergelijk het met Wikipedia of het zoekmachine woordenboek op Jeroen.com alleen dan zonder redactie. De kracht zit hem in het grote aantal bronnen, maar ook daar is Wolfram Alpha niet uniek in.

Wolfram Alpha, niet de Google killer, wel interessant


Een van de zwaktes is dat Wolfram Alpha de gebruiker moet opleiden. Wanneer een zoekopdracht geplaatst wordt probeert Wolfram Alpha de gebruiker te leren om de zoekopdrachten te verbreden. Dit is onnatuurlijk voor een gebruiker en vraagt om extra acties. Het is juist de kracht van zoekmachines zoals Google dat ze een ding doen, zeer simpel zijn en over het algemeen goede resultaten geven. Vooralsnog is dit niet wat Wolfram Alpha doet.




2 Googley reacties!:

Je moet Wolfram Alpha vooral gebruiken voor wetenschap,

probeer iets als x^2+x=1 of als dx/dt+x=0,

Wolfram Alpha geeft netjes de antwoorden.

Je moet ook niet Wolfram Alpha vergelijken met Google…
Je gaat toch ook niet met een vrachtauto boodschappen doen in de supermarkt?

groet – jan

jan - 20 Mei '09 - 13:03

Ik ben het met Jan eens. Wolfram is niet m.i. niet bedoelt om Google op elk terrein te verslaan. De doelgroep van Wolfram is niet het massa-publiek maar de mens die op zoek is naar een wetenschappelijk antwoord.

Peter () (link) - 30 December '09 - 15:04


DISABLED BECAUSE OF COMMENT SPAM submit3 . php#message" id="form">
Naam:  
Persoonlijke info onthouden?

Email:
URL:
Reactie:Emoticons / Textile


Kleine lettertjes: Alle HTML-tags behalve <b> en <i> zullen uit je reactie worden verwijderd. Je maakt links door gewoon een URL of email-adres in te typen.
--> -->