'The Search': wat je altijd al hebt willen weten over Google


In het boek The Search van John Battelle lees je alles wat je altijd al hebt willen weten over Google. Je komt onder andere te weten hoe Google zich heeft ontwikkeld van een project in de studentenkamer van Larry Page op Stanford tot een bedrijf met een waarde van 128 miljard dollar. Dit artikel is een uitgebreide samenvatting van het boek.

Door het lezen van het boek realiseer je je weer hoe ontzettend jong de zoekmachine(wereld) eigenlijk is. 10 jaar geleden bestond Google nog niet. Google is, zoals de meesten wel zullen weten, afkomstig van Googol, wat staat voor een 1 gevolgd door 100 nullen. Page en Brin kwamen op deze naam doordat ze zich realiseerden dat hoe groter het World Wide Web werd, des te beter hun uitvinding zou werken.

Het was eigenlijk nooit Larry Page's bedoeling om een zoekmachine te ontwikkelen. Hij had alleen de intentie om een soort citatie index te maken voor het web naar model van de wetenschappelijke index die meet hoeveel wetenschappers vanuit hun artikelen naar andere artikelen verwijzen.

Het succes van Google verbaasde iedereen. Page en Brin konden de geheugencapaciteit niet aanslepen. Page's studentenkamer die dienst deed als machine lab puilde uit z'n voegen door alle bij elkaar geraapte computeronderdelen die ervoor moesten zorgen dat Google tegemoet kon blijven komen aan de steeds grotere vraag van gebruikers. The BackRub crawler, zoals Google eerst heette, nam bijna de helft van de bandbreedte van Stanford in beslag en soms legde de uitvinding zelfs het complete netwerk plat.

In de begintijd stuitte Google op nogal wat tegenstand bij website-eigenaren. In 1996 wilde geen enkele website-eigenaar dat zijn site door een zoekmachine werd geïndexeerd. Een automatisch verzoek tot het downloaden van de complete content van een site werd vaak gezien als een onbehoorlijke manier van 'binnendringen'. 10 jaar later wordt hier toch heel anders over gedacht.

Niet alleen website-eigenaren waren terughoudend, ook de grote portals vonden zoekmachines maar niks. Ze redeneerden dat zoekmachines ervoor zouden kunnen zorgen dat mensen hún portals verlieten en ergens anders naartoe surften. In een reactie hierop begonnen de portals in allerijl websites met veel traffic te kopen. Zo kocht Yahoo tussen 1998 en 2000 bijvoorbeeld Geocities, Broadcast.com, Four11 en ViaWeb. Alles om maar zo veel mogelijk traffic te verzamelen dat de advertentie-inkomsten waarborgde. Door de adoptie van het pay per click model in 2002 werd ook dit een achterhaald idee. Het werd duidelijk dat zoekmachines geen bedreiging vormden, maar een lucratieve kans. Overture's Gross was de eerste die dit inzag.

Hoe het business model van Google tot stand kwam
Page en Brin hebben met de eerste opzet van Google langs grote firma's als Yahoo en Infoseek geleurd, maar niemand zag er echt brood in. Dat was in die tijd ook niet verwonderlijk, want Google had toen (begin 2001) nog geen bruikbaar business model. Dat wil zeggen: ze hadden wel een uitzonderlijk goed algoritme in handen, maar ze hadden nog geen manier gevonden om er daadwerkelijk geld mee te verdienen. Uiteindelijk was het Bechtolsheim, een oprichter van Sun, die als eerste bereid was in Google te investeren. Om het binnenhalen van hun eerste $ 100.000,- te vieren, gingen Page en Brin bij de plaatselijke Burger King een hamburger eten.


In 2001 stelde de oprichter van Overture, nu hun grootste concurrent op het gebied van paid search, Page en Brin voor om partners te worden. Maar de Googlers weigeren met als reden dat ze niet wilden worden geassocieerd met een bedrijf dat betaalde advertenties mixte met organische resultaten. Toen Google begin 2002 bij dringend gebrek aan een bruikbaar business model overging op een pay-per-click model naar voorbeeld van Overture, werd Google door Overture aangeklaagd voor inbreuk op hun patent. Google heeft toen besloten een licentie te nemen op het patent.

Battelle concludeert het volgende: "Gross [de bedenker van Overture, red.] saw the opportunity first and he build a world-class company [Overture, red.] to take advantage of it, but in the history of search, Overture will remain a footnote." En over de adoptie van Overture's pay-per-click model: "Brin and page were idealistic, to be sure, but not to the point of suicide". En Moritz, die in de raad van bestuur van zowel Yahoo als van Google heeft gezeten, zegt: "Had Google not adopted some of the Advertising techniques that were working for others, it would have ended up a small, but nice, high-end company". Google heeft dus zijn principes moeten laten varen en een idee van de concurrent overgenomen om niet kopje onder te gaan.

John Battelle geeft tot slot een aardige analyse van een succesvol search business model. Hij stelt dat een zoekmachine om succesvol te blijven 3 zaken nodig heeft: ten eerste een algoritme dat relevante zoekresultaten levert, ten tweede een paid search netwerk en ten derde eigen bezoekers. De enige zoekmachine die in 2003 over deze 3 factoren beschikte was Google. MSN en Yahoo hadden hun zoekmachine (algoritme) uitbesteed aan respectievelijk Inktomi en Google en ze hadden hun paid search netwerk beide uitbesteed aan Overture. Microsoft en Yahoo realiseerden zich dat voldoende eigen traffic het enige element was dat niet aan één zoekmachine 'toebehoorde'.

The rest is history?..Inmiddels heeft Yahoo Overture overgenomen. MSN heeft sinds begin 2005 een eigen zoekmachine in huis. Bovendien heeft MSN Search sinds kort een eigen paid search oplossing (MSN adCenter). En de drie search giganten zijn (nog steeds) in een voortdurende strijd verwikkeld om de meeste bezoekers te trekken met bijbehorende advertentie-inkomsten. Wie de strijd gaat winnen zal de toekomst uitwijzen. Vooralsnog gaat Google in Nederland met 91% marktaandeel aan de leiding, maar MSN komt langzaamaan dichterbij (bron: Nationale Search Engine Monitor). En in Amerika blijft Yahoo een grote speler op de search markt.

Privacy issues bij Google
Don't be evil
Om goed te begrijpen waarom er begin 2006 zoveel ophef is ontstaan over privacy, zoektermen van pornocriminelen in Amerika en de censuur in China, is het interessant om eerst meer te lezen over Google's motto.


In 2001 werden er bij Google per dag gemiddeld 5 mensen aangenomen. Om alle (nieuwe) medewerkers met de neuzen dezelfde kant op te krijgen, werd er een bijeenkomst georganiseerd om Google's kernwaarden te bepalen. Na enkele voor de hand liggende waarden als "Wees respectvol" en "Kom altijd op tijd", opperde iemand: "Don't Be Evil". En dat werd het motto van Google. Eerst alleen intern, maar later ook naar buiten toe. Tot voor kort leek dat een aardig motto waar weinig mis mee is. Maar de laatste tijd blijken er toch aanzienlijk wat nadelen te kleven aan het hebben van zo'n toch wel pretentieus motto. Want wie bepaalt eigenlijk wat 'evil' is en wat niet?

Privacy issues
Traditioneel steigeren Amerikanen eerder en hoger als het gaat om hun privacy. Toen Google in 2004 Gmail lanceerde - een e-mail service met een in die tijd ongeëvenaarde opslagcapaciteit van 1 gigabyte - was de wereld te klein. Dat kwam doordat de advertenties naast de e-mailberichten simpelweg té relevant waren. Als jij je moeder mailt over een lekker recept voor muffins, wil je niet dat naast dat bericht een advertentie verschijnt van de Weight Watchers. Althans, dat was de reactie van veel Amerikanen. Ze hadden het idee dat Google als het ware over hun schouder meelas.
Alsof het Google erom te doen was, lanceerden ze een half jaar later Desktop Search waarmee je je complete hard drive kunt laten indexeren en doorzoeken. In de eerste versie van deze applicatie was er geen rekening mee gehouden dat verschillende mensen gebruik konden maken van één computer waarop Desktop Search was geïnstalleerd. Gevolg was dat je zomaar documenten van andere gebruikers kon openen. Op dit moment is deze bug overigens verholpen en is GDS een handige tool om binnen een seconde een document terug te vinden.
Hoe dan ook: de introductie van Gmail en Desktop Search heeft ertoe geleid dat het bedrijf sindsdien uitermate kritisch wordt gevolgd als het gaat om privacy.


Zoektermen van pornocriminelen
John Battelle zegt over het verband tussen search en privacy: "Thanks to search, we must confront one of the most significant and difficult issues a democracy can face: the balance between a citizen's right to privacy and someone's - be it a corporation, a government, or another citizen - right to know. Deze opmerking is begin 2006 wel erg actueel geworden. In Amerika weigert Google pertinent om zoektermen af te staan aan de Amerikaanse minister van Justitie. De minister had om deze gegevens gevraagd om pornocriminelen op te kunnen sporen. De advocaat van Google zegt dat het verzoek is geweigerd omdat de privacy van zoekende burgers in het geding is, maar volgens de New York Times is Google vooral als de dood dat de overheid inzicht krijgt in hun bedrijfsgeheimen. De zaak krijgt op 27 februari 2006 een vervolg; dan dient de rechtzaak van de Amerikaanse overheid versus Google.


De China kwestie
Aan de ene kant van de wereld weigert Google dus om zoektermen af te staan, terwijl eind januari 2006 bekend is geworden dat Google meewerkt aan het censureren van informatie in China. Andere search giganten als Yahoo en Microsoft werken al langer mee aan het censureren van voor de Chinese overheid schadelijke berichten. Dus je zou je kunnen afvragen waar iedereen zich zo druk over maakt. Dat heeft alles te maken met Google's motto: Don't be evil. John Battelle schrijft: "Google has one question on his mind: how can we go into China and yet not be evil".


Het blijkt dat het bedrijf daar geen bevredigend antwoord op heeft kunnen formuleren, want de storm is losgebarsten. Je kunt geen medium raadplegen of je vindt er een artikel over Google's China kwestie. Het NRC schrijft dat mensenrechtenorganisaties vinden dat er een knieval is gedaan voor het communistische regime waarbij waarden als vrijheid van meningsuiting en persvrijheid worden opgeofferd voor economisch gewin. Men redeneert bovendien dat het censureren van zoekresultaten mogelijk een precedent schept. Want als er concessie worden gedaan aan China, waarom zouden er dan geen concessies worden gedaan aan andere landen of misschien zelfs aan bedrijven.

Toezicht
Hoe dan ook: privacy blijft een gevoelig onderwerp voor Google. Planet heeft onlangs een poll gelanceerd waarbij je kunt stemmen of je vindt dat Google in de gaten moet worden gehouden door instanties als de OPTA of de Europese Commissie. De meningen zijn verdeeld.
Nog afgezien van de vraag of het wenselijk is, is het is ook de vraag of het wel praktisch haalbaar is. Stel je voor dat alle landen een aparte commissie zouden hebben om zoekdiensten te controleren. Als er al toezicht zou komen, dan zou dat waarschijnlijk in een mondiale commissie moeten plaatsvinden. Het lijkt nu onwaarschijnlijk dat die er (snel) gaat komen, maar de toekomst zal het uitwijzen.


Privacy is en blijft een principe van vertrouwen. En iedereen moet voor zichzelf bepalen of hij vertrouwen heeft in partijen als Google, Yahoo en Microsoft.

De toekomst van Search
Alvorens in te gaan op de toekomst van Google, is het interessant om eerst nader te kijken naar Google's missie. In 2001 formuleerde Google zijn missie als volgt: "To organize the world's information and make it universally accessible and useful." Nou als dat geen BHAG (Big Hairy Ambitious Goal) is! Neem alleen al het begrip informatie. Dat kan echt alles zijn: van tekst en muziek tot afbeeldingen en video's. En niet alleen wil Google deze informatie organiseren en beschikbaar maken, het moet ook nog eens bruikbaar zijn. In de toekomst zal blijken in hoeverre Google dit doel zal weten te realiseren.


John Battelle schetst een aantal fascinerende scenario's. Wat hem betreft is the sky duidelijk the limit. Welkom is de wereld van de onbegrensde mogelijkheden die Search heet.

Real-time informatie beschikbaar bij offline aankoop
Dit scenario laat zich het beste uitleggen aan de hand van een voorbeeld. Stel je voor dat je in de V&D op de boekafdeling staat met in je handen een boek van Jamie Oliver. Je twijfelt of je het gaat kopen, want je vindt het aan de dure kant. Daarom pak je je mobiele telefoon met geïntegreerde Universal Product Code (UPC) infrarood scanner en je scant de barcode van het boek. Op je telefoon verschijnt de gemiddelde prijs van het boek. Daarnaast zie je een lijstje met links naar de prijs van het boek in nabijgelegen winkels, een link naar recensies van het kookboek en je kunt ook nog kiezen voor een lijst met winkels die gelijksoortige boeken verkopen. Je klikt door en ziet dat het boek bij de Bruna ? 2,50 goedkoper is, dus je besluit het daar te reserveren. Vervolgens loop je aan het einde van de dag (je wilt niet de hele middag met het boek sjouwen) op je gemak naar de Bruna om het boek af te rekenen.


In de virtuele wereld zijn vergelijkingssites immens populair. Waarom zou je dit principes niet in de 'echte' wereld kunnen toepassen, redeneert Battelle. Inderdaad: waarom niet? Consumenten zullen er absoluut vóór zijn. Maar het valt te verwachten dat winkeliers niet staan te springen. Ze zouden hun complete inventaris openbaar en beschikbaar moeten maken voor webdiensten. Wat dit voor gevolgen heeft, heb je kunnen zien in de makelaardij. Waarom zou je een makelaar inschakelen om een huis te zoeken als je gratis Funda, DIMO en VBO tot je beschikking hebt?

Behalve de voor de hand liggende bezwaren van winkeliers, zijn er behoorlijk wat technische beperkingen. Zo moeten infrarood barcode scanners bruikbaar worden via telefoons. En zoekdiensten zouden applicaties moeten ontwikkelen die real-time de link leggen tussen de barcodes en de inventaris van winkeliers. Aan deze voorwaarden wordt (nog) niet voldaan, maar door de recente ontwikkelingen in de local en mobile search, komt het steeds dichterbij.

The Google grid
Volgens Battelle zou alles wat van waarde is in de Google index moeten worden opgenomen. Hij stelt zichzelf vervolgens de vraag: wat gebeurt er als de hele wereld de index wordt. Veel experts geloven dat we in de nabije toekomst alles wat kan worden gedigitaliseerd, waaronder muziek, foto's, werkdocumenten, video's en e-mails, zullen opslaan in een massief platform: de Google grid. Het klinkt misschien utopisch, maar in feite worden Google en zijn concurrenten steeds meer een platform. Denk bijvoorbeeld aan Desktop Search, Gmail, Google Maps en Google News.


Onlangs werd bekend dat Google de telefoniemarkt opgaat. En vergeet ook niet de samenwerking tussen Sun (van Open Office) en Google. Naar verwachting is het kwestie van tijd voordat je via Google met een tekstverwerkingsprogramma kunt werken. Google als telefoniebedrijf, als softwareleverancier, als muziekaanbieder, als online bibliotheek, als nieuwsdienst? De mogelijkheden lijken onbeperkt.

RFID
Stel je voor dat je je hond, je kind, je portemonnee, je telefoon of je auto zou kunnen googelen. Dat klinkt misschien absurd, maar met behulp van RFID (Radio Frequency Identification) zou het in principe mogelijk moeten zijn. Aan praktisch alle tastbare dingen kun je een chip bevestigen en met behulp van radio frequenties die in de toekomst door Google geïnterpreteerd zouden moeten kunnen worden, zou je de aanwezigheid en de locatie van iets kunnen herleiden.


Wikipedia geeft een voorbeeld van hoe RFID (los van een zoekdienst) wordt toegepast: in Manhattan heeft Prada in zijn winkel alle streepjescode vervangen door RFID-tags. Dit heeft het voordeel dat winkelpersoneel met een handheld computer kan kijken of een bepaalde kleur of maat nog in voorraad is. Daarnaast kunnen klanten in het pashokje, waar een touchscreen computer staat, meer informatie vinden over onder andere de gebruikte materialen, maar ook over bijpassende kledingstukken. En in combinatie met een klantenkaart zijn de aankopen van de klant bij te houden, zodat de beste klanten en hun voorkeuren herkend kunnen worden zodat zowel marketing als winkelaanbod daar op afgestemd kunnen worden.

Dit voorbeeld klinkt mij als muziek in de oren. Maar of we nou kinderen moeten gaan googelen?Nog afgezien van de vraag of het daadwerkelijk technisch mogelijk is, is het de vraag of dit ethisch verantwoord is.

Perfect Search
Door de continue stroom van innovaties zou je haast denken dat search het einde van zijn capaciteit heeft bereikt. Niets is minder waar. Experts zijn het erover eens dat pas 5% van het search probleem is opgelost. We zijn mijlen ver verwijderd van de perfecte zoekdienst. Een perfecte zoekdienst zou jouw perfecte antwoord geven op elke willekeurige vraag die je stelt. Het antwoord kan dus voor iedereen verschillend zijn afhankelijk van je interesses, voorkeuren en eerdere vragen.


Archief
In deze tijd worden er dagelijks meer documenten gecreëerd dan in andere tijden in een week, een maand of een jaar. Wat gebeurt er met al deze documenten? Tot voor kort werden ze niet (structureel) bewaard. Maar onlangs werd aangekondigd dat de Europese versie van het Internet Archive van start gaat met een enorm archief van internetcontent. Op het adres Europarchive.org is sinds kort een digitaal archief van de meest waardevolle internetcontent van Europa te vinden. John Battelle voorspelt dat het niet lang zal duren voordat we een tijdsspanne kunnen toevoegen aan een query. Dus bijvoorbeeld: 'Koningin Beatrix 1981-2000'


Battelle sluit zijn boek af met de woorden dat een perfecte zoekmachine er misschien wel nooit zal komen, maar dat de zoektocht er naartoe zeker interessant is. En daar sluit ik me van harte bij aan.

Als je meer wilt lezen, raad ik je het boek 'The Search. How Google and Its Rivals Rewrote the Rules of Business and Transformed Our Culture' van John Battelle van harte aan. Ook zijn weblog is de moeite waard.

bron: Emke Mol (Checkit) op Molblog


Checkit B.V. | © 1999-2010 | T (024) 359 37 70 | info@checkit.nl | Sitemap | Clipit