“94 procent van het internet is niet interessant”

Google indexeert groot deel niet

Google heeft vastgesteld dat er inmiddels meer dan een biljoen (dat is 1000 miljard) pagina’s op het internet zijn. Maar in tegenstelling tot wat veel websites schrijven, heeft Google niet alle pagina’s volledig in haar zoekindex staan. Volgens schattingen zou Google op dit moment de hele content van maar 60 miljard pagina’s echt doorzoeken bij een zoekopdracht. Dat zou betekenen dat 94 procent van het internet niet interessant is. En dat lijkt geen slechte schatting.

De belangrijkste reden waarom Google slechts een klein deel van alle urls doorzoekt, is waarschijnlijk spam. Een groot deel van de pagina’s op het internet bevat content die gebouwd is om zoekmachines te misleiden, de content is oud en onjuist, of de site bevat eenvoudigweg gekopieerde content.

Door het aantal gespiderde websites te beperken, wil Google ervoor zorgen dat gebruikers zo weinig mogelijk “rommel” voorgeschoteld krijgen. Maar ook kosten spelen een rol. Het doorlopend indexeren van miljarden pagina’s kost gigantische bedragen. Er zijn inmiddels enkele nieuwe startups die stellen tegen veel lagere kosten websites te kunnen indexeren. Een van hen zou de komende periode gelanceerd worden.

Het zou namelijk zo zijn dat Cuill.com (of is het nu toch cuil.com) gelanceerd gaat worden deze week. De site is nu nog leeg, maar het bedrijf heeft al tientallen miljoenen aan venture capital opgehaald. Cuill.com stelt dat het bedrijf tegen tien procent van de kosten van Google het web kan indexeren.

Plaats jouw banner bij dit artikel
Hyped.nl via:


Alex Zelf Beleggen
Gemakkelijk beleggen
BinckCompleet
Lage transparante tarieven

Online marketing blog

Reacties

Reageer

Reageren is niet mogelijk op dit bericht.