Nyt tämä kysymys voidaan helposti vastata 5000 sanaa. Kirjoja on kirjoitettu tästä aiheesta. Mutta kohta on, joka haluaa tietää syvällä? Tärkeää on joitakin mielenkiintoisia faktoja yllättää ystäväsi. On kaunis salama, joka kuvaa google työprosessin. [Jos haluat nähdä, klikkaa tästä] salama antaa kesäinen koko kirjan 2 minuutin audiovisuaalisen entity.Really mielenkiintoista nähdä. Jos et ole kiinnostunut oppimaan miten Google luo indeksin ja asiakirjojen tietokanta että se pääsee käsiteltäessä kyselyn, ohita tämä kuvaus.
Google toimii hajautetun verkon tuhansia edullisia tietokoneita ja voivat sen vuoksi toteuttaa nopeasti rinnakkaisen käsittelyn. Rinnakkainen käsittely on menetelmä laskenta, johon monet laskelmia voidaan suorittaa samanaikaisesti, nopeuttaa merkittävästi tietojenkäsittely. Google on kolme erillistä osaa: 1. Googlebot, web crawler, joka etsii ja hakee web-sivuja. 2. indeksointi lajittelee jokainen sana joka sivulla ja tallentaa tuloksena indeksi sanojen valtava tietokanta. 3. kyselyn suoritin, joka vertaa haun kyselyn indeksi ja suosittelee asiakirjat, joita se pitää asiaan.
Otetaanpa tarkemmin kunkin osan. 1. Googlebot, Googlen web crawler Googlebot on Googlen web indeksoinnin robotti, joka etsii ja hakee verkkosivuja ja kädet ne pois Googlen indeksointitoiminnolle. On helppo kuvitella Googlebotille kuin pikku hämähäkki scurrying yli säikeet kyberavaruudessa, mutta todellisuudessa Googlebot ei kulkea Web ollenkaan. Se toimii aivan kuten selaimen, lähettämällä pyynnön web-palvelin sivun, ladata koko sivu, sitten siirtää ne pois Googlen indeksointitoiminnolle.
Googlebot koostuu monista tietokoneita pyytävän ja hakemalla sivuja paljon nopeammin kuin voit kanssa selaimella. Itse asiassa, Googlebot voi pyytää tuhansia eri sivuja samanaikaisesti. Välttää ylivoimainen web-palvelimia, tai syrjäyttää pyyntöjä ihmisen käyttäjille, Googlebot tarkoituksellisesti tekee pyyntöjä kunkin yksittäisen web-palvelimen hitaammin kuin se pystyy tekemään. Googlebot etsii sivuja kahdella tavalla: läpi Lisää linkki muodossa, www.google.com/addurl.html, ja kautta löytää linkit indeksointi web.
Valitettavasti roskapostittajat tajunnut, miten luoda automatisoitu botit että pommitetaan Lisää linkki muodossa miljoonia URL osoittaa kaupallinen propagandaa. Google kiistää nämä URL-osoitteita, joita esitetään sen Lisää URL-osoite muodossa, että se epäilee yrittävät pettää käyttäjille käyttämällä taktiikoita kuten myös piilotettua tekstiä tai linkkejä sivulla, täyt