þekking Discovery
/ Knowledge Discovery >> þekking Discovery >> tækni >> tölva >> internet >> internet Basics >>

Hvernig Internet Search Engines Work

hvort orðið var notað í mikilvægur eða léttvæg hátt á síðunni, hvort orðið var notað einu sinni eða oft eða hvort síðunnar sem tengla á aðrar síður sem innihalda orðið. Með öðrum orðum, það væri engin leið til að byggja á röðun lista sem reynir að kynna mest gagnlegur síður efst á lista yfir leitarniðurstöður.

Til að gera fyrir fleiri gagnlegar niðurstöður flestar leitarvélar geyma fleiri en bara orð og vefslóð. Hreyfill gæti geyma fjölda skipta sem orðið birtist á síðunni. Vélin gæti úthluta vægi hverrar færslu, með vaxandi gildum sem við orð eins og þeir birtast ofarlega í skjalinu, í staðinn fyrir einhvern-liðum, í tenglum, í Meta tags eða í hausnum á síðunni. Hver auglýsing leitarvél hefur aðra uppskrift fyrir úthlutun vægi orða í safni sínu. Þetta er ein af ástæðum þess að leit að sama orð á mismunandi leitarvélum mun framleiða mismunandi lista, með þeim síðum sem í mismunandi skipanir.

Óháð nákvæma samsetningu fleiri stykki af upplýsingar eru geymdar með því að leita vél, gögn munu vera umrita í dulmál til að spara geymslurými. Til dæmis, upprunalega Google grein lýsir með 2 bæti, af 8 bita hver, til að geyma upplýsingar á vægi - hvort orðið var eignfærð, leturstærð, stöðu og aðrar upplýsingar til þess að hjálpa við röðun högg. Hver þáttur gæti tekið upp 2 eða 3 bita innan 2-bæti hópar (8 bitar = 1 bæti). Þess vegna er mikið af upplýsingum er hægt að geyma í mjög samningur formi. Eftir að upplýsingar er samningur, það er tilbúið fyrir flokkun

Vísitala hefur einn tilgang:. Það gerir upplýsingar til að finna eins fljótt og auðið er. There ert heilmikill fáir leiðir fyrir vísitölu til að byggja, en einn af the árangursríkur lifnaðarhættir er til að byggja kjötkássa borð. Í hass, uppskrift er beitt til að hengja tölugildi að hvert orð. Sem formúlan er hannað til að jafnt dreifa færslur yfir fyrirfram ákveðinn fjölda sviða. Þetta tölulegar dreifing er frábrugðin dreifingu orð yfir stafrófinu, og það er lykillinn að árangri kjötkássa töflunni.

Í ensku, eru sumir stafir sem byrja mörg orð, en aðrir byrja færri. Þú munt finna, til dæmis, að " M " hluta orðabókinni er miklu þykkari en " X " kafla. Þetta inequity þýðir að finna orð sem byrja á mjög " vinsæll " bréf gæti tekið mun lengri tíma en að finna orð sem byrjar með minna vinsæll einn. Hökkun Aftansöngur út mismuninn, og dregur að meðaltali tími sem það tekur að finna færslu. Það skilur líka vísitölunnar frá raunverulegum færslu. Kjö

Page [1] [2] [3] [4] [5] [6]