Leitarvél

frá Wikipedia, ókeypis alfræðiorðabókinni
Fara í siglingar Fara í leit

Leitarvél er forrit til að rannsaka skjöl sem eru geymd í tölvu eða tölvuneti eins og t.d. B. veraldarvefurinn er geymdur. Eftir að búið er að búa til leitarfyrirspurn, oft með því að slá inn leitarorð í texta, veitir leitarvél lista yfir tilvísanir í hugsanlega viðeigandi skjöl, venjulega sýnd með titli og stuttu broti af viðkomandi skjali. Hægt er að nota ýmsar leitaraðferðir við þetta.

Helstu þættir eða ábyrgðarsvið leitarvélar eru:

  • Búa til og viðhalda vísitölu ( gagnagerð með upplýsingum um skjöl),
  • Vinnsla leitarfyrirspurna (finna og raða niðurstöðum) og
  • Undirbúningur niðurstaðna á sem merkilegastan hátt.

Að jafnaði er aflað gagna sjálfkrafa, á internetinu með vefskriðlum , á einni tölvu með því að lesa reglulega allar skrár í notendaskráðum möppum í staðbundnu skráakerfi .

eiginleikar

Leitarvélar eru metamiðlar sem finna sérstaklega og fá aðgang að efni annarra miðla. Hægt er að flokka þau eftir fjölda einkenna. Eftirfarandi eiginleikar eru að miklu leyti sjálfstæðir. Við hönnun leitarvélar getur maður því valið einn valkost úr hverjum hópi einkenna án þess að þetta hafi áhrif á val á hinum eiginleikunum.

Tegund gagna

Mismunandi leitarvélar geta leitað mismunandi gerða gagna. Í fyrsta lagi má skipta þessum gróflega í „skjalategundir“ eins og texta, mynd, hljóð, myndband og fleira. Niðurstöðusíður eru hannaðar eftir þessum flokki. Þegar þú leitar að skjöl texta, texta brot sem inniheldur leitarorð er yfirleitt birt (oft kallað runu ). Myndaleitarvélar sýna smámynd af samsvarandi myndum. Leitarvél fólks finnur opinberar upplýsingar um nöfn og fólk sem birtast sem listi yfir krækjur. Önnur sérhæfð tegundir af leitarvélum eru starf leitarvélum , iðnaður leit eða vöru leitarvélar. Þeir síðarnefndu eru fyrst og fremst notaðir til samanburðar á verðlagi á netinu, en einnig eru staðbundnar tilboðsleitir sem birta vörur og tilboð frá kyrrstæðum smásala á netinu.

Önnur fínari sundurliðun fjallar um gagnasérhæfða eiginleika sem ekki eru deilt með öllum skjölum innan flokks. Ef þú heldur þig við dæmatextann geturðu leitað að ákveðnum höfundum fyrir Usenet greinar, eftir vefsíðum í HTML sniði fyrir titil skjalsins.

Það fer eftir gagnategundinni, takmörkun á undirmengi allra gagna af gerðinni er möguleg sem frekari aðgerð . Þetta er almennt útfært með því að nota viðbótar leitarfæribreytur sem sía leitarniðurstöðuna, til dæmis með ákveðnum búlískum tjáningum ( OG , EÐA , EKKI ), í samræmi við tiltekið tungumál, tiltekið land, ákveðið tímabil, ákveðið skráarsnið osfrv. Frá skráð gögn. Að öðrum kosti getur leitarvél takmarkað sig við að innihalda aðeins viðeigandi skjöl frá upphafi. Dæmi eru leitarvél fyrir vefrit (í stað alls vefsins) eða leitarvélar sem vinna aðeins skjöl frá háskólum, eða aðeins skjöl frá tilteknu landi, á tilteknu tungumáli eða á ákveðnu skráasniði.

Gagnaheimild

Annað einkenni flokkunar er uppspretta þess sem gögnin sem leitarvélin safnar koma frá. Oftast lýsir nafn leitarvélargerðarinnar þegar uppruna.

  • Vefleitaleitarvélar safna skjölum frá veraldarvefnum,
  • lóðréttar leitarvélar horfa á valið svæði veraldarvefsins og safna aðeins vefskjölum um tiltekið efni eins og fótbolta, heilsu eða lög.
  • Usenet leitarvélaframlög frá alþjóðlegum Usenet umræðu miðli .
  • Innra netleitarvélar eru takmarkaðar við tölvurnar á innra neti fyrirtækis .
  • Enterprise leitarvélar gera miðlæga leit kleift með ýmsum gagnagjöfum innan fyrirtækis, svo sem B. skráarþjónar, wikis, gagnagrunna og innra net.
  • Skrifborðsleitarvélar eru forrit sem gera staðbundna gagnagrunninn á einni tölvu leitarhæfan. [1]

Ef gagnaöflun er framkvæmd handvirkt með skráningu eða af ritstjórum, talar maður um verslun eða skrá . Í slíkum möppum eins og Open Directory Project eru skjölin skipulögð stigveldi í efnisyfirliti eftir efni.

framkvæmd

Þessi kafli lýsir mismun á framkvæmd rekstrar leitarvélarinnar.

Flokkun leitarvéla
Leitarvélarit de.svg
Vísitölutengd leitarvél
Meta-search-de.svg
Metasearch vél
Federated-search-de.svg
Sambands leitarvél


  • Mikilvægasti hópurinn nú á dögum eru vísitölutengdar leitarvélar . Þessir lesa í viðeigandi skjöl og búa til vísitölu. Þetta er gagnauppbygging sem er notuð í síðari leitarfyrirspurn. Ókosturinn er flókið viðhald og geymsla vísitölunnar, kosturinn er hröðun leitarferlisins. Algengasta form þessarar uppbyggingar er öfug vísitala . Tölvunarfræðingurinn Karen Spärck Jones , sem sameinaði tölfræði- og málvísindaferli, vann grunnundirbúningsvinnuna að þróuninni. [2]
  • Meta leitarvélar senda leitarfyrirspurnir samhliða nokkrum vísitölutengdum leitarvélum og sameina einstakar niðurstöður. Kosturinn er stærra gagnamagn og einfaldari útfærsla, þar sem enga vísitölu þarf að halda. Ókosturinn er tiltölulega langur tími sem það tekur að afgreiða beiðnina. Að auki hefur röðunin vafasamt gildi vegna hreins meirihluta. Gæði niðurstaðnanna geta lækkað í gæði verstu leitarvélarinnar sem könnuð var. Meta leitarvélar eru sérstaklega gagnlegar fyrir leitarskilyrði sem koma sjaldan fyrir.
  • Hybrid form eru einnig til. Þetta hefur sína eigin, oft tiltölulega litla, vísitölu, en þeir kanna einnig aðrar leitarvélar og sameina að lokum einstakar niðurstöður. Svokallaðar rauntíma leitarvélar hefja flokkunarferlið aðeins eftir fyrirspurn. Síðurnar sem finnast eru alltaf uppfærðar en gæði niðurstaðnanna eru léleg vegna skorts á breiðum gagnagrunni, sérstaklega með sjaldgæfari leitarorðum.
  • Dreifðar leitarvélar eða samtök leitarvélar eru tiltölulega ný nálgun. Leitarfyrirspurn er send áfram til fjölda einstakra tölvna sem hver um sig rekur sína eigin leitarvél og niðurstöðurnar eru sameinaðar. Kosturinn er hátt öryggi gegn bilun vegna dreifingarinnar og - allt eftir sjónarmiði þínu - skortur á getu til að ritskoða miðlægt. Hins vegar er erfitt að leysa röðunina , það er að segja flokkun þeirra skjala sem henta í grundvallaratriðum í samræmi við mikilvægi þeirra fyrir fyrirspurnina.
  • Sérstök tegund dreifðra leitarvéla eru þær sem byggjast á jafningi-til-jafningi reglunni sem byggir dreifða vísitölu. Á hverjum þessara jafningja geta óháðir skreiðar ritskoðað ónæmt þá hluta vefsins sem viðkomandi jafningi rekstraraðili skilgreinir með einföldum staðbundnum stillingum. Þekktasta kerfið, auk sumra aðallega fræðilegra verkefna (t.d. Minerva), er YaCy hugbúnaðurinn, sem er ókeypis undir GNU-GPL.

Túlkun á inntakinu

A leitarorði notandans er túlkuð á undan sjálfum leit og setja í form sem er skiljanlegt fyrir innbyrðis notaðar leitarsíðum reiknirit . Þetta þjónar því að halda setningafræði beiðninnar eins einföldum og mögulegt er og samt leyfa flóknar beiðnir. Margir leitarvélar styðja rökrétta tengingu ýmissa leitarorða með því að nota búlska símafyrirtæki og nákvæma leit að einu eða fleiri orðum innan gæsalappa . [3] Þetta gerir það mögulegt að finna vefsíður sem innihalda ákveðin hugtök en ekki önnur.

Nýlegri þróun er hæfni fjölda leitarvéla til að þróa óbeint tiltækar upplýsingar úr samhengi leitarfyrirspurnarinnar sjálfrar og einnig að meta þær. Þannig getur dregið úr tvíræðni leitarfyrirspurnarinnar sem venjulega er til staðar þegar um ófullnægjandi leitarfyrirspurnir er að ræða og hægt er að auka mikilvægi leitarniðurstaðna (þ.e. samsvörun við meðvitaðar eða ómeðvitaðar væntingar leitaraðila). Af merkingarfræðilegum líkingum innritaðra leitarskilmála (sjá einnig: Merkingarfræðileg leit ) er ályktað ein eða fleiri undirliggjandi merkingar fyrirspurnarinnar. Niðurstöðusamsetningin er stækkuð til að innihalda smell á merkingartengd leitarorð sem eru ekki beinlínis sett inn í fyrirspurnina. Að jafnaði leiðir þetta ekki aðeins til magntækrar endurbóta, heldur einnig, sérstaklega þegar um er að ræða ófullnægjandi fyrirspurnir og ekki kjörin leitarskilyrði, til eigindlegrar endurbóta (mikilvægi) niðurstaðna vegna þess að leitaráform, sem í þessum tilvikum eru frekar óskýr af leitarorðum, afleiðing af tölfræðilegum aðferðum sem leitarvélar nota eru afritaðar furðu vel í reynd. (Sjá einnig: merkingarfræðileg leitarvél og duld merkingarfræðileg flokkun ).

Upplýsingar sem eru ósýnilega veittar (staðsetningarupplýsingar og aðrar upplýsingar, ef um er að ræða fyrirspurnir frá farsímakerfinu) eða ályktað „merkingarstillingar“ úr vistaðri leitarferli notandans eru frekari dæmi um að ekki sé skýrt tilgreint í leitarorðum sem nokkrir hafa slegið inn leitarvélar til að breyta og bæta niðurstöður upplýsingar sem notaðar eru.

Það eru líka til leitarvélar sem aðeins er hægt að spyrja eftir með ströngum formlegum fyrirspurnartungum , en sem geta venjulega líka svarað mjög flóknum fyrirspurnum mjög nákvæmlega.

Hæfni leitarvéla sem hingað til hefur aðeins verið framkvæmanleg í grunnatriðum eða á takmörkuðum grundvelli upplýsinga er hæfileikinn til að vinna úr náttúrulegum og óskýrum leitarfyrirspurnum. (Sjá einnig: merkingarfræðilegur vefur ).

Vandamál

tvískinnungur

Leitarfyrirspurnir eru oft ónákvæmar. Leitarvélin getur ekki sjálf ákveðið hvort hún ætlar að leita að vörubíl eða vondan vana þegar kemur að hugtakinu vörubíll ( merkingarfræðileg réttindi). Aftur á móti ætti leitarvélin ekki að krefjast of þrjósks um hugtakið sem slegið er inn. Þú ættir líka að gefa samheiti til kynna að hugtakið tölva Linux finnur einnig síður sem innihalda orðið tölva í stað tölvunnar.

málfræði

Margir mögulegir smellir tapast vegna þess að notandinn er að leita að tilteknu málfræðilegu formi leitarorðs. Leit að hugtakinu bíll mun finna allar síður í leitarvísitölunni sem innihalda þetta hugtak, en ekki þær sem eru með hugtakið bílar . Sumar leitarvélar leyfa leit með villikortum , sem hægt er að forðast að hluta til með þessu vandamáli (t.d. leitarfyrirspurn bíll * tekur einnig tillit til hugtaks bíla eða sjálfvirkni ), en notandinn verður einnig að þekkja möguleikann. Stemming er einnig oft notuð, þar sem orð eru minnkuð í grunnstam. Svo annars vegar er fyrirspurn eftir svipuðum orðmyndum möguleg (fallegt blóm er svo fallegra blóm), einnig fækkar hugtökum í vísitölunni. Hægt er að bæta upp gallana við stafsetningu með málfræðilegri leit þar sem öll orðafbrigði eru mynduð. Annar möguleiki er að nota tölfræðilegar aðferðir sem leitarvélin getur unnið úr fyrirspurninni z. B. með birtingu ýmissa tengdra hugtaka á vefsíðum til að meta hvort leit að bílaviðgerðum gæti einnig hafa þýtt leit að sjálfvirkri viðgerð eða sjálfvirkni viðgerð .

Greinarmerki

Ekki er hægt að leita að tæknilegum hugtökum og vöruheitum þar sem eiginnöfn innihalda greinarmerki (t.d. vefþjónusta Apple .Mac eða C / net) með algengum leitarvélum. Undantekningar hafa aðeins verið gerðar fyrir nokkur mjög algeng hugtök (td. Net, C #eða C ++). [4]

Magn gagna

Upplýsingamagnið vex oft mjög hratt. Stór gögn fjalla um gagnamagn sem er of stórt, of flókið, of hratt eða of veikt uppbyggt til að hægt sé að meta það með handvirkum og hefðbundnum gagnavinnsluaðferðum.

Aktuality

Mörg skjöl eru uppfærð oft, sem neyðir leitarvélar til að endurmerkja þessar síður aftur og aftur samkvæmt skilgreindum reglum. Þetta er einnig nauðsynlegt til að þekkja skjöl sem hafa verið fjarlægð úr gagnagrunninum á meðan og bjóða þau ekki lengur í kjölfarið.

tækni

Að útfæra leit á mjög miklu magni gagna þannig að framboð sé mikið (þrátt fyrir vélbúnaðarbilun og netflöskuhálsa) og viðbragðstími lítill (þó að oft sé nauðsynlegt að lesa og vinna úr nokkrum 100 MB af vísitölugögnum fyrir hverja leitarfyrirspurn), staði miklar kröfur til leitarvélarinnar. Kerfi verða að hanna mjög óþarflega , annars vegar á tölvunum á staðnum í gagnaveri, hins vegar ættu að vera fleiri en ein gagnaver sem bjóða upp á alla virkni leitarvéla.

Leitarvélar á vefnum

Leitarvélar á netinu eiga uppruna sinn í upplýsingasóknarkerfum . Gögnin eru fengin af vefskriðara viðkomandi leitarvélar eins og Googlebot . Um þriðjungur allra leitar á Netinu varðar fólk og starfsemi þess. [5]

Leitarhegðun

Hægt er að flokka leitarfyrirspurnir á mismunandi vegu. [6] [7] Í markaðssetningu á netinu og leitarvélabestun ( leitarvélamarkaðssetning ) gegnir þessi flokkun hlutverki [8] [9] .

Leiðbeiningar sem miða að siglingum
Þegar leitað er að siglingar leitar notandinn sérstaklega að síðum sem hann þekkir þegar eða telur að séu til. Upplýsingarþörf notandans er fullnægt eftir að hafa fundið síðuna.
Upplýsingamiðaðar leitarfyrirspurnir
Þegar um er að ræða fyrirspurnir er notandinn að leita að miklum fjölda upplýsinga um tiltekið efni. Leitinni er lokið þegar upplýsingarnar berast. Yfirleitt er ekki unnið frekar með notuðu síðurnar.
Viðskiptamiðaðar leitarfyrirspurnir (eða auglýsingaleitarfyrirspurnir)
Ef um er að ræða viðskiptafyrirspurnir leitar notandinn að vefsíðum sem hann ætlar að vinna með. Þetta eru til dæmis netverslanir, spjall o.s.frv.
Fyrirspurn áður en þú kaupir
Til dæmis leitar notandinn sérstaklega að prófunarskýrslum eða umsögnum um tilteknar vörur, en er ekki enn að leita að sérstökum tilboðum á vöru.
Aðgerðarmiðuð leit
Með leitarfyrirspurn sinni gefur notandinn merki um að hann vilji gera eitthvað (hlaða niður einhverju eða horfa á myndband).

Kynning á niðurstöðunum

Síðunni þar sem leitarniðurstöður birtast notandanum (stundum einnig nefndur leitarniðurstöðusíða , eða SERP í stuttu máli) er skipt (oft einnig staðbundið) í mörgum vefleitarvélum í Natural Listings og styrktaraðila krækjurnar . Þó að þeir síðarnefndu séu aðeins innifalin í leitarvísitölunni gegn greiðslu, í þeim fyrrnefndu eru allar vefsíður sem passa við leitarorðið. Til viðbótar við raunverulegar leitarniðurstöður sýna sumir veitendur notandanum önnur leitarorð sem passa við leitina.

Til þess að auðvelda notandanum að nota vefleitarvélarnar eru niðurstöður flokkaðar eftir mikilvægi ( aðalgrein: röðun leitarvéla ), en hver leitarvél notar sínar eigin, aðallega leynilegar, forsendur. Þetta felur í sér:

  • Grunnmerking merkis skjals, mæld með krækjuuppbyggingu, gæðum vísandi skjala og texta í tilvísunum.
  • Tíðni og staðsetning leitarskilmála í viðkomandi skjali fannst.
  • Gildissvið og gæði skjalsins.
  • Flokkun og fjöldi skjala sem vitnað er til.

Sjá einnig: Reglugerð til að stuðla að sanngirni og gagnsæi miðlun á netinu og leitarvélum Evrópusambandsins á netinu .

Vandamál

Lögmál

Vefleitaleitarvélar eru að mestu reknar á alþjóðavettvangi og bjóða þannig notendum upp á niðurstöður frá netþjónum í öðrum löndum. Þar sem lög mismunandi landa hafa mismunandi skilning á því hvaða efni er leyft verða stjórnendur leitarvéla oft undir þrýstingi um að útiloka ákveðnar síður frá niðurstöðum sínum. Til dæmis, frá árinu 2006, hafa markaðsleiðandi vefleitarvélar ekki sýnt neinar vefsíður sem smell fyrir leitarfyrirspurnir frá Þýskalandi sem hafa verið flokkaðar sem skaðlegar fyrir ungt fólk af sambandseftirlitinu fyrir fjölmiðla sem er skaðlegt ungu fólki. Þessi venja fer fram sjálfviljug af hálfu leitarvélarinnar sem sjálfvirkt ferli (síueining) innan ramma sjálfviljugrar sjálfstjórnar margmiðlunarþjónustuveitenda .

Aktuality

Að hlaða reglulega niður milljörðum skjala sem leitarvél hefur í vísitölunni gerir miklar kröfur til netauðlinda ( umferðar ) leitarvélastjórans.

Ruslpóstur

Með leitarvél ruslpósti reyna sumir rekstraraðilar vefsíðna að sniðganga röðunarreiknirit leitarvélarinnar til að fá betri röðun fyrir tilteknar leitarfyrirspurnir. Þetta skaðar bæði rekstraraðila leitarvélarinnar og viðskiptavini þeirra þar sem viðeigandi skjöl birtast ekki lengur fyrst.

gagnavernd

Gagnavernd er sérstaklega viðkvæmt mál hjá fólks leitarvél. Þegar leit að nafni er hafin frá leitarvél fólks, varða niðurstöður leitarinnar aðeins gögn sem eru almennt aðgengileg. Þessi gögn eru aðgengileg almenningi án þess að þurfa að skrá sig hjá þjónustu eða þess háttar, jafnvel án leitarvélarinnar. Fólk leitarvélin sjálf hefur engar eigin upplýsingar, hún veitir aðeins aðgang að þeim. Leiðréttingar eða eyðingar verða að vera gerðar við viðkomandi upprunalega heimild. [10] Frekari lögfræðilegar spurningar vakna varðandi birtingu gagna með sjálfvirkri útfyllingu (sjá lagalega stöðu í Þýskalandi ).

umhverfisvernd

Þar sem hver leitarfyrirspurn eyðir (netþjóni) rafmagni eru til veitendur (svokallaðar „ grænar leitarvélar “) sem treysta á CO 2 -bætur eða sparnaðaraðgerðir (t.d. gróðursetningu trjáa, skógrækt skógar).

Markaðshlutdeild

Þýskalandi

Eftirnafn Hlutdeild leitarfyrirspurna í Þýskalandi í febrúar 2021 [11] prósent
Google
90,47%
Bing
6,14%
Ecosia (notar Bing)
1,07%
DuckDuckGo
0,88%
Yahoo! (notar Bing) [12]
0,7%
T-Online (notar Google)
0,23%
Aðrir (t.d. Egerin )
0,51%

Um allan heim

Eftirnafn Hlutdeild leitarfyrirspurna um allan heim í febrúar 2021 [13] prósent
Google
72,68%
Bing
11,94%
Baidu
11,72%
Yahoo! (notar Bing) [12]
1,81%
Yandex
0,80%
DuckDuckGo
0,56%
Naver
0,22%
Ecosia (notar Bing)
0,13%
Qwant
0,05%
AOL
0,04%
Annað
0,05%

Sjá einnig

bókmenntir

Vefsíðutenglar

Einstök sönnunargögn

  1. ^ Artur Hoffmann: Leitarvélar fyrir tölvur . Í: PC Professionell 2/2007, bls. 108ff.
  2. https://www.nytimes.com/2019/01/02/obituaries/karen-sparck-jones-overlooked.html
  3. Fínstilltu vefleit . Í geymslu frá frumritinu 27. nóvember 2020. Sótt 7. janúar 2021.
  4. Hjálp við leit Google
  5. Fólk leitarvélar: ummerki annarra á netinu . Í: Stern digital
  6. ^ Lewandowski, Dirk,: Web 2.0 þjónusta sem viðbót við reiknirit leitarvélar . Logos-Verl, Berlín 2008, ISBN 978-3-8325-1907-0 , bls.   57 .
  7. ^ Andrei Broder: Tegundafræði vefleitar . Í: ACM SIGIR Forum. Bindi 36, nr. 2, 2002, ISSN 0163-5840 , bls. 3-10, doi : 10.1145 / 792550.792552 .
  8. Tegundir leitarfyrirspurna (viðskipti / siglingar / upplýsingar) | Orðalisti fyrir innihaldsmarkaðssetningu. Í: textbroker.de. Opnað 1. júlí 2019 (þýska).
  9. ^ Vanessa Fox: Markaðssetning á tímum Google . John Wiley & Sons, 2012, bls.   67-68 .
  10. Yasni: Leitarvél fólks við upphaf basicthinking.de, 29. október 2007
  11. ^ Markaðshlutdeild leitarvéla Þýskaland. Opnað 2. mars 2021 .
  12. a b Golem.de: IT -fréttir fyrir sérfræðinga. Sótt 21. mars 2021 .
  13. ^ Markaðshlutdeild leitarvéla. Opnað 2. mars 2021 .