Uniform Resource Locator

frá Wikipedia, ókeypis alfræðiorðabókinni
Fara í siglingar Fara í leit

Uniform Resource Locator ( URL ; English for uniform resource bendir ) auðkennir og staðsetur auðlind, til dæmis vefsíðu , með aðgangsaðferðinni sem á að nota (til dæmis netkerfið sem er notað eins og HTTP eða FTP ) og staðsetningu auðlindarinnar í tölvunetum . Upprunalegi staðallinn var gefinn út sem RFC 1738 í desember 1994 og hefur síðan orðið úreltur vegna útgáfu nokkurra annarra RFC . Núverandi RFC eru (frá og með 2016):

  • RFC 3986 . - Uniform Resource Identifier (URI): Generic Syntax . (Enska).
  • RFC 4248 . - Telnet URI kerfið . (Enska).
  • RFC 4266 . - Gopher URI kerfið . (Enska).
  • RFC 6068 . - 'mailto' URI kerfið . (Enska).
  • RFC 6196 . - Póstþjónn fluttur: URI kerfi í sögulegt . (Enska).
  • RFC 6270 . - 'tn3270' URI kerfið . (Enska).

Vefslóðir eru undirtegund almennrar auðkenningarmerkingar með því að nota Uniform Resource Identifiers (URI). Þar sem vefslóðir eru fyrsta og algengasta gerð URI eru hugtökin oft notuð til skiptis . Sameiginlegt parlance eru vefslóðir einnig nefndur viðtakandi eða vefföng, [1] þar (eftir talmálstexta jöfnu Internet og WWW [2] ) einkum sértæk vefslóðir vefsíður eru ætlað.

smíði

Grunnuppbyggingin samanstendur af aðgangsaðferð fyrir vefslóð sem skilgreinir skemunafn (enskt fyrirætlun) og stef sem er sérstakur hluti (kerfisbundinn hluti), sem eru aðskildir með ristli:

 <scheme>: <scheme-specific-part>

þar sem scheme oft, en ekki endilega, er það sama og undirliggjandi netsamskiptareglur (þetta er til dæmis með ftp eða http , en ekki með mailto eða file ). [3]

Mögulegir vefslóðarhlutar eru til dæmis með http :

 | ------------------ Skema-sérstakur hluti ------------------ |

 https: // max: m[email protected]: 8080 / index.html? p1 = A & p2 = B # auðlind
 \ ___ / \ _ / \ ____ / \ _____________ / \ __ / \ _________ / \ _______ / \ _______ /
   | | | | | | | |
Skema⁺. Fyrirspurnabrot fyrir lykilorð gestgjafa höfn
       notandi

⁺ (hér sama og samskiptareglur)

á mailto :

 mailto: [email protected]
\ ____ / \ _____________ /
   | |
Skema⁺.
        Netfang samkvæmt RFC 5322

⁺ (engin samskiptareglur hér)

fyrir news (í þessu dæmi er hvorki netsamskiptareglur né vistfang innifalið):

 fréttir: alt.hypertext
 \ __ / \ ___________ /
   | |
Skema |
       Nafn fréttahóps

í file :

 skrá: /// skrá / undirskrá / skrá
 \ __ / \ ___________________________________ /
   | |
Skema |
       Slóð að staðbundinni skrá í skráarkerfi tölvunnar sem túlkar slóðina

Strangt til tekið er þetta kerfi með file://<host>/<path> , þó að gestgjafahlutinn sé nánast ekki notaður, þar sem file er varla notað vegna þess að það er engin leið til að tilgreina samskiptareglur fyrir aðgang að skrá er hægt að nota skynsamlega í gegnum net. [4] Skráarslóðir eru notaðar á Java forritunarmálinu, til dæmis til að fá aðgang að staðbundnum skrám með þessum hætti. [5] Það fer eftir vafranum að oft er aðeins hægt að opna file eftir sérstaka stillingu viðskiptavinarins eða með viðbótum osfrv. [6] [7]

Skema (kerfi)

Tilgreinir tæknilega aðferðina sem á að takast á við úrræðið. Er að mestu leyti, en ekki endilega, samhljóða netsamskiptareglunum sem notuð eru , sem hægt er að finna auðlindina fyrir. Dæmi eru HTTP , HTTPS eða FTP , en einnig mailto (til að skrifa tölvupóst) eða file (til að fá aðgang að staðbundnum skrám).

Skema-sérstakur hluti (kerfisbundinn hluti)

Það fer eftir fyrirætluninni að mismunandi sérstakar upplýsingar eru nauðsynlegar og mögulegar. Í flestum tilfellum byrjar það með stafstrengnum // , en í sumum afbrigðum er aðeins ristillinn skilgreindur. Eftirfarandi dæmi tengjast Hypertext Transfer Protocol (HTTP).

Notandi og lykilorð (notandi, lykilorð)

Ef þörf krefur geturðu skráð þig inn -Upplýsingar frá notanda (notanda) og lykilorð eru sendar (lykilorð) með. Þessir eru aðskildir frá hvor öðrum með ristli og forskeyti fyrir hýsilinn með aðskilnaðarmerki ( @ ).

Jafnvel þótt HTTP samskiptareglur væru valdar fyrir þetta dæmi, þá er tilgreining á notandanafni og lykilorði sem hluti af slóðinni ekki hluti af HTTP forskriftinni! [8] Núverandi vafrar samþykkja þessa setningafræði vefslóðar, en spyrðu notandann hvort hann vilji virkilega skrá sig inn með tilgreindum gögnum. Internet Explorer 6 (frá Windows XP SP2) og nýrri útgáfur falla úr venjulegu tilfelli hér með því að hafna þessari setningarfræði sléttar sem rangar. Með skráningarfærslu getur þú þvingað þá til að haga sér á sama hátt og forverar allt að útgáfu 5.5 sýna: Þeir taka yfir innskráningargögnin án þess að vera beðin og flytja þau beint á netþjóninn.

Með sumum öðrum samskiptareglum, svo sem FTP , er forskrift notendagagna á myndinni sem sýnd er fullkomlega rétt og fellur undir staðlana.

Gestgjafi

Gestgjafahlutinn er aðgreindur með punktum í formi IPv4 -tölu með aukastaf , í formi IPv6 -tölu í hexadecimal táknun með ristlum og settir innan hornklofa eða merktir í formi FQDN . [9]

höfn

Með því að tilgreina höfnina er hægt að stjórna TCP tengi . Ef engin höfn er tilgreind er staðlaða höfn viðkomandi samskiptareglna notuð - til dæmis með HTTP 80, með HTTPS 443 og með FTP 21.

Leið

Slóðin lýsir tiltekinni auðlind (þetta getur til dæmis fallið saman við möppuskipulag miðakerfisins, td skrá eða möppu) á netþjóninum . Slóðin getur líka verið tóm. Hægt er að skipta um tóma slóð með skástrik og hafa sömu merkingu. [3]

Túlkunin ( skrá eða skráasafn ; afhenda textaskrá eða framkvæma handrit ) er látið þjónninum eftir. Dæmigert dæmi um túlkunarfrelsi er hegðunin þegar viðskiptavinurinn /index.html / beðinn um það: Það fer eftir stillingu, miðlarinn gefur innihaldi skráar nafn (eins og /index.html , /README , /HEADER ) án þess að þetta sé nauðsynlegt fyrir biðjandi viðskiptavinarins. Hins vegar, allt eftir siðareglunum, getur netþjóninn einnig beinlínis sent áfram til þessarar auðlindar eða sent frá sér skráasafn.

Fyrirspurn (fyrirspurn)

Þegar um er að ræða HTTP er hægt að fylgja raunverulegri auðlindarbendlinum með fyrirspurnarstreng, aðskilinn með spurningarmerki . [10] Þetta þýðir að hægt er að senda viðbótarupplýsingar sem geta verið unnar frekar á miðlara eða viðskiptavinarhliðinni.

brot

Eftir kjötkássa er hægt að vísa í hluta auðlindarinnar, venjulega akkeri á HTML síðu, sem er sjálfkrafa skrunað niður eftir að síðan hefur verið opnuð: Slóðin http://example.com/dokument.html#absatz3 væri , þar sem skáldað skjal hér, sem veldur því að vafrinn flettir að upphafi þriðju málsgreinar.

Dæmi

  • ftp://max:[email protected] FTP með notanda og lykilorði
  • http://de.wikipedia.org vefsíða án slóða (aðgangur að upphafssíðunni )
  • http://de.wikipedia.org/wiki/Uniform_Resource_Locator vefsíða með slóð
  • https://de.wikipedia.org //de.wikipedia.org… eins og að hringja í vefsíðuna án þess að tilgreina slóð, en með dulkóðuðu Hypertext Transfer Protocol Secure
  • mailto:[email protected] ... til að skrifa tölvupóst á tilgreint netfang (opnar venjulega póstforritið með nýjum, tómum skilaboðum þar sem TO-vistfangið er fyrirfram fyllt)
  • news:alt.hypertext ... Sýning Usenet fréttahóps (almennt, án þess að tilgreina NNTP samskiptareglur)
  • nntp:alt.hypertext ... Sýning Usenet fréttahóps (með forskrift netsamskiptareglunnar NNTP)
  • telnet:example.org ... byrjaðu Telnet lotu
  • file:///foo/bar.txt aðgangur að staðbundinni skrá

Hlutfallslegar slóðir

Til viðbótar við algerar eða fullar vefslóðir sem hafa verið sýndar hingað til, þá eru einnig hlutfallslegar vefslóðir. [11] Þeir eru aðeins gildir í samhengi sem þeir erfa eignir úr. Þú ert að missa af staðsetningu á veraldarvefnum eða raunverulegu innra neti . Þau eru aðallega möguleg í http, https og ftp hópnum, en einnig með mailto. Það myndi samsvara símanúmeri án svæðisnúmers (landsins, staðarnetsins ).

Hlutfallslegar vefslóðir fyrir http, https, ftp
Byrjun merkingu athugasemd dæmi
// Sama siðareglur skynsamlegt að nota http: eða https: núverandi umhverfis //example.com/pfad/zu/datei
/ Sama lén ( host:port ), " rótaskrá " /pfad/zu/datei
# Sama úrræði Áhrif fram yfir aukaverkun #
# brot Sama úrræði, stökkmerki #knoten
Ekkert Sama úrræði
../ einn slóðarhluti upp Miðlarinn má ekki með því / skipuleggja skiptingu stuðningsleiða. /pfad/zur/../zur/datei
./relativer/pfad
./
annað
sama leiðarhluti

Hlutfallslegar vefslóðir eru oft notaðar til að geyma hóp tengdra auðlinda annaðhvort í staðbundnu skráakerfi eða á mismunandi stöðum á mismunandi netlénum óbreyttum og til að tengja þau hvert við annað. Tilviljun, túlkun auðkennisins (stafstrengur milli host:port og # ) er ókeypis fyrir hvern netþjón - þó að hann höndli langflesta netþjóna og allan staðlaðan hugbúnað eins og fram kemur hér að ofan, getur / nákvæmlega hvernig ? % & eru metin samkvæmt eigin reglum.

Með mailto: afstæð slóð væri mailto:Nachbar (án @ ) - hún er aðeins gild í staðarnetinu.

Listi yfir leyfilega stafi

Fráteknir stafir eru:

  • Sérstafi / ? # [ ] @ : $ & ' ( ) * + , ; =

Persónur sem eru óvarðar eru:

  • Sérstafi - . _ ~
  • Stafir A–Z, a–z
  • Stafir 0–9

Í vissum tilfellum eru einnig bil   (þetta er einnig hægt að tákna að öðrum kosti með + , [12] og % ) í prósentukóðun . [13]

Tungumálanotkun

Í þýskri notkun hefur URL oft kvenkyns greinina en er einnig notuð með karlkyns greininni. [14] Val á kyni fer eftir því hvort það er byggt á þýsku þýðingunni á heimilisfanginu (kvenkyns) eða notkun málfræðireglunnar sem nafnorð byrja á -eða (hér staðsetningar eða auðkenni ) eða -er ( -descriptor , -lokalisierer, vísbendingar um rúmmál) á þýsku eru alltaf karlkyns. [15]

Slóðir í textum

Viðauki C í RFC 3986 mælir með því að nota URI (og því vefslóðir) í texta

  • sjálfstætt á einni línu,
  • með tvöföldum tilvitnunum "http://example.com/" eða
  • með hornfestingum <http://example.com/>

að afmarka gegn samhenginu og sérstaklega gegn greinarmerki setningarinnar.

Slóðir og leitarvélar

Jafnvel þó að vefslóðir geti haft tæknilega flókna uppbyggingu leiðir óviðeigandi notkun á vefslóðaruppbyggingum oft til vandræða varðandi leitarvélar sem finnast best. Af þessum sökum, leitarvélastjórnendur eins og B. Google fylgir ákveðnum tilmælum, z. B. vandlega notkun færibreytna í vefslóðum. [16] Vefslóðaruppbyggingin er oft köflótt sem hluti af því sem kallast leitarvélabestun . Leitarvélafyrirtækið Google hefur einnig kynnt kanóníska UR L sem eigin hugtök. Kanónísk vefslóð er slóð síðunnar sem Google telur að sé fulltrúi flestra afritasíðna á vefsíðu. Frá sjónarhóli leitarvélar z. B. slóðinni afbrigði "http://www.example.com/" , "http://example.com/" , "https://www.example.com/" und "https://example.com/" fjórar óháðar útgáfur sem - ef engin vefslóð er skilgreind - geta leitt til" afrit innihalds "og þar með minna en ákjósanlegt skyggni.

saga

Nafn og stöðlun

Í árdaga WWW (frá lokum 1990) höfðu skjölin á info.cern.ch upphaflega enga sérstaka tilnefningu til að ávarpa vefsíður, umfjöllunarefninu var aðeins lýst sem „W3 skjalasafni“, „W3 nafni“, „ W3 heimilisfang “eða„ Hypertext Name “. [17] [18] [19] Ávarpið sem tilgreint var á þeim tíma (og notað á fyrstu vefsíðunum) samsvarar þegar eyðublaðinu sem var staðlað síðar sem „vefslóð“; Þrátt fyrir að litið væri til breytinga á stöðlunarferlinu var þeim hafnað vegna mikillar útbreiðslu WWW. [18] [20]

Sumarið 1992 reyndi Tim Berners-Lee að setja á laggirnar vinnuhóp á fundi IETF í Boston til að staðla aðgang að skjölum á vefnum. Hann stakk upp á nafninu Universal Document Identifier (UDI) , sem hann taldi að ætti að skilgreina almennan internetstaðal. Nafnið var gagnrýnt sem of „hrokafullt“, sem stafaði aðallega af orðinu algilt (enska fyrir almennt gild , yfirgripsmikil ). Þess í stað var hugtakið hóflegri einkennisbúningur (Engl. Til skilgreindra) hópsins sem lagt var til. Að auki hefur „Document“ verið skipt út fyrir „Resource“ til að leggja áherslu á að vefurinn ætti að vera samþættur öðrum upplýsingakerfum. URI vinnuhópurinn varð loksins til með frekari nafnbreytingu á staðlinum til að skilgreina: „Auðkenni“ var skipt út fyrir „staðsetning“ til að undirstrika að vefföng eru ekki varanlega skráð vistföng. [21]

Vegna átakahugsaðra vinnubragða hópsins var fyrsta - enn óformlega - drög að staðlaðri RFC 1630 aðeins kynnt af Berners -Lee í júní 1994. [20] Hann nefnir nafnið „Universal Resource Identifiers“ sem Berners-Lee studdi í titlinum og skilgreinir nú þegar hugtökin URI, URL og URN . Í desember 1994 birti hópurinn RFC 1738, staðalinn sem ber yfirskriftina „Uniform Resource Locators (URL)“.

Íhlutir

Berners-Lee fékk suma af einstökum íhlutum vísvitandi lánaða frá núverandi kerfum til að láta vefföng virðast eins kunnugleg eða rökrétt fyrir nýjum notendum og mögulegt er: [22]

  • Slóðin ( http://www.example.com /verzeichnis/unterverzeichnis/datei.html ) vitnar beint í setningafræði slóðarinnar í UNIX skráarkerfum . [22]
  • The gestgjafi táknað kynnt með tvöföldu skástriki kemur frá setningafræði í net skrá kerfi af Apollo Domain / OS , sem leiðir á fjarlægum vélum voru beint í samræmi við mynstri //example.com /verzeichnis/unterverzeichnis/… . [22]
  • Brotið merkt með tvöföldum krossi er fengið að láni frá bandarískri stafsetningu fyrir íbúðar- og svítalúmer í póstföngum: 12 Foo Avenue # 34 stendur fyrir Foo Avenue nr. 12, íbúð 34 . Í samræmi datei.html #ressource hluti (kafla, kafli ...) ressource innan datei.html . [22]

Sjá einnig

Wiktionary: URL - skýringar á merkingum, uppruna orða, samheiti, þýðingar

bókmenntir

  • Tim Berners-Lee , Mark Fischetti: Vefskýrslan . Höfundur veraldarvefsins um takmarkalausa möguleika internetsins . Econ, München 1999, ISBN 3-430-11468-3 (enska: Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web .).

Vefsíðutenglar

  • RFC 3986 . - Uniform Resource Identifier (URI): Generic Syntax . [Errata: RFC 3986 ]. Janúar 2005. (kemur í stað RFC 2732 - uppfært af RFC 6874 - ensku).
  • T. Berners-Lee, L. Masinter, M. McCahill: RFC 1738 . - Uniform Resource Locators (URL) . [Errata: RFC 1738 ]. Desember 1994. (Uppfært af RFC 1808 - ensku).
  • R. Fielding: RFC 1808 . - Hlutfallslegir samræmdir auðlindastaðir . Júní 1995. (Úrelt eftir RFC 3986 - enska).

Einstök sönnunargögn

  1. Duden - Þýska alhliða orðabók. 6. útgáfa.
  2. Internet og veraldarvefur - munurinn. News.de, 29. október 2009, opnaður 11. desember 2010 .
  3. a b RFC 3986 - Uniform Resource Identifier (URI): Generic Syntax . Janúar 2005. Kafli 3.3: Slóð. (Enska).
  4. RFC 1738 - Uniform Resource Locators (URL) . Desember 1994. Kafli 3.10: SKRÁ. (Enska).
  5. flokkaskrá (Java 1.5.0 API). Oracle , opnað 11. desember 2010 .
  6. Skrá URI kerfi #Vafrahegðun á ensku Wikipedia
  7. Firefox, til dæmis, hefur hindrað allan staðbundinn aðgang með file: af öryggisástæðum síðan 2012 ef skjalið í kring kemur frá http:// .
  8. RFC 2616 - Hypertext Transfer Protocol . Kafli 3.2.2: http slóð. Staðall: [HTTP / 1.1]. (Enska).
  9. RFC 1738 - Uniform Resource Locators (URL) . Desember 1994. Kafli 3.1: Common Internet Scheme Syntax. (Enska).
  10. RFC 1738 - Uniform Resource Locators (URL) . Desember 1994. Kafli 3.3: HTTP. (Enska).
  11. RFC 3986 - Uniform Resource Identifier (URI): Generic Syntax . Janúar 2005. Kafli 4.2: Afstæð tilvísun. (Enska).
  12. Matas Vaitkevicius: Vefslóð sem kóðar geimstafinn : + eða% 20? Í: stackoverflow.com. 29. apríl 2015, opnaður 8. apríl 2016 .
  13. HTML URL URL kóðunartilvísun. Í: w3schools.com. Sótt 8. apríl 2016 .
  14. Duden - þýska alhliða orðabók , sjá einnig duden.de
  15. korkturen.de - Forum - Slóðin - (auglýsingar) borði . Í: korkturen.de .
  16. Hafðu uppbyggingu vefslóðarinnar einfalda | Google leitarmiðstöð. Sótt 25. febrúar 2021 .
  17. Tæknilegar upplýsingar. CERN / W3C, 13. nóvember 1992, opnaður 22. desember 2010 .
  18. a b W3 nafngiftaráætlanir. CERN / W3C, 24. febrúar 1992, opnaður 22. desember 2010 .
  19. W3 heimilisfang setningafræði: BNF. CERN / W3C, 29. júní 1992, opnaður 22. desember 2010 .
  20. a b Berners-Lee 1999, bls. 63.
  21. Berners-Lee 1999, bls. 62.
  22. a b c d Tim Berners -Lee:Algengar spurningar - Hvers vegna //, #, osfrv? 20. nóvember 2007, opnaður 22. desember 2010 .