Lemma (orðasafn)

frá Wikipedia, ókeypis alfræðiorðabókinni
Fara í siglingar Fara í leit

The uppflettimynd ( Forngríska λῆμμα lēmma , í raun „það sem hefur verið tekið“, „það sem hefur verið samþykkt“; Fleirtölu: lemmas [1] ) er grundvallarform orðs í orðafræði og málvísindum , þ.e.a.s orðmynd sem hugtak er að finna í tilvísunarverki ( nafnform , tilvitnunarform).

Lemma, lexeme og tilvitnunarform

Lemman er færslan eða lykilorðið í orðabók ( orðasafn , alfræðiorðabók ). [2] Það er kallað bæði grundvallarform orðs og tilvitnun eða grunnform lexem . [3] [4] Ferlið við að ákvarða nákvæmari lemmur kallast lemma val eða lemmatization .

Orðmál - málfræðileg merkingareining - gæti í grundvallaratriðum verið nefnt á einhvern hátt, þar sem það er dregið út sem málfræðileg eining af ýmsum formum, en hefur ekki sjálft sérstakt form sem greinir það frá öðrum formum. Lexemes eru venjulega nefnd eftir hefðbundnu formi, sem er þá kallað tilvitnunarform (einnig: grunnform , leitarorð ) þessa orðs:

  • Á þýsku er tilvitnunarformið fyrir nafnorð venjulega nefnifall eintölu (t.d. draumur ), fyrir sagnir óendanlegt nútímans virkt (t.d. draumur ).
  • Á latínu er tilvitnunarformið fyrir sagnir hugmyndafræðin (dæmi), sem tilgreinir röð ákveðinna hátta (óendanlegt, tilvísandi, samtenging) og tíma (nútíð, fullkomið ...), sem er sérstaklega gagnlegt við óreglulegar sagnir . Þessi röð er í flestum orðabækur: 1. persóna eintölu leiðbeinandi nútíð virk, 1. persóna eintölu vísbending fullkominn virkur, virkur súpinum I eða þátttakan fullkominn óvirkur (PPP) hvorugkyns og loks óendanlegur núverandi virkur. Til dæmis er fyrirmyndin fyrir „koma, bera“: feroare , tuli , latum , ferre . Í kennslubókum er hins vegar óendanlegt núvirkt virkt í fyrirrúmi.

Linguistic uppflettiritum byggt á orðinu ( lexica , orðasöfn , Etymological verk) nota alla lexemes sem lemmas, en uppflettirita sem eru meiri áhuga á huglægu lemma vali ( sérfræðiþjónustu lexicons , sérfræðingur orðalista , orðasöfn og þess háttar) kjósa einföldustu nafnorð sem tilvitnunarform - sérstaklega á þýsku: Til dæmis eru „draumurinn“, „draumurinn“, „draumurinn“ og „sá sem dreymdi“ dregnir saman í sameiginlegum lemma draumi , að því er varðar sama mál. Hér er venjulega talað um lemma sem lýsingu .

Eftirfarandi dæmi sýnir að val á tilvitnunarformi fer eftir gerð tilvísunarverks:

  • Orðið „mýs“ er flokkað undir lemma músina .
    Þessi nálgun velur venjulega orðabók, þar sem „mús“ er grunnform fleirtölu „músa“.
  • Í líffræði er orðið „mús“ flokkað undir lemma mýs .
    Í líffræðilegri kennslubók er ættkvísl músa notuð sem regnhlífarhugtak. Tegundafræðilega tilvitnunarformið mýs lýsir því yfir að það eru margar mismunandi gerðir af músum en ekki bara „músin“. Viðhorf líffræðinnar er frábrugðið máltíðinni sem kallar allt sem lítur út eins og mús „mús“.
  • Hjá tölvumúsum er músin lemma í kennslubók; Til dæmis, í alhliða orðabók, gæti færslan verið mús (tölva) .
    Tölvumýs geta litið öðruvísi út og verið mismunandi í smáatriðum, en líkt er litið á að það sé mikilvægara en munurinn þegar þær eru flokkaðar í orðabókinni. Þess vegna, ólíkt líffræði, er lemma notað í eintölu.

lematisering

Orðrænni minnkun beygingarforma orðs í grundvallarform, þ.e. skilgreiningu á grunnformi orðsambands og fyrirkomulagi lemmanna er einnig kallað lemmatization . Undirmengi lemma beint í röð myndar Lemmastrecke .

Lemmatization er einnig skilið að merkja ákvörðun (eða skila) fulls forms til samsvarandi lemma. Þetta ferli er mikilvægt eftir því hvaða forrit er notað í taltækni . Þegar tölfræðilíkön eru notuð, til dæmis, er lemmatization mjög lítils textahóps stundum hentugur til að auka tíðni einstakra lexema og þar með draga úr tölfræðilegum hávaða . Í heildarformi corpus er skipt út fyrir lemma þeirra fyrir tölfræðilega matið. Til dæmis, ef orðið myndar „hitti“, „hittast“, „hittist“ og „hittast“ voru áður til einu sinni í corpus, eftir lemmatiseringu er aðeins þrautin „hitt“ - þó með tíðni fjögurra. Orðabókin „hittast“ hefur því hugsanlega miklu hærra vægi í líkamanum en einstök fullform höfðu fyrir lemmatization.

Lemma úrval

Áður en lematiseringin fer fram er lemma val þar sem ákveðið er hvaða tegundir af lemmum eiga að vera með í orðasafninu. Val á lemma er nauðsynlegt vegna þess að fullkomin lematisering allra orða, orðhluta og orðaflokka á tungumáli er leiðinlegur. Ein viðmiðun fyrir því að lemma sé skráð í orðabækur er tímabilið þar sem hugtakið er til á viðkomandi tungumáli.

Lemma val er nátengd Keywording af textunum sem notuð - sem er óþarfi að ræða almennar tungumálum verkum vegna þess að heill orðaforða er að þróa, en er alveg máli í tæknilegum og öðrum hópi tungumál lexicons og við spurningunni um samheiti , samheiti og fjölritunum .

Sjá einnig

bókmenntir

  • Patrick Brandt, Rolf-Albert Dietrich, Georg Schön: Málvísindi. Rauður þráður til að læra þýska tungumálið (= Uni-Taschenbücher 8331). 2., endurskoðuð og uppfærð útgáfa. Böhlau, Köln / Weimar / Vín 2006, ISBN 978-3-8252-8331-5 (UTB) / ISBN 978-3-412-00606-8 (Böhlau).
  • Winfried Ulrich: Orðabók um grundvallaratriði málvísinda (= Hirts 'index books ), 5., algjörlega endurskoðuð útgáfa. Borntraeger, Berlín / Stuttgart 2002, ISBN 3-443-03111-0 .
  • Hadumod Bußmann (ritstj.), Hartmut Lauffer: Lexicon of Linguistics, með 14 töflum, 4., endurskoðuðu og bókfræðilega viðbótarútgáfu. Kröner, Stuttgart 2008, ISBN 978-3-520-45204-7 .

Vefsíðutenglar

Wiktionary: Lemma - skýringar á merkingum, uppruna orða, samheiti, þýðingar

bólga

  1. Duden: Lemma
  2. ^ Patrick Brandt, Rolf-Albert Dietrich, Georg Schön: Málvísindi. 2006, bls. 151.
  3. Lemma, lemmatization. Í: Helmut Glück (ritstj.), Með samvinnu Friederike Schmöe : Metzler Lexikon Sprache. 3., endurskoðuð útgáfa. Metzler, Stuttgart / Weimar 2005, ISBN 3-476-02056-8 .
  4. Lemma . Í: Winfried Ulrich: Orðabók um grunnmálfræðileg hugtök. 2002.