MP3

frá Wikipedia, ókeypis alfræðiorðabókinni
Fara í siglingar Fara í leit
MPEG hljóðlag III
Mp3.svg
Skrá eftirnafn : .mp3
MIME gerð : hljóð / mpeg hljóð / MPA hljóð / mpa-öflugt [1]
Töfra númer : FFFB hex
\ xFF \ xFB

( ASCII-C merking )

Upphafleg útgáfa: 1991
Gerð: Hljóð
Staðlar : ISO / IEC 11172-3, ISO / IEC 13818-3



MP3 , upprunaleg stafsetning mp3 (nafn eftir skráarnafnbót ; [2] í raun MPEG-1 Audio Layer III eða MPEG-2 Audio Layer III) er aðferð til að tapa samþjöppun stafrænna geymdra gagna. MP3 notar geðþynningu með það að markmiði að geyma aðeins merkiþætti sem menn skynja. Á þennan hátt, ef ekki er litið á (eða varla) að hljóðgæði séu skert, er mikil minnkun gagna möguleg.

Með dæmi um gagnahraða 192 kbit / s, sem þegar gerir hágæða mögulegt, er þjöppunarhraði MP3 hljóðskrár um 85% samanborið við óþjappaðan hljóðdisk . MP3 er ráðandi aðferð til að geyma og senda tónlist á tölvum, snjallsímum , á internetinu og á flytjanlegum tónlistarspilurum ( MP3 spilurum ), þó að nú séu til fleiri tæknilega háþróaðir valkostir. Ferlið var aðallega þróað í Þýskalandi undir stjórn Karlheinz Brandenburg og Hans-Georg Musmann .

Í maí 2017 hættu verktaki leyfi fyrir sniðinu, [3] eftir að síðustu einkaleyfi í Bandaríkjunum voru útrunnin (í Evrópu hafði MP3 verið einkaleyfislaust síðan 2012). [4] Það er nú laus laus staðall.

saga

Þýski rafmagnsverkfræðingurinn og stærðfræðingurinn Karlheinz Brandenburg er einn af helstu þróunaraðilum MP3 ferilsins.

MP3 sniðið var þróað frá 1982 undir stjórn Hans-Georg Musmann af hópi undir forystu Karlheinz Brandenburg við Fraunhofer Institute for Integrated Circuits (IIS) í Erlangen og við Friedrich-Alexander háskólann Erlangen-Nuremberg í samvinnu við AT&T Bell Labs og Thomson . Frá 1989 var þróuninni innan ISO / IEC JTC1 SC29 WG11 (MPEG) haldið áfram. Fyrsta kynningin á stöðluninni fór fram árið 1991. [5] Ári síðar var það kóðað sem hluti af MPEG-1 staðlinum. Saga stöðlunar og þakklæti framlags vísindamannanna er sett fram í Genesis of MP3 Audio Coding Standard eftir Hans Georg Musmann í IEEE Transactions on Consumer Electronics, bindi 52, nr. 3, bls. 1043-1049, ágúst 2006 . Ítalska rannsóknarmiðstöðin CSELT (yfirmaður fjölmiðla: Leonardo Chiariglione ) var stofnunin sem leyfði stöðlun [6] . The skráarnafnauki .mp3 (sem skammstöfun fyrir ISO MPEG Audio Layer 3) var ákvörðuð 14. júlí 1995 eftir að innri könnun sem stofnunin; áður var skráartengingin .bit notuð innbyrðis. [2] Brandenburg hefur hlotið nokkur verðlaun fyrir þróun þessa gagnaforms.

Strax um miðjan tíunda áratuginn voru leikmenn og hugbúnaður fyrir tölvur í umferð sem gerði það mögulegt að vista og spila þjappaðar MP3 skrár. Skipti á slíkum skrám í gegnum internetið hafa einnig verið einfölduð: Jafnvel með einföldum ISDN hraða þurfti flutninginn aðeins tvisvar til þrisvar sinnum spilunartíma; Með DSL línum var sendingin jafnvel langt undir leiktíma. Þetta leiddi fljótt til líflegrar skiptingar á hljóðskrám ( samnýtingu skráa ) án þess að höfundarréttur viðkomandi listamanns eða tónskálds væri gætt. Tilraunir tónlistariðnaðarins til að grípa til aðgerða gegn þessu hafa einkennst af aðeins hóflegum árangri fram á þennan dag, sérstaklega þar sem skiptakerfin þróast einnig frekar og byggjast á jafningjafræðilegri reglu án miðlægra, stjórnanlegra aðila. Í lok tíunda áratugarins voru þegar stór safn tónlistarskrár á netinu, til dæmis á MP3.com eða Napster , sem olli því að notendum fjölgaði verulega. Fyrstu flytjanlegu MP3 spilararnir birtust í verslunum árið 1998.

Einkaleyfi og ágreiningur um leyfi

Aðferðirnar við MPEG kóðun („MP3“) eru nú einkaleyfalausar og því er hægt að nota þær frjálslega. Upprunalega, næstum lokið staðlaða MPEG-1 (hluti 1, 2 og 3) var gefinn út 6. desember 1991 sem ISO geisladiskur 11172. [7] [8] Í flestum löndum er ekki lengur hægt að sækja um einkaleyfi ef „nýjasta tækni“ hefur þegar verið birt. Einkaleyfi missa gildi 20 árum eftir upphaflega umsókn; í sumum löndum er hægt að lengja þetta tímabil um allt að 12 mánuði, allt eftir skráningardagsetningu. Þess vegna misstu einkaleyfin sem krafist er til að innleiða MP3 tækni gildi í flestum löndum í desember 2012, 21 ár eftir útgáfu ISO CD 11172 staðalsins.

Undantekning var Bandaríkin þar sem einkaleyfi sem lögð voru inn fyrir 8. júní 1995 giltu ekki lengur eftir 17 ár. Hins vegar var hægt að tefja verulega þann dag sem einkaleyfi var veitt með því að framlengja umsóknarfrestinn. Hin ýmsu MP3-tengdu einkaleyfi misstu gildi í Bandaríkjunum á árunum 2007 til 2017. [9] MP3 tæknin var einkaleyfislaus í Bandaríkjunum í síðasta lagi 16. apríl 2017 þegar bandaríska einkaleyfið nr. 6009399 í eigu Fraunhofer-Gesellschaft [10] (og gefið með Technicolor [11] ) rann út.

Þar af leiðandi hætti Fraunhofer-Gesellschaft leyfisáætlun sinni 23. apríl 2017. [12] Bandarísku einkaleyfin [13] sem Sisvel, stór MP3 einkaleyfasafn, hafði umsjón með og krafist, höfðu einnig runnið út í apríl 2017 (þrjú síðustu einkaleyfin sem giltu eftir 2015 voru: bandarískt einkaleyfi nr. 5878080, sem rann út í febrúar 2017, Bandarískt einkaleyfi nr. 5850456, rann út í febrúar 2017 og bandaríska einkaleyfi nr. 5960037, rann út 9. apríl 2017). [14] [15]

Í maí 2017 tilkynnti Linux dreifingin Fedora að hún myndi opinberlega innihalda MP3 afkóðara og kóðara í dreifingunni þar sem samsvarandi einkaleyfi voru útrunnin. [16]

Fram til 2017 áttu Fraunhofer-Gesellschaft og önnur fyrirtæki hugbúnaðar einkaleyfi á hlutaferlum sem eru notaðir við MPEG kóðun. Það var ekkert alhliða MP3 einkaleyfi. Fraunhofer-Gesellschaft lagði stærstan hluta til þróunar MP3 staðalsins og hafði einkaleyfi á nokkrum aðferðum fyrir MP3 kóðun. Í sameiningu við Thomson áttu fyrirtækin tvö 18 MP3-tengd einkaleyfi. Frá september 1998, eftir að MP3 staðallinn gat fest sig í sessi í sex ár, þar til í apríl 2017, krafðist FhG / Thomson leyfisgjalda fyrir framleiðslu á vélbúnaði og hugbúnaði sem notaði MP3 sniðið.

Upphaflega var talið að einkaleyfi Bell Laboratories hefðu verið notuð til að þróa sniðið. Á þessum tíma áttu Alcatel-Lucent þessi réttindi sem Bell Labs hafði tekið yfir. Fyrirtækið hafði höfðað einkaleyfi á hendur Microsoft, Dell og Gateway um aldamótin. Í málsmeðferðinni gegn Microsoft í febrúar 2007 fékk Lucent 1,52 milljarða Bandaríkjadala í fyrsta skipti. [17] Hins vegar var þeim dómi hnekkt í ágúst 2007 af alríkisdómstólnum í San Diego. [18] Sisvel gerði einnig kröfur um einkaleyfisbrot fyrir hönd Philips .

umgengni

Litrófsgreining á óþjappaða laginu Í gær sýnir fulla bandbreidd allt að næstum 21 kHz.
Litrófsgreining á sama laginu MP3 -þjappað (gagnahraði 128 kbit / s) sýnir að dulkóðunarbreiddin var takmörkuð við um 15 kHz - þannig að dulmálarinn getur einbeitt sér að meginatriðum

Eins og flest taplaus þjöppunarsnið fyrir tónlist, notar MP3 ferlið sálfræðileg áhrif frá skynjun manna á tónum og hávaða. Til dæmis geta menn aðeins greint tvo tóna frá hvor öðrum ef ákveðinn lágmarksmunur er á tónhæð , fyrir og eftir mjög hávær hávaða geta þeir skynjað hljóðlátari hljóð illa eða alls ekki í stuttan tíma. Upprunalega merkið þarf ekki að geyma nákvæmlega, en merkiþættirnir sem eyra mannsins getur líka skynjað eru nægjanlegir. Verkefni umritunaraðila er að vinna upprunalega hljóðmerkið samkvæmt föstum reglum sem byggjast á geislavirkni á þann hátt að það krefst minna geymslupláss en hljómar samt nákvæmlega eins og frumritið í eyra manna. Ef frumritið og MP3 útgáfan eru háð fullkomnu samkomulagi talar maður um gagnsæi . Í meginatriðum, þó, vegna þess að lossy þjöppun, upprunalega merki er ekki hægt að nákvæmlega endurbyggja frá MP3 merki. Það eru líka taplausar aðferðir til að þjappa hljóðgögnum eins og FLAC , en þær ná verulega lægri þjöppunartíðni og eru jafnvel sjaldgæfari - sérstaklega á sviði spilunarbúnaðar.

Þegar MP3 merkið er búið til með þessum hætti notar afkóðarinn minnkuðu gögnin til að búa til hliðstætt hljóðmerki sem hljómar frumlegt fyrir meirihluta hlustenda, en er ekki eins og upprunalega merkið, þar sem upplýsingar voru fjarlægðar við umbreytingu í MP3 snið. Ef maður væri að bera saman tíma bylgjuform MP3 hljóðmerkisins við frumritið, til dæmis á skjá sveiflusjás , þá væri greinilegur munur sést. Vegna sálfræðilegrar mannlegrar skynjunar sem nefnd er hér að ofan, hljómar MP3 merkið enn nákvæmlega eins og frumritið fyrir hlustanda - að því tilskildu að háþróaður kóðari og nægilega hár gagnahraði (bitahraði) séu notaðir við kóðun.

Þó að afkóðunin fylgi alltaf föstum reiknirit, þá er hægt að gera kóðunina í samræmi við mismunandi reiknirit (td Fraunhofer kóðara, LAME kóðara) og gefur í samræmi við það mismunandi hljóðeinangrun. Spurningin um hvort sumir eða margir hlustendur skynja gæðatap fer meðal annars eftir gæðum kóðans, margbreytileika merkisins, gagnatíðni, hljóðtækni sem notuð er ( magnari , hátalari ) og að lokum að heyra hlustandann í burtu. Til viðbótar við fasta gagnahraða 8 kbit / s allt að 320 kbit / s, leyfir MP3 sniðið einnig ókeypis gagnahraða allt að 640 kbit / s (Freeform MP3) í frjálsu sniðmátinu . Hins vegar eru aðeins örfáir MP3 spilara afkóðarar hannaðir fyrir hærra bitahraða en þeir frá ISO staðlinum (allt að 320 kbit / s).

Gæðabirtingarnar eru nokkuð huglægar og mismunandi frá manni til manns og frá eyra til eyra. Flestir geta ekki lengur aðgreint kóðað efni frá frumefni frá hærri bitahraða og þegar þeir nota háþróaðan kóðara, jafnvel með einbeittri hlustun. Engu að síður, í hlustunarprófi hjá c't magazine, var hægt að aðgreina ákveðin tónlist, jafnvel við 256 kBit / s, frá geisladiskgæðum. Prófið var hins vegar framkvæmt árið 2000 - síðan þá hafa MP3 kóðararnir batnað verulega. Hjá fólki með „óeðlilega“ heyrn (t.d. með heyrnarskemmdir vegna poppáverka ) virka aðferðirnar sem notaðar eru stundum ekki eins og ætlað er, þannig að meiri munur er á mismun kóða og frumefnis (td vegna þess að hávær hljóð hafa áhrif á skemmd heyrn heyrir illa, nær ekki lengur vel yfir aðra tóna). [19] Prófunarmaðurinn, sem best var að greina mun á áðurnefndu prófi, jafnvel við mikla gagnatíðni, hefur skemmt heyrn. [19]

Auk þess að kóða með föstum gagnahraða (= sveifluleg gæði, tengd við margbreytileika hljóðmerkisins sem breytist með tímanum), er kóðun með föstum gæðum (og þar með sveiflukennd gagnahraði) einnig möguleg. Þetta (að verulegu leyti) forðast gæðadropa við erfiðar kóðun tónlistarganga en sparar hins vegar gagnahraða og þar með endanlega skráarstærð fyrir rólegar eða jafnvel alveg hljóðlausar leiðir hljóðstraumsins. Gæðastigið er tilgreint, [20] og þannig er náð lágmarksstærð skráar sem krafist er fyrir þetta.

Þjöppun gagna

Kvaðbylgjumerki þjappað saman með tveimur mismunandi bitahraða
  • Fyrsta skrefið í samþjöppun gagna byggist til dæmis á rásatengingu hljómtækismerkisins með því að mynda mismuninn, þar sem gögn hægri og vinstri rásanna eru í miklu samræmi, þ.e. eru mjög svipuð. Þetta er taplaust ferli, hægt er að endurtaka framleiðslumerki að fullu ( mið / hliðar hljómtæki ).
  • Samkvæmt mönnum hljóðrænum ferlinum , eru merki hluti fulltrúa í minna einmitt merkjanleg tíðnisviðs með minna nákvæmni, af því að Fourier-umbreytt gögn efni er skammtaður í samræmi við það.
  • Svokölluð grímuáhrif eru notuð til að geyma merkiíhluti sem skipta minna máli fyrir heyrnarskynið með minni nákvæmni. Þetta geta verið veik tíðni íhlutir í nágrenni sterkra yfirtóna. Sterkur tónn við 4 kHz getur einnig dulið tíðni allt að 11 kHz. Mesti sparnaðurinn með MP3 kóðun er því sá að tónarnir eru aðeins geymdir með nægilega mikilli nákvæmni (með svo mörgum bitum) að aflmagn hávaða er dulinn og því óheyrilegur.
  • Gögnin, sem eru fáanleg í svokölluðum ramma , eru loksins Huffman-kóðuð .

Með sterkri þjöppun eru nokkuð heyranlegir merkihlutir oft teknir af þjöppuninni, þeir heyrast síðan sem þjöppunargripir .

Galli við hönnunina er að málsmeðferðin er beitt í blokkum, sem getur leitt til eyða í lok skráar. Þetta er til dæmis pirrandi fyrir hljóðbækur eða lifandi upptökur þar sem samræmdum fyrirlestri er skipt niður í einstök lög. Hér standa síðustu blokkirnar upp úr sem pirrandi hlé (greinanlegar sem sprungur eða stutt brottfall ). Þetta er hægt að bæta með því að nota LAME kóðann, sem bætir við nákvæmum lengdarupplýsingum, ásamt spilunarforriti sem getur séð um þetta, svo sem foobar2000 eða Winamp . Hins vegar styðja sum spilunarforrit eins og Windows Media Player ekki þessa aðferð, þekkt sem gaplaus spilun . Apple iTunes styður það frá útgáfu 7. [21]

Þjöppun í smáatriðum

Þjöppunin samanstendur af eftirfarandi skrefum:

  1. Undirbandsbreyting merkisins
  2. MDCT umbreyting merkisins , þá (!) Merkinu er skipt í kubba.
  3. Fyrir steríómerki: Matrixing: ákvörðun fyrir hverja blokk hvort merkið er kóðað sem vinstri-hægri eða miðhlið merki
  4. Magnun merkisins
  5. Huffman kóðun með föstum kóðabókum

Skref 4 og 5 sjá um minnkun gagna, þar sem magngreining er ferlið sem tapar.

Athugið: Í eftirfarandi texta vísa tilgreindar litrófsbreiddir og tímar til hljóðmerkis með sýnatíðni 48 kHz.

Undirbandsbreyting merkisins

Með umbreytingu undirbandsins er merkið sundurliðað í 32 tíðnisvið með jafn breidd með fjölfasa síubanka (eins og með MPEG Layer 1, MPEG Layer 2 og dts). Síubankinn vinnur á FIFO biðminni með stærðina 512 sýni , þar sem alltaf eru 32 ný sýni fóðruð í einu skrefi. Þetta þýðir að 16 síugluggar skarast alltaf á hljóðmerkinu.

Ákvörðunin um að nota tíðnisvið með sömu breidd einfaldar síurnar en endurspeglar ekki heyrn manna, en næmi þeirra er ólínulega háð tíðni.

Þar sem í raun eru engar hugsjónarsíur skarast tíðnisviðin þannig að ein tíðni getur einnig komið fyrir í tveimur samliggjandi undirböndum eftir síun.

Undirbandssía er þvinguð af bandarísku einkaleyfinu 6,199,039.

MDCT umbreyting merkisins

Merki undirbandanna eru nú flutt inn á tíðnisviðið með breyttu aðgreindu kósínus umbreytingunni (MDCT). Þar af leiðandi eru tíðnisviðin leyst frekar rýmilega. MDCT getur breytt hljómsveitunum í annaðhvort stuttar blokkir (12 sýni skila 6 tíðnisviðum) eða langar blokkir (36 sýni, 18 tíðnisvið). Að öðrum kosti er einnig hægt að umbreyta tveimur lægstu tíðnisviðunum með löngum kubbum og restinni með stuttum kubbum. Langir kubbar hafa betri tíðniupplausn og henta betur ef hljóðmerki breytist ekki skyndilega innan samsvarandi ramma (kyrrstaða). [22]

Við útgang MDCT er merkinu skipt í kubba. Frá 576 inntaksgildum (ef tekið er tillit til gluggabreidda síanna eru í raun 1663 inntaksgildi), í gegnum tvær umbreytingar tengdar í röð, annaðhvort

  • 576 litrófsstuðlar (langir blokkir),
  • 3 × 192 litrófsstuðlar (stuttar blokkir) eða
  • 36 + 3 × 180 litrófsstuðlar (blendingur blokk, varla notaður)

Matrixing

Fyrir tveggja rása steríómerki geturðu nú ákveðið hvort merkið eigi að kóða annaðhvort sem einliða (einrás), hljómtæki, sameiginlegt steríó eða tvískipta. Öfugt við AAC eða Ogg Vorbis, þessa ákvörðun þarf að taka á heimsvísu fyrir allar tíðnir.

Stereóaðferðin (ekki sameiginleg hljómtæki) (eins og tvískiptur) er taplaus vegna þess að jafnvel við 320 kbit / s eru aðeins 160 kbit / s í boði á hverja rás, en eftir flækjustiginu getur annar þeirra verið völdum rásum úthlutað mismunandi bitahraða. Tvískiptur rás geymir tvö sjálfstæð einlög (t.d. tvítyngd textalög) með sömu bitahraða kóðun; Hins vegar þarf ekki endilega hver afkóðari að endurskapa bæði lögin á sama tíma.

Það eru tvær kóðunaraðferðir fyrir sameiginlega hljómtæki: styrkleiki og mið / hliðar hljómtæki , sem einnig eru notaðar í samsetningu; Báðar aðferðirnar mynda miðstöð (L + R) úr summu beggja rásanna og hliðarrás (L - R) út frá hljóðstyrksmun milli rásanna tveggja. Öfugt við mið / hliðar hljómtæki aðferðina, er fasi ( seinkunartímamismunur ) merkisins vanræktur í hljómtæki . Sameiginlega steríóaðferðin útilokar tíð offramboð í hljómtækisrásunum til að geta umritað merkin með hærri bitahraða en með steríóaðferðinni; hins vegar, ef merki rásarinnar eru mjög ólík, fer sameiginlega steríóaðferðin aftur í venjulega steríó kóðun.

Þar sem hljóðmerkið er fyrst aðgreint í tíðnisvið, verða hljómtækiupplýsingarnar, ef eyrað er hægt að nota þær, einnig að kóða á mismunandi hátt. Hérna, z. B. við lágmark eða tíðni frá 2 kHz er hægt að vista upplýsingaefni, vegna þess að viðeigandi merki sem ekki er hægt að staðsetja eru ekki lengur rás-sönn, heldur undirlagð með aðliggjandi tíðnisviðum sem eru kóðuð (styrkleiki steríó), eða sett í steríómiðstöðina.

Vegna áframhaldandi þróunar á merkjamálum hefur sameiginlegt steríóferli að undanförnu verið litið á sem bestu lausnina fyrir venjulega tónlist, mjög svipaðar hljómflutningsrásir vegna betri þjöppunarhraða, meiri bitahraða kóðunar og taplausra (nema lág tíðni) hljómtæki mynd.

Magnun

Magnvæðing er nauðsynlegt skref þar sem kóðunartap verður. Það er aðallega ábyrgt fyrir því að minnka gagnamagnið.

Aðliggjandi tíðnisvið eru sameinuð í hópa sem eru 4 til 18 tunnur . Þessum er gefinn sameiginlegur kvarðaþáttur s = 2 N / 4 , sem þeir eru metnir með. Mælikvarðinn ákvarðar nákvæmni kóðunar þessa tíðnisviðs. Minni kvarðaþættir hafa í för með sér nákvæmari kóðun, stærri og ónákvæmari (eða engin gildi ójöfn 0 alls).

Frá x 0 , x 1 ,…, x 17 verða gildin N og Q 0 , Q 1 ,…, Q 17 með tengslunum x i ~ Q i 4/3 2 N / 4 .

Ólínulega kóðun Q 4/3 (fyrir neikvæð gildi:- (- Q) 4/3 ) var kynnt í fyrsta skipti í MP3 kóðun. MPEG lög 1 og 2 nota línulega kóðun.

Þetta skref er í meginatriðum ábyrgt fyrir gæðum sem og gagnahraða MP3 gagnaflæðisins sem myndast. Hann er studdur af sálfræðilegu líkani sem reynir að líkja eftir ferlum í meðalheyrn manna og stýrir stjórn á kvarðaþáttum.

Huffman kóðun

Stærðarþættirnir N og magnbundin amplitude Q einstakra tíðnanna eru Huffman-kóðuð með föstum kóða töflum.

Endanleg MP3 skrá samanstendur af röð ramma sem byrja á upphafsmarki (samstillingu) og innihalda eina eða tvær blokkir sem eru búnar til á þann hátt sem lýst er hér að ofan.

þjöppun

Meðan á þjöppun stendur eru þjöppunarskrefin framkvæmd í öfugri röð. Eftir afskráningu Huffman eru gögnin unnin fyrir andhverfa breytta kósínus umbreytingu (IMCT) með öfugri magntölu. Þetta miðlar gögnum sínum til öfugs síubanka, sem reiknar nú upphaflegu sýnin (tapað vegna magntölunnar í kóðunarferlinu).

Frekari þróun

MP3 er mjög algengt snið, sérstaklega á internetinu . Í greininni er það aðallega notað fyrir tölvuleiki. Það er áður sérsniðið snið sem var fellt inn í ISO staðalinn.

Á þeim tíma var iðnaðurinn þegar að vinna að MDCT- undirstaða AAC, sem skilar betri árangri með sambærilegri viðleitni.

Að auki (í átt til hágæða kóðunar) er einnig frekari þróun til að ná enn ásættanlegum hljóðgæðum við mjög lágt gagnahraða (minna en 96 kbit / s). Fulltrúar þessa flokks eru mp3PRO og MPEG-4 AAC HE eða AAC +. Með þessari aðferð er hins vegar aðeins hægt að ná gegnsæi með High Definition (HD) AAC (AAC LC + SLS).

Persóna fyrir 5.1 hljóð

MP3 umgerðarsnið Fraunhofer Institute for Integrated Circuits IIS býður upp á viðbót til að innihalda margrásarmöguleika. MP3 umgerð leyfir spilun 5,1 hljóðs á bitahraða sem er sambærilegt við steríóhljóð og er einnig fullkomlega afturábak samhæft. Hefðbundnir MP3 afkóðarar geta afkóða merkið í hljómtæki, en MP3 umritunarlyklar geta myndað fullt 5.1 umgerð hljóð.

Til að gera þetta er margrásarefninu blandað í steríómerki og kóðað með venjulegum MP3 kóðara . Á sama tíma eru umhverfishljómsupplýsingarnar frá upprunalegu efni settar inn sem umlengingargögn í „viðbótar gögn“ gagnasvið MP3 bitastraumsins. MP3 gögnin geta síðan spilað upp sem steríómerki með hvaða MP3 afkóða sem er. MP3 umgerðartækillinn notar innsláttarupplýsingarnar sem settar eru inn og endurskapar fullt margrás hljóðmerki.

Frekari þróun varðar verklagsreglur um verndun höfundarréttar , sem hugsanlega gætu verið útfærðar í framtíðarútgáfum.

nota

Hljóðhráefni krefst mikils geymslupláss (1 mínútu hljómtæki í geisladiskgæðum um 10 MB) og mikils gagnaflutningshraða eða mikils tíma fyrir flutning (til dæmis í gegnum internetið). Taplaus þjöppun dregur ekki úr magni gagna sem á að flytja eins mikið og tapaðra aðferða, sem í flestum tilfellum (undantekningar eru til dæmis vinnustofuforrit eða geymsla) skila enn viðunandi gæðum. MP3 sniðið fyrir hljóðgögn náði fljótt þeirri stöðu sem JPEG þjöppun hefur fyrir myndgögn.

MP3 varð fyrst og fremst þekkt meðal almennings með tónlistarskiptum . Í warez senunni nota margar DVD rifur MP3 hljóðsniðið sem hljóðlag. Með forritum fyrir CD -ripper er hægt að draga tónlistina út af hljómdiskum og senda þær út í MP3 skrár. Það eru líka mörg forrit sem gera það mögulegt að breyta MP3 í annað snið, en einnig öfugt (dæmi: hljóðlag YouTube myndbands ( FLV ) er breytt í MP3 skrá). Annar miðpunktur notkunar voru MP3 spilarar , sem hægt er að nota til að hlusta á tónlist á ferðinni. Nú á dögum styðja flestir snjallsímar einnig MP3 skrár.

Fjölmörg forrit fyrir MP3 tækni er að finna á WWW , allt frá sjálfsmíðuðri tónlist til (sjálf) talaðra hljóðbóka, útvarpsleikritum, fuglasímtölum og öðrum hljóðum til podcast . Tónlistarmenn geta nú dreift tónlist sinni um heim allan án dreifingar og gert hljóðupptökur aðgengilegar á vefsíðu án mikillar fyrirhafnar (fyrir utan GEMA gjöldin, einnig eigin tónverka sem eru skráðir hjá GEMA). Notendur geta notað leitarvélar til að finna öll hugsanleg (ekki auglýsing) hljóð og tónlistarstíl.

Jafnvel með margmiðlunarhugbúnaði, sérstaklega með tölvuleikjum, eru oft margar hljóðskrár geymdar á MP3 sniði. Að auki er MP3 notað af fjölmörgum - aðallega minni - tónlistarbúðum á netinu .

Merkingar

Öfugt við nútímalegri merkjamál, buðu MP3 skrár upphaflega enga leið til að geyma lýsigögn (til dæmis titil, listamann, plötu, ár, tegund) fyrir tónlistina sem þær innihéldu.

Óháð framleiðanda sniðsins, þá hefur fundist lausn sem er studd af næstum öllum hugbúnaðar- og vélbúnaðarspilurum: ID3 merkin eru einfaldlega fest við upphaf eða lok MP3 skráarinnar. Í fyrstu útgáfunni (ID3v1) er þeim bætt við í lokin og eru takmörkuð við 30 stafi fyrir hverja færslu og nokkrar staðlaðar færslur. Mun sveigjanlegri útgáfa 2 (ID3v2) er ekki studd af öllum MP3 spilurum (sérstaklega vélbúnaðarspilurum ) vegna þess að merkin eru sett í upphafi MP3 skráarinnar. Það er einnig töluverður munur á ID3v2. Algengustu eru ID3v2.3 og ID3v2.4, þar sem ID3v2.4 leyfir opinberlega notkun UTF-8 kóðaðra stafi (áður voru aðeins ISO-8859-1 og UTF-16 leyfðar). Hins vegar sýna margir vélbúnaðarspilarar aðeins UTF-8 merki sem ruglaða stafi . Þar sem ID3v2 merki eru í upphafi skrárinnar er einnig hægt að lesa þessi gögn þegar þau senda með HTTP, til dæmis án þess að lesa alla skrána fyrst eða biðja um nokkra hluta skrárinnar. Til að forðast að þurfa að endurskrifa alla skrána þegar breytingar eru gerðar er venjulega notað padding , sem þýðir að pláss er frátekið fyrir þessar breytingar fyrirfram.

Hægt er að nota lýsigögnin frá ID3 merkinu til dæmis til að birta upplýsingar um lagið sem er verið að spila, til að flokka lögin í lagalista eða til að skipuleggja skjalasafn.

forskrift

Rammahaus

Bæti 1 Bæti 2 Bæti 3 Bæti 4
1 1 1 1 1 1 1 1 1 1 1
Samstilla Auðkenni Lag Pr Bitahraði Tíðni Pa Pv rás ModEx Cp Eða Emph
þáttur stærð lýsingu
Samstilla 11 bita allir bitar eru stilltir á 1
Auðkenni 2 bitar 0 = MPEG útgáfa 2.5
1 = áskilinn
2 = MPEG útgáfa 2
3 = MPEG útgáfa 1
Lag 2 bitar 0 = áskilinn
1 = lag III
2 = lag II
3 = lag I
Vernd 1 bita 0 = 16 bita CRC á eftir hausnum
1 = engin CRC
Bitahraði 4 bita samkvæmt bitahraða töflunni
Tíðni sýnatöku 2 bitar samkvæmt sýnatöflunni
Púði 1 bita 0 = grind er ekki bólstruð
1 = ramma fyllt með auka rauf
Rifa stærð: Lag I = 32 bita; Lag II + III 8 bita
Einka 1 bita aðeins upplýsandi
Rásastilling 2 bitar 0 = hljómtæki
1 = Sameiginlegt hljómtæki
2 = 2 einrásir
3 = ein rás (einlita)
Tísku framlenging 2 bitar (aðeins fyrir sameiginlegt steríó)
samkvæmt hamtengingu
höfundarréttur 1 bita 0 = án höfundarréttar
1 = með höfundarrétti
frumlegt 1 bita 0 = afrit
1 = frumrit
Áherslur 2 bitar 0 = ekkert
1 = 50/15 ms
2 = áskilinn
3 = ITU-T J.17

Tabelle Bitraten (Angaben in kbps)

Wert MPEG 1 MPEG 2/2.5
Layer I Layer II Layer III Layer I Layer II/III
0 freies Format
1 32 32 32 32 8
2 64 48 40 48 16
3 96 56 48 56 24
4 128 64 56 64 32
5 160 80 64 80 40
6 192 96 80 96 48
7 224 112 96 112 56
8 256 128 112 128 64
9 288 160 128 144 80
10 320 192 160 160 96
11 352 224 192 176 112
12 384 256 224 192 128
13 416 320 256 224 144
14 448 384 320 256 160
15 nicht erlaubt

Tabelle Samplingfrequenz (Angaben in Hz)

Wert MPEG 1 MPEG 2 MPEG 2.5
0 44.100 22.050 11.025
1 48.000 24.000 12.000
2 32.000 16.000 8.000
3 reserviert

Tabelle Mode-Extension

Wert Layer I/II Layer III
0 Subbänder 4 bis 31 Intensity-Stereo: aus; M/S-Stereo: aus
1 Subbänder 8 bis 31 Intensity-Stereo: ein; M/S-Stereo: aus
2 Subbänder 12 bis 31 Intensity-Stereo: aus; M/S-Stereo: ein
3 Subbänder 16 bis 31 Intensity-Stereo: ein; M/S-Stereo: ein

Frame-Daten

Auf den Frame-Header folgen die Frame-Daten (gegebenenfalls zunächst CRC), in denen die kodierten Audio-Daten enthalten sind. Ein Frame hat eine Spieldauer von 1152 Samples bei einer Samplerate von 32.000 bis 48.000 Samples je Sekunde; bei kleineren Sampleraten (16.000 bis 24.000 Samples je Sekunde) sind es nur 576. Bei 48.000 Samples je Sekunde entsprechen dem 24 ms. Die Datenmenge eines Frames kann gemäß den angegebenen Eigenschaften im Header errechnet werden. Die Größe eines Frames in Byte lässt sich dann mit der folgenden Formel berechnen, wobei die Division als Ganzzahldivision durchzuführen ist:

Framegröße = (144 · Bitrate) : Samplerate + Padding [bytes]

Wenn bei komplexen Musikstücken die Menge an Daten nicht in einem Frame gespeichert werden können, bietet MP3 ein sogenanntes bit reservoir. Dieser Speicherbereich ist als zusätzlicher Platz für die Datei bestimmt und erweitert die Daten im entsprechenden Frame. Hierzu kodiert der Encoder vorangegangene Musikpassagen mit geringerer Datenrate und füllt somit frühere Frames nicht vollständig aus, das bit reservoir entsteht. Dieser geschaffene freie Speicherplatz kann nun für die höhere Datenmenge komplexerer Musikpassagen genutzt werden. Die maximale Größe dieses Datenreservoirs beträgt 511 Byte, wobei ausschließlich vorangegangene Frames aufgefüllt werden dürfen.

Verbreitete Implementierungen

Zum Codieren von MP3-Dateien stehen der lizenzpflichtige Encoder der Fraunhofer-Gesellschaft und der Encoder des Open-Source -Projektes LAME zur Verfügung. Daneben existieren der Referenzencoder der ISO dist10 und weitere Projekte wie beispielsweise Xing , blade und Gogo .

Als Decoder gibt es mpg123 , MAD , libavcodec und weitere.

Alternative Formate

Eine ≈128-kbit-/s-MP3-Datei im direkten Vergleich durch Spektralanalysen mit anderen verlustbehafteten Audiodatenkompressionsverfahren. Das unkomprimierte Lied The Power of Thy Sword zeigt im Gegensatz zur MP3-Datei eine volle Bandbreite bis etwa 21 kHz, wogegen die MP3-Datei nur etwa eine Bandbreite bis etwa 16 kHz aufweisen kann; das heißt allerdings nicht sofort, dass sich die Audioqualität drastisch verändert hat.

Neben MP3 existieren zahlreiche weitere Audioformate . Das Format Vorbis ist quelloffen und wurde von den Entwicklern als patentfrei bezeichnet. (Vorbis erschien 15 Jahre vor Ablauf der MP3-Patente.) Vorbis hat sich bei technischen Analysen und in Blindtests gegenüber MP3 vor allem in niedrigen und mittleren Bitratenbereichen als überlegen erwiesen. Der qualitative Vorteil von Vorbis ist im hohen Bitraten-Bereich (um 256 kbit/s) nur noch geringfügig wahrnehmbar. Außerdem bietet Ogg-Vorbis Mehrkanal -Unterstützung, und Ogg kann als Containerformat auch Video- und Textdaten aufnehmen. [23] Letzteres wird aber nur von sehr wenigen MP3-Playern und Radios unterstützt.

RealAudio von RealMedia wurde vorwiegend für Audio-Datenströme ( Streaming Audio ) eingesetzt.

Das freie, auf MP2 -Algorithmen basierende Musepack (früher MPEGPlus) wurde entwickelt, um bei Bitraten über 160 kbit/s noch bessere Qualität als das MP3-Format zu ermöglichen. Es konnte sich aber nicht breit durchsetzen, da es eher auf die Anwendung durch Enthusiasten im High-End-Bereich abzielt und im kommerziellen Bereich kaum unterstützt wird. Dateien im Musepack-Format erkennt man an der Erweiterung mpc oder mp+ . [24]

Advanced Audio Coding (AAC) ist ein im Rahmen von MPEG-2 und MPEG-4 standardisiertes Verfahren, das von mehreren großen Unternehmen entwickelt wurde. Apple und RealMedia setzen dieses Format für ihre Online-Musikläden ein, und die Nero AG stellt einen Encoder für das Format bereit. Mit faac ist auch ein freier Encoder erhältlich. [25] AAC ist bei niedrigen Bitraten bis etwa 160 kbit/s MP3 in der Klangqualität überlegen – je niedriger die Bitrate, desto deutlicher –, erlaubt Mehrkanal-Ton und wird von der Industrie (zum Beispiel bei Mobiltelefonen und MP3-Playern ) breit unterstützt.

Windows Media Audio (WMA) ist ein von Microsoft entwickeltes Audioformat und wird häufig für DRM -geschützte Downloads verwendet. Obwohl es auf vielen üblichen Plattformen abgespielt werden kann, hat es sich nicht gegen das MP3-Format behaupten können.

Wissenswertes

Das Team um Brandenburg machte die ersten Praxistests mit der A-cappella -Version des Liedes Tom's Diner von Suzanne Vega . Bei seiner Suche nach geeignetem Testmaterial las Brandenburg in einer Hi-Fi -Zeitschrift, dass deren Tester das Lied zum Beurteilen von Lautsprechern nutzten, [26] und empfand das Stück als geeignete Herausforderung für eine Audiodatenkompression.

Literatur

  • Franz Miller: Die mp3-Story: Eine deutsche Erfolgsgeschichte , Carl Hanser Verlag GmbH & Co. KG, ISBN 978-3-446-44471-3 .
  • Roland Enders: Das Homerecording Handbuch. Der Weg zu optimalen Aufnahmen. 3., überarbeitete Auflage, überarbeitet von Andreas Schulz. Carstensen, München 2003, ISBN 3-910098-25-8 .
  • Thomas Görne: Tontechnik. Fachbuchverlag Leipzig im Carl Hanser Verlag, München ua 2006, ISBN 3-446-40198-9 .
  • Hubert Henle: Das Tonstudio Handbuch. Praktische Einführung in die professionelle Aufnahmetechnik. 5., komplett überarbeitete Auflage. Carstensen, München 2001, ISBN 3-910098-19-3 .
  • Michael Dickreiter, Volker Dittel, Wolfgang Hoeg, Martin Wöhr (Hrsg.): Handbuch der Tonstudiotechnik. Walter de Gruyter, Berlin/Boston 2014, ISBN 978-3-11-028978-7 oder e- ISBN 978-3-11-031650-6 .

Weblinks

Wiktionary: MP3 – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. RFC 3003 , RFC 3555 , RFC 5219
  2. a b MP3 wird 10 Jahre. (Nicht mehr online verfügbar.) 12. Juli 2005, archiviert vom Original am 12. Februar 2016 ; abgerufen am 3. Februar 2011 . Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. @1 @2 Vorlage:Webachiv/IABot/www.iuk.fraunhofer.de
  3. MP3 ist offiziell tot: Fraunhofer hat die Lizenzierung eingestellt , curved.de vom 15. Mai 2017; Zugriff am 16. Mai 2017.
  4. Fraunhofer IIS: Lizenzprogramm für MP3 endet , Heise online vom 15. Mai 2017; Zugriff am 16. Mai 2017.
  5. INTERNATIONAL ORGANISATION FOR STANDARDISATION ORGANISATION INTERNATIONALE DE NORMALISATION ISO. 3. Mai 2011, abgerufen am 3. August 2021 .
  6. Miller, Franz. Die mp3-Story: Eine deutsche Erfolgsgeschichte. Carl Hanser Verlag GmbH Co KG, 2015.
  7. Performance of a Software MPEG Video Decoder, Ketan Patel, Brian C. Smith, and Lawrence A. Rowe, ACM Multimedia 1993 Conference, Berkeley.edu (englischsprachig)
  8. THE MPEG-FAQ ¦Version 3.1 – 14. May 1994¦ PHADE SOFTWARE Leibnizstr. 30, 10625 Berlin, GERMANY – Inh. Frank Gadegast
  9. A Big List of MP3 Patents (and supposed expiration dates) . In: tunequest . 26. Februar 2007 (englischsprachig).
  10. Patent US5703999 : Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels. Angemeldet am 18. November 1996 , veröffentlicht am 30. Dezember 1997 , Anmelder: Fraunhofer-Gesellschaft, Erfinder: Jürgen Herre, Dieter Seitzer, Karl-Heinz Brandenburg, Ernst Eberlein.
  11. mp3licensing.com
  12. mp3. Abgerufen am 15. Februar 2018 (englisch).
  13. US MPEG Audio patents. (PDF) 27. Oktober 2016, abgerufen am 27. Oktober 2016 (englisch).
  14. scratchpad.wikia.com
  15. Patent US5850456 : 7-channel transmission, compatible with 5-channel transmission and 2-channel transmission. Angemeldet am 8. Februar 1996 , veröffentlicht am 15. Dezember 1998 , Anmelder: US Philips Corporation, Erfinder: Warner RT Ten Kate, Leon M. Van De Kerkhof.
  16. Full MP3 support coming soon to Fedora - Fedora Magazine . In: Fedora Magazine . 5. Mai 2017 ( fedoramagazine.org [abgerufen am 15. Februar 2018]).
  17. Microsoft sieht Hunderte von Firmen von MP3-Patentstreit betroffen , heise.de
  18. Microsoft erringt Erfolg im Streit um MP3-Patente , heise.de
  19. a b Carsten Meyer: Kreuzverhörtest , heise.de. In: c't 6/2000, Abschnitt Siegerehrung
  20. AudioHQ über MP3-Qualität
  21. What is Gapless Playback (englisch), Apple.com
  22. David Salomon: Data Compression . The Complete Reference. 4. Auflage. Springer, 2007, ISBN 978-1-84628-602-5 , S.   815 (englisch).
  23. OGG vs. LAME (englisch), Pricenfees.com
  24. MPC vs VORBIS vs MP3 vs AAC at 180 kbps, 2nd checkup with classical music (englisch), hydrogenaudio.org
  25. Freeware Advanced Audio Coder (englisch), SourceForge.net
  26. Viele Hi-Fi-Fans können offenbar das Gras wachsen hören – Interview mit dem „MP3-Erfinder“ Karlheinz Brandenburg auf Tagesanzeiger.ch , abgerufen am 20. Januar 2015.