MP3
MP3(英語:MPEG-1或MPEG-2 Audio Layer III)是一種數字音頻編碼和有損壓縮格式,它被設計來大幅降低音頻數據量,通過捨棄PCM音訊資料中對人類聽覺不重要的部分,達成壓縮成較小檔案的目的。而對於大多數用戶的聽覺感受來說,MP3的音質與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年,由位於德國埃爾朗根的研究組織弗勞恩霍夫協會的一組工程師發明和標準化的。MP3的普及,曾對音樂產業造成衝擊與影響。
副檔名 |
.mp3 |
---|---|
網路媒體型式 | |
開發者 | Fraunhofer Institute |
格式類型 | 音訊 |
使用容器 | MPEG-ES |
標準 | ISO/IEC 11172-3 ISO/IEC 13818-3 |
概觀
編輯MP3是一個數據壓縮格式。它捨棄脈衝編碼調製(PCM)音頻數據中,對人類聽覺不重要的數據(類似於JPEG,是一個有損圖像的壓縮格式),從而達到了壓縮成小得多的文件大小。
在MP3中使用了許多技術,其中包括心理聲學,以確定音頻的哪一部分可以丟棄。MP3音頻可以按照不同的位元率進行壓縮,提供了權衡數據大小和音質之間的依據。
MP3格式使用了混合的轉換機制將時域信號轉換成頻域信號:
儘管有許多創造和推廣其他格式的重要努力,如 MPEG 標準中的 AAC(Advanced Audio Coding)和 IETF 開放標準中的 Opus。然而,由於MP3的空前的流通,在目前來說,其他格式不可能威脅其地位。MP3不僅有廣泛的用戶端軟體支持,也有很多的硬體支持,比如便攜式數位音頻播放器(泛指MP3播放器)、移動電話、數碼多功能影音光碟和CD播放器。
歷史
編輯發展
編輯MPEG-1 Audio Layer II編碼開始時是德國德國航空太空中心Egon Meier-Engelen管理的數碼聲音廣播項目。這個項目是歐盟作為EUREKA研究項目資助的,它的名字通常稱為數碼聲音廣播。EU-147的研究期間是1987年到1994年。
到了1991年,就已經出現了兩個提案:MPEG-1 Audio Layer II(稱為Layer 2)和ASPEC(Adaptive Spectral Perceptual Entropy Coding,自適應頻譜感知熵編碼)。荷蘭飛利浦公司、法國CCETT和德國Institut für Rundfunktechnik提出的Musicam方法由於它的簡單、出錯時的穩定性以及在高品質壓縮時較少的計算量而被選中。基於子帶編碼的Musicam格式是確定MPEG音頻壓縮格式(採樣率、幀結構、數據頭、每幀採樣點)的一個關鍵因素。這項技術和它的設計思路完全融合到了ISO MPEG Audio Layer I、II以及後來的Layer III(MP3)格式的定義中。在Hans Musmann教授(漢諾瓦大學)的主持下,標準的制定由Leon van de Kerkhof(Layer I)和Gerhard Stoll(Layer II)完成。
一個由荷蘭Leon Van de Kerkhof、德國Gerhard Stoll、法國Yves-François Dehery和德國Karlheinz Brandenburg組成的工作小組吸收了Musicam和ASPEC的設計思想,並添加了他們自己的設計思想從而開發出了MP3,MP3能夠在128碼率單位達到MP2 192kbit/s音質。
所有這些算法最終都在1992年成為了MPEG的第一個標準組MPEG-1的一部分,並且生成了1993年公布的國際標準ISO/IEC 11172-3。MPEG音頻上的更進一步的工作最終成為了1994年制定的第二個MPEG標準組MPEG-2標準的一部分,這個標準正式的稱呼是1995年首次公布的ISO/IEC 13818-3。
編碼器的壓縮效率通常由位元率定義,因為壓縮率依賴於位數和輸入信號的採樣率。然而,經常有產品使用CD參數(44,100赫茲、兩個通道、每通道16位或者稱為2×16位)作為壓縮率參考,使用這個參考的壓縮率通常較高,這也說明了壓縮率對於有損壓縮存在的問題。
Karlheinz Brandenburg使用CD介質的蘇珊娜·薇佳的歌曲Tom's Diner來評價MP3壓縮算法。使用這首歌是因為這首歌的柔和、簡單旋律使得在重播時更容易聽到壓縮格式中的缺陷。一些人開玩笑地將蘇珊娜·薇佳稱為「MP3之母」。來自於EBU V3/SQAM參考CD的更多一些嚴肅和critical音頻選段(鐘琴,三角鐵,手風琴,...)被專業音頻工程師用來評價MPEG音頻格式的主觀感受品質。
MP3走向大眾
編輯為了生成位兼容的MPEG Audio文件(Layer 1、Layer 2、Layer 3),ISO MPEG Audio委員會成員用C語言開發的一個稱為ISO 11172-5的參考模擬軟件。在一些非實時操作系統上它能夠演示第一款壓縮音頻基於DSP的實時硬件解碼。一些其他的MPEG Audio實時開發出來用於面向消費接收機和機頂盒的數字廣播(無線電DAB和電視DVB)。
後來,1994年7月7日弗勞恩霍夫協會發布了第一個稱為l3enc的MP3編碼器。
Fraunhofer開發組在1995年7月14日選定擴展名:".mp3"(以前擴展名是".bit")。使用第一款實時軟件MP3播放器Winplay3(1995年9月9日發布)許多人能夠在自己的個人電腦上編碼和播放MP3文件。由於當時的硬盤相對較小(如500MB),這項技術對於在計算機上存儲娛樂音樂來說是至關重要的。
MP2、MP3與因特網
編輯1993年10月,MPEG-1 Audio Layer II(MPEG-1 Audio Layer 2)文件在因特網上出現,它們經常使用Xing MPEG Audio Player播放,後來又出現了Tobias Bading為UNIX開發的MAPlay。MAPlay於1994年2月22日首次發布,現在已經移植到微軟視窗平台上。
剛開始僅有的MP2編碼器產品是Xing Encoder和CDDA2WAV,CDDA2WAV是一個將CD音軌轉換成WAV格式的CD抓取器。
Internet Underground Music Archive(IUMA)通常被認為是在線音樂革命的鼻祖,IUMA是因特網上第一個高保真音樂網站,在MP3和網絡流行之前它有數千首授權的MP2錄音。
從1995年上半年開始直到整個九十年代後期,MP3開始在因特網上蓬勃發展。MP3的流行主要得益於如Nullsoft於1997年發布的Winamp和於1999年發布的Napster,這樣的公司和軟件包的成功,並且它們相互促進發展。這些程序使得普通用戶很容易地播放、製作、共享和收集MP3文件。
關於MP3文件的點對點技術文件共享的爭論在最近幾年迅速蔓延—這主要是由於壓縮使得文件共享成為可能,未經壓縮的文件過於龐大難於共享。由於MP3文件通過因特網大量傳播,一些主要唱片廠商通過法律起訴Napster來保護它們的版權(參見知識產權)。
如ITunes Store這樣的商業在線音樂發行服務通常選擇其他或者專有的支持數字版權管理(DRM)的音樂文件格式以控制和限制數字音樂的使用[4]。支持DRM的格式的使用是為了防止受版權保護的素材免被侵犯版權,但是大多數的保護機制都能被一些方法破解。這些方法能夠被計算機高手用來生成能夠自由複製的解鎖文件。如果希望得到一個壓縮的音頻文件,這個錄製的音頻流必須進行壓縮且代價是音質的降低。
位元率
編輯位元率對於MP3文件來說是可變的。總的原則是位元率越高則聲音文件中包含的原始聲音信息越多,這樣回放時聲音品質也越高。在MP3編碼的早期,整個文件使用一個固定的位元率,稱為固定碼率(CBR)。
MPEG-1 Layer 3允許使用的位元率是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s,允許的採樣頻率是32、44.1和48千赫茲。44.1kHz是最為經常使用的速度(與CD的採樣速率相同),128kbit/s是事實上「好品質」的標準,儘管320kbit/s在P2P文件共享網絡上越來越受到歡迎。MPEG-2和[非正式的]MPEG-2.5包括其他一些位元率:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。
可變碼率(VBR)也是可能的。MP3文件的中的音頻切分成有自己不同位元率的幀,這樣在文件編碼的時候就可以動態地改變位元率。儘管在最初的實現中並沒有這項功能。VBR技術現在音頻/視頻編碼領域已經得到了廣泛的應用,這項技術使得在聲音變化大的部分使用較大的位元率而在聲音變化小的部分使用較小的位元率成為可能。這個方法類似於聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。一些編碼器在很大程度上依賴於這項技術。
高達640kbit/s的位元率可以使用LAME編碼器和自由格式來實現,但是由於它並非標準位元率之一,有些低端或早期的MP3播放器不能夠播放這些文件。
MP3的音頻品質
編輯因為MP3是一種有損壓縮格式,它提供了多種不同「位元率」(bit rate)的選項—也就是用來表示每秒音頻所需的編碼數據位數。典型的速度介於128kbps和320kbps(kbit/s)之間。與此對照的是,CD上未經壓縮的音頻位元率是1411.2 kbps(16位/採樣點× 44100採樣點/秒× 2聲道)。
使用較低位元率編碼的MP3文件通常播放品質較低。使用過低的位元率,「壓縮失真(compression artifact)」(原始錄音中沒有的聲音)將會在回放時出現。說明壓縮噪聲的一個好例子是:壓縮歡呼的聲音;由於它的隨機性和急劇變化,所以編碼器的錯誤就會更明顯,並且聽起來就像回聲。
除了編碼文件的位元率之外;MP3文件的品質,也與編碼器的品質以及編碼信號的難度有關。使用優質編碼器編碼的普通信號,一些人認為128kbit/s的MP3以及44.1kHz的CD採樣的音質近似於CD音質,同時得到了大約11:1的壓縮率。在許多情況下他們認為MP3音質不佳是不可接受的,然而其他一些聽眾或者換個環境(如在嘈雜的車中或者聚會上)他們又認為音質是可接受的。很顯然,MP3編碼的瑕疵在低端聲卡或者揚聲器上比較不明顯,而在連接到計算機的高品質立體聲系統,尤其是使用高保真音響設備或者高品質的耳機時則比較明顯。
弗勞恩霍夫協會(FhG)在他們的官方網站上,公布了下面的MPEG-1 Layer 1/2/3的壓縮率和數據速率用於比較:
- Layer 1: 384 kbit/s,壓縮率4:1
- Layer 2: 192 - 256 kbit/s,壓縮率8:1-6:1
- Layer 3: 112 - 128 kbit/s,壓縮率12:1-10:1
不同層面之間的差別是因為它們使用了不同的心理聲學模型導致的;Layer 1的算法相當簡單,所以透明編碼就需要更高的位元率。然而,由於不同的編碼器使用不同的模型,很難進行這樣的完全比較。
許多人認為所引用的速率,出於對Layer 2和Layer 3記錄的偏愛,而出現了嚴重扭曲。他們爭辯說實際的速率如下所列:
- Layer 1: 384 kbit/s優秀
- Layer 2: 256 - 384 kbit/s優秀,224 - 256 kbit/s很好,192 - 224 kbit/s好
- Layer 3: 224 - 320 kbit/s優秀,192 - 224 kbit/s很好,128 - 192 kbit/s好
當比較壓縮機制時,很重要的是要使用同等音質的編碼器。將新編碼器與基於過時技術甚至是帶有缺陷的舊編碼器比較可能會產生對於舊格式不利的結果。由於有損編碼會丟失信息這樣一個現實,MP3算法通過建立人類聽覺總體特徵的模型儘量保證丟棄的部分不被人耳識別出來(例如,由於noise masking),不同的編碼器能夠在不同程度上實現這一點。
一些可能的編碼器:
- Mike Cheng在1998年早些時候首次開發的LAME。與其他相比,它是一個完全遵循GNU寬通用公共許可證的MP3編碼器,它有良好的速度和音質,甚至對MP3技術的後繼版本形成了挑戰[來源請求]。
- 弗勞恩霍夫協會:有些編碼器不錯,有些有缺陷。
有許多的早期編碼器現在已經不再廣泛使用:
- ISO dist10
- BladeEnc
- ACM Producer Pro.
好的編碼器能夠在128到160kbit/s下達到可接受的音質,在160到192kbit/s下達到接近透明的音質。所以不在特定編碼器或者最好的編碼器話題內說128kbit/s或者192kbit/s下的音質是容易引起誤解的。一個好的編碼器在128kbit/s下生成的MP3有可能比一個不好的編碼器在192kbit/s下生成的MP3音質更好。另外,即使是同樣的編碼器同樣的文件大小,一個不變位元率的MP3可能比一個變位元率的MP3音質要差很多。
需要注意的一個重要問題是音頻信號的品質是一個主觀判斷。安慰效果(Placebo effect)是很嚴重的,許多用戶聲明要有一定水準的透明度。許多用戶在A/B測試中都沒有通過,他們無法在更低的位元率下區分文件。一個特定的位元率對於有些用戶來說是足夠的,對於另外一些用戶來說是不夠的。每個人的聲音感知可能有所不同,所以一個能夠滿足所有人的特定心理聲學模型並不明顯存在。僅僅改變試聽環境,如音頻播放系統或者環境可能就會顯現出有損壓縮所產生的音質降低。上面給出的數字只是大多數人的一個大致有效參考,但是在有損壓縮領域真正有效的壓縮過程品質測試手段就是試聽音頻結果。
如果你的目標是實現沒有品質損失的音頻文件或者用在演播室中的音頻文件,就應該使用無損壓縮(Lossless)算法,目前能夠將16位PCM音頻數據壓縮到38%並且聲音沒有任何損失,這樣的無損壓縮編碼有索尼 ATRAC Advanced Lossless、杜比實驗室 TrueHD、DTS (消歧義) Master Lossless Audio、MLP、索尼 Reality Audio、WavPack、Apple Lossless、TTA、FLAC、Windows Media Audio 9 Lossless(WMA)和APE(Monkey's Audio)等等。
對於需要進行編輯、混合處理的音頻文件要儘量使用無損格式,否則有損壓縮產生的誤差可能在處理後無法預測,多次編碼產生的損失將會混雜在一起,在處理之後進行編碼這些損失將會變得更加明顯。無損壓縮在降低壓縮率的代價下能夠達到最好的結果。
一些簡單的編輯操作,如切掉音頻的部分片段,可以直接在MP3數據上操作而不需要重新編碼。對於這些操作來說,只要使用合適的軟件("mp3DirectCut"和"MP3Gain"),上面提到的問題可以不必考慮。
MP3的設計限制
編輯MP3格式存有設計限制,即使使用更好的編碼器仍舊不能克服這些限制。一些新的壓縮格式如 Opus 等不再有這些限制。
按照技術術語,MP3有如下一些限制:
- 位元率最大是320 kbit/s,時間分辨率相對於變化迅速的信號來說太低。
- 對於超過15.5/15.8 kHz的頻率沒有因數頻帶,即超過此頻率的聲音無法編碼在MP3內,從頻譜來看,15 kHz以上的聲音全部消失了,而人耳的聽覺上限一般在20 kHz。
- 採樣頻率最高為48kHz,對於超過48kHz採樣頻率的音頻無法編碼在MP3內。
- 聯合立體聲(Joint stereo)是基於幀與幀完成的。
- 沒有定義編碼器/解碼器的整體時延,這就意味着gapless playback缺少一個正式的規定。
然而,即使有這些限制,一個經良好的調整MP3編碼器仍能夠提供與其他格式相提並論或更高的編碼品質。
MP3音頻編碼
編輯MPEG-1標準中沒有MP3編碼器的一個精確規範,然而與此相反,解碼算法和文件格式卻進行了細緻的定義。人們設想編碼的實現是設計自己的適合去除原始音頻中部分信息的算法(或者是它在頻域中的改進的離散餘弦變換表示)。在編碼過程中,576個時域樣本被轉換成576個頻域樣本,如果是瞬變信號就使用192而不是576個採樣點,這是限制量化噪聲隨着隨瞬變信號短暫擴散。
這是心理聲學的研究領域:人類主觀聲音感知。
這樣帶來的結果就是出現了許多不同的MP3編碼器,每種生成的聲音品質都不相同。有許多它們的比較結果,這樣一個潛在用戶很容易選擇合適的編碼器。需要記住的是高位元率編碼表現優秀的編碼器(如LAME這個在高位元率廣泛使用的編碼器)未必在低位元率的表現也同樣好。
MP3音頻解碼
編輯另一方面,解碼在標準中進行了細緻的定義。
多數解碼器是位元流,也就是說MP3文件解碼出來的非壓縮輸出信號將與標準文檔中數學定義的輸出信號一模一樣(在規定的數值修約誤差範圍內)。
MP3文件有一個標準的格式,這個格式就是包括384、576、或者1152個採樣點(隨MPEG的版本和層不同而不同)的幀,並且所有的幀都有關聯的頭信息(32位)和輔助信息(9、17或者32字節,隨着MPEG版本和立體聲或者單通道的不同而不同)。頭和輔助信息能夠幫助解碼器正確地解碼相關的霍夫曼編碼數據。
ID3和其他標籤
編輯「標籤」是MP3(或其他格式)中保存的包含如標題、藝術家、唱片、音軌號或者其他關於MP3文件信息等添加到文件的數據。最為流行的標準標籤格式目前是ID3 ID3v1和ID3v2標籤,最近的是APE tag。
APEv2最初是為Musepack開發的(參見APEv2規範)。APEv2可以與ID3標籤在同一個文件中共存,但是它也可以單獨使用。
音量歸一化(normalization)
編輯由於CD和其他各種各樣的音源都是在不同的音量下錄製的,在標籤中保存文件的音量信息將是有用的,這樣的話回放時音量能夠進行動態調節。
人們已經提出了一些對MP3文件增益進行編碼的標準。它們的設計思想是對音頻文件的音量(不是「峰值」音量)進行歸一化,這樣以保證在不同的連續音軌切換時音量不會有變化。
最流行最常用的保存回放增益的解決方法是被簡單地稱作「播放增益(Replay Gain)」的方法。音軌的音量平均值和修剪信息都存在元數據標籤中。
授權和專利問題
編輯Thomson Consumer Electronics在認可軟件專利的國家控制著MPEG-1/2 Layer 3專利 (頁面存檔備份,存於網際網路檔案館)的授權,這些國家包括美國和日本,歐盟國家不包括在內。Thomson積極地加強這些專利的保護。Thomson已經在歐盟國家被歐洲專利局(European Patent Office)授予軟件專利,但是還不清楚它們是否會被那裡的司法所加強。[5]
關於Thomson專利文件、授權協議和費用的最新信息請參考它們的網站MP3Licensing.com (頁面存檔備份,存於網際網路檔案館)。
在1998年9月,Fraunhofer Institute向幾個MP3軟件開發者發去了一封信聲明「發布或者銷售編碼器或者解碼器」需要授權。這封信宣稱非經授權的產品「觸犯了Fraunhofer和THOMSON的專利權。製造、銷售或者發布使用MPEG-2 Layer 3標準或者我們專利的產品,你們需要從我們這裡獲得這些專利的授權協議。」
這些專利問題極大地減慢了未經授權的MP3軟件開發並且導致人們的注意力轉向開發和歡迎其他如WMA和Vorbis這樣的替代品。Windows開發系統的製造商微軟公司從MP3轉向它們自有的Windows Media格式以避免與專利相關的授權問題。直到那些關鍵的專利過期之前,未經授權的編碼器和播放器在認可軟件專利的國家看起來都是非法的。
儘管有這些專利限制,「永恆」的MP3格式繼續向前發展;這種現象的原因看起來是由如下因素帶來的網絡效應:
- 熟悉這種格式,不知道有其他可選格式存在
- 這些可選格式沒有普遍地明顯超過MP3的優勢
- 大量的MP3格式音樂
- 大量的使用這種格式的不同軟件和硬件
- 沒有數字版權管理保護技術,這使得MP3文件可以很容易地修改、複製和通過網絡重新發布
- 大多數家庭用戶不知道或者不關心軟件專利爭端,通常這些爭端與他們個人用途而選用MP3格式無關
另外,專利持有人不願對於開源解碼器加強授權費用的徵收,這也帶來了許多免費MP3解碼器的發展。另外,儘管他們試圖阻止發布編碼器的二進制代碼,Thomson已經宣布使用免費MP3編碼器的個人用戶將不需要支付費用。這樣,儘管專利費是許多公司打算使用MP3格式時需要考慮的問題,對於用戶來說並沒有什麼影響,這就帶來了這種格式的廣受歡迎。
Sisvel S.p.A. (頁面存檔備份,存於網際網路檔案館)和它的美國子公司Audio MPEG, Inc.以前曾經以侵犯MP3技術專利為由起訴Thomson[6],但是那些爭端在2005年11月最終以Sisvel給Thomson MP3授權而結束。Motorola最近也與Audio MPEG簽署了MP3的授權協議。由於Thomson和Sisvel都擁有他們聲稱編解碼器必需的單獨的專利,MP3專利的法律狀態還不清晰。
專利過期
編輯與MP3相關的專利已於2017年4月16日全數過期。[7][8]MP3進入公有領域後,任何人使用皆無須付專利授權費。[9][10]
其他技術
編輯有許多其他的有損音訊編解碼存在,其中包括:
- MPEG-1/2 Audio Layer 2(MP2),MP3的前輩;
- Musepack,也稱作Musepack(以前叫MP+),由MP2派生出來;
- mp3PRO,Thomson Multimedia的MP3和SBR的組合,適用於低比特率壓縮,是MP3格式的升級版;
- AAC,Apple公司的iTunes音樂商店和IPod使用;
- AC-3,杜比數字和數碼多功能影音光碟中使用;
- Vorbis,Xiph.Org基金會開發,自由軟件和沒有專利的編解碼器;
- Speex,基於碼激勵線性預測的專門為語音和網際協議通話技術設計的自由軟件和無專利編解碼器;
- Opus (音頻格式),Xiph.Org基金會開發,是開放標準定義於互聯網工程任務組 RFC 6716,有更低的延遲和更好的聲音壓縮率,希望用單一格式包含聲音和語音,取代Speex和Vorbis;
- AMR-WB+針對蜂窩電話和其他有限帶寬使用進行了優化的增強自適應多速寬帶編解碼器(Enhanced Adaptive Multi Rate WideBand codec);
- ATRAC,索尼的MD使用;
- QDesign,用於低速QuickTime;
- Windows Media Audio(WMA)來自於微軟公司;
- RealNetworks的RealAudio,經常用於網站的流媒體。
MP2、MP3、mp3PRO、和AAC都是同一個技術家族中的成員,並且都是基於大致類似的心理聲學。弗勞恩霍夫協會擁有許多涵蓋這些編解碼器所用技術的基本專利,杜比實驗室、索尼、Thomson Consumer Electronics和AT&T擁有其他一些關鍵專利。
在網際網路上有一些其他無損音訊壓縮方法。儘管它們與MP3不同,它們是其他壓縮機制的優秀範例,它們包括:
- FLAC (Free Lossless Audio Codec)
- Monkey's Audio(APE)
- SHN,也稱為Shorten
- TTA
- WavPack
- Apple Lossless
- MPEG-4 ALS
聽覺測試試圖找出特定位元率下的最好質量的有損音訊編解碼。在128kbit/s下,AAC、MPC、WMA Pro和OGG Vorbis性能持平處於領先位置,LAME MP3稍微落後。在64kbit/s下,AAC-HE和mp3pro少許領先於其他編解碼器。在超過128kbit/s下,多數聽眾聽不出它們之間有明顯差別。什麼是「CD音質」也是很主觀的:對於一些人來說128kbit/s的MP3就足夠了,而對於另外一些人來說必須是200kbit/s以上的位元率。
儘管如WMA和RealAudio這些新的編解碼器的支持者宣稱它們各自的算法能夠在64kbit/s達到CD音質,聽覺測試卻顯示了不同的結果;不過這些編解碼器在64kbit/s的音質明顯超過同樣位元率下MP3的音質。開源的Vorbis的開發者也宣稱它們的算法超過了MP3、RealAudio和WMA的音質,上面提到的聽覺測試證實了這種說法。Thomson宣稱它的mp3PRO在64kbit/s達到了CD音質,但是測試者報告說64kbit/s的mp3Pro文件與112kbit/s的MP3文件音質類似,但是直到80kbit/s時它才能接近CD音質。
專門為MPEG-1/2視頻(VCD/DVD)設計/優化的MP3總體上在低於48kbit/s的單聲道數據和低於80kbit/s的立體聲上表現不佳。
參考文獻
編輯- ^ The audio/mpeg Media Type - RFC 3003. IETF. November 2000 [2009-12-07]. (原始內容存檔於2012-03-23).
- ^ MIME Type Registration of RTP Payload Formats - RFC 3555. IETF. July 2003 [2009-12-07]. (原始內容存檔於2012-03-23).
- ^ A More Loss-Tolerant RTP Payload Format for MP3 Audio - RFC 5219. IETF. February 2008 [2009-12-07]. (原始內容存檔於2021-01-26).
- ^ 什么是iTunes DRM保護?. DumpMedia. 2020-05-14 [2024-06-14]. (原始內容存檔於2024-06-14).
- ^ 參見歐洲專利協定中的軟件專利。
- ^ Audio MPEG and Sisvel: Thomson sued for patent infringement in Europe and the United States - MP3 players stopped by customs(英文)
- ^ MP3 專利全數過期 你現在用什麼聽音樂?. 癮科技. 2017-05-13 [2017-05-15]. (原始內容存檔於2020-12-22).
- ^ MP3专利终止 AAC"上位" 后者能否担起重任?. 網易科技. 北京商報. 2017-05-15 [2017-05-15]. (原始內容存檔於2017-05-17).
- ^ 別再說「MP3已死」,它只是不再受專利限制. The News Lens 關鍵評論網. 2017-05-16 [2019-02-18]. (原始內容存檔於2019-06-08).
- ^ MP3 格式未死!專利過期可能令它更壯大!. Techapple. 2017-05-23. (原始內容存檔於2021-09-23).