Praat語音學軟件
Praat語音學軟件,原名Praat: doing phonetics by computer,通常簡稱Praat,是一款跨平台的多功能語音學專業軟件,主要用於對數碼化的語音信號進行分析、標註、處理及合成等實驗,同時生成各種語圖和文字報表。
原作者 | 保羅·布爾斯馬、
大衛·韋寧克 |
---|---|
首次發佈 | 1991年 |
當前版本 | 6.4.23(2024年10月27日[1]) |
原始碼庫 | |
作業系統 | 跨平台: Macintosh, Windows, Linux, FreeBSD, SGI, Solaris, HPUX |
語言 | 英語 |
類型 | 語言學軟件(語音學) |
許可協議 | |
網站 | www |
背景概要
編輯命名
編輯Praat(國際音標 [praːt]或[pʀaːt])在荷蘭語中是說話或交談的意思,而doing phonetics by computer即使用計算機研究語音學。作為軟件的名稱,常被稱作Praat語音學軟件。
作者
編輯Praat的作者是荷蘭阿姆斯特丹大學人文學院語音科學研究所的主席保羅·布爾斯馬(Paul Boersma)教授和大衛·韋寧克(David Weenink)助教授。
版本
編輯Praat最早的版本發佈於1993年。起初用戶還無法自由地下載使用,但從2003年6月5日的4.1版起,作者取消了專門的授權並開放了絕大部分原始碼。進一步,從2004年3月4日的4.2版起,作者開放了全部原始碼,使Praat成為採用GNU通用公共許可證授權的開源軟件。作者會時常發佈修訂版本,消除舊的故障,增添新的功能。2007年12月10日發佈了5.0版。[2]
Praat目前支持在多種計算機平台上運行,包括:
作者為以上平台的用戶提供已編譯好的目標文件。高級用戶還可以在其他作業系統平台上修改並編譯原始碼後運行Praat程序。
Praat能夠在圖形和命令行兩種用戶界面下運行,但兩種界面的目標文件(可執行文件)各自獨立,以Windows版為例,即分為praat.exe和praatcon.exe兩個可執行文件,其中後者只能通過命令行方式從控制台調用。
功能簡介
編輯請注意:和維基百科中其他介紹軟件產品的條目一樣,本條目以下章節中對Praat的功能進行的簡要介紹僅供讀者參考,不可能也無意於代替由開發者提供的手冊文檔。
用途概述
編輯Praat的主要功能是對自然語言的語音信號進行採集、分析和標註,並執行包括變換和濾波等在內的多種處理任務。作為分析結果的文字報表和語圖,不但可以輸出到個人計算機的磁盤文件中和終端的顯示器上,更能夠輸出為精緻的向量圖或位圖,供寫作和印刷學術論文與專著使用。
此外,Praat還可用於合成語音或聲音、統計分析語言學數據、輔助語音教學測試,等等。隨着新版本的發佈,Praat的功能和用途仍在不斷擴展,但實際上多數用戶只需要用到一小部分功能。
構成與界面
編輯Praat程序由外圍與核心兩層構成。外圍主要包括對象窗口(Object window,標題為Praat objects)、畫板窗口(Picture window,標題為Praat picture)、腳本編輯器(ScriptEditor)、按鈕編輯器(ButtonEditor)、數據編輯器(DataEditor,無固定標題)、情報窗口(Info window)和手冊(Manual)等不負責具體的信號處理任務的輔助性組件。Praat每次啟動時,自動打開對象窗口和畫板窗口。對象窗口也是Praat的主控窗口,在Praat程序的會話進程中始終打開,大部分功能也需要由此展開。腳本(script)在是Praat中執行各種操作的宏命令,能夠簡化日常操作,減少出錯,並實現大量複雜操作的自動化。按照作者的最初設想,除了Praat之外還會有其他程序使用與Praat相同的外圍程序,但多年來一直沒有實現[4]。
Praat的核心部分即具體負責語音信號處理任務的程序,包括所有的對象類型(Types of object)、動作命令(Action commands)和相應的編輯器(Editors)。對象(object)是由Praat程序所構建的數據存儲載體,有很多種類型,如聲音(Sound)、文本表格(TextGrid)、音高(Pitch)、變換(Manipulation),等等,通過執行編輯器或動態選單(Dynamic menu)中的動作命令完成對數據的查詢(數碼化測量)和處理(生成新對象)任務。聲音編輯器(SoundEditor)和文本表格編輯器(TextGridEditor)是Praat中最常用的兩種編輯器,多用於涉及語音分析和標註的科學研究與課堂教學。
語音分析與標註
編輯對語音信號的分析與標註是Praat的基本功能。在Praat中錄音或讀取音頻文件後,可以按用戶要求顯示以下多種語圖:
- 三維語圖(spectrogram)
- 頻譜切片(spectral slices)
- 音高(即基頻[5])曲線(pitch contour)
- 共振峰曲線(formant contour)
- 音強曲線(intensity contour)
所有的語圖都可以繪製成精緻的向量圖,也可以將相應的對象數據保存為磁盤文件。除直觀的語圖外,Praat也能通過對信號數據的計算獲得各種文字情報,比如音高、時長、第一或第二共振峰頻率的數值等,也同樣可以根據需要輸出為適當的形式。
Praat允許用戶對語音數據進行標註,包括音段切分和文字註釋,標註的結果還可以獨立保存和交換。然而,Praat本身缺乏自動標註功能,只能對有聲段和靜默段進行簡單的識別,而不能對音節、節拍群等語流單位加以切分。[6]
其他功能
編輯Praat還具有許多其他功能,包括:
其中某些功能的提供與軟件作者的研究興趣有關(例如「優選論學習」),很多不相關的用戶可能不會用到。
引文著錄
編輯寫作學術論文或專著時如果用到Praat軟件,有必要在參考文獻中進行着錄。作者推薦的方式是[7]:
Paul Boersma & David Weenink (2005): Praat: doing phonetics by computer (Version 4.5.16) [Computer program]. Retrieved Feb 22, 2007, from http://www.praat.org/
如果不允許引用電腦程式,則改引另一處來源:
2001 PRAAT, a system for doing phonetics by computer. Glot International 5(9/10): 341-345. (These pages include a review by Vincent van Heuven.)
在漢語期刊中引用時,應另外酌情修改。
評價與影響
編輯優點
編輯- 可以免費獲得而無需購買(因為是開源軟件)。
- 無需安裝即可運行(但嚴格地說,還不是綠色軟件)。
- 支持多種作業系統平台。
- 支持用腳本宏命令和插件(plug-in)擴展和簡化操作。
- 專業功能強大而完備。
- 高級用戶可以按需修改原始碼並重新編譯,從根本上擴充原有功能。
- 附有詳細的手冊文檔。
缺點
編輯- 分析程序採用的某些數碼訊號處理算法[8]仍然不盡如人意,會不可避免地造成迷惑人的假象或產生難以解釋的結果。
- 不能直接訪問某些常用音頻和圖像文件格式,如WMA格式;對MP3格式的支持也僅限讀取(軟件許可證方面的原因)。
- 由於最初並不是在Windows平台下開發的,用戶界面的設計和某些操作習慣可能會讓Windows用戶感到不便,比如沒有鼠標右鍵菜單,鍵盤按鍵名稱也是Macintosh機器的。
- 目前尚無除英語以外其他語言的版本,部分用戶可能會遇到語言障礙。
- 尚未全面支援Unicode。檔案名稱如果包含漢字,在Praat對象窗口中會被底線取代。在TextGrid對象中如果輸入漢字,屏幕上會顯示亂碼(但所儲存文本仍舊正常,只是顯示不出來)。標註時所使用的國際音標字型為SIL Doulos IPA 1993(頁面存檔備份,存於互聯網檔案館),而非SIL推薦的Unicode 字型[9]。
影響
編輯- 儘管還存在一些缺點和不足,畢竟瑕不掩瑜,Praat已成為全世界實驗語音學、心理語言學、語言教學、語言調查、自然語言處理等相關領域的高校教師、學生和其他研究人員普遍選用的專業軟件。
- Praat的普及,終結了從事實驗語音學特別是聲學語音學[10]研究必須依賴價格昂貴的實驗儀器的時代,許多語音學實驗室不再使用各種陳舊的語圖儀,而僅僅配置有安裝了Praat等軟件的個人計算機和靈敏的麥克風作為必備的器材。
- 部分Praat高級用戶公開發布自己編寫的腳本甚至插件,其中不乏實用性較高者,既擴充了軟件的功能,也擴大了影響。
- 在中國大陸:儘管只有英語版本可用,許多高校的教師在語音學等相關課程上用Praat進行教學演示,在研究工作中自己使用並鼓勵學生克服語言障礙學習掌握Praat的基本功能。越來越多的學術論文和專著當中可以見到用Praat生成的語圖和文字報表。不過,總體而言,了解並能夠用好這一工具的專業人士還比較少。
參考書目
編輯專門介紹Praat使用方法的著作,在世界範圍內也並不多見。在中國大陸,有些語音學研究者也作有非正式出版的講義,而正式出版的學術專著也可能特辟章節簡單講解,列舉如下(按出版日期先後排序):
- Praat語音軟件使用手冊/熊子瑜(2004年現代語音學暑期講習班課程講義,有電子版)
- 語音特徵分析和Praat軟件的使用/熊子瑜(2005年現代語音學暑期講習班課程講義,有電子版)
- 語言、語音與技術/王士元,彭剛著.-上海:上海教育出版社,2006年8月(中國當代語言學叢書,ISBN 7-5444-0714-4)——第十二章,Praat簡介
- 實驗語音學的基本原理與Praat軟件操作(2016 貝先明 向檸)
外部連結
編輯官方資源
編輯本文編撰的主要參考文獻即以下的官方網站內容[11]:
- Praat: doing phonetics by computer(頁面存檔備份,存於互聯網檔案館) Praat官方網站[12],提供最新版軟件及原始碼下載等
- Praat User List(頁面存檔備份,存於互聯網檔案館) 作者參與的Praat用戶討論組,位於Yahoo! Groups(頁面存檔備份,存於互聯網檔案館)
- 荷蘭阿姆斯特丹大學(頁面存檔備份,存於互聯網檔案館) 人文學院(頁面存檔備份,存於互聯網檔案館) 語音科學研究所(頁面存檔備份,存於互聯網檔案館) 兩位作者所在單位的網站
第三方資源
編輯許多有經驗的Praat用戶通過互聯網發佈自己編寫的使用教程、腳本和插件,但不一定允許免費自由下載(按資源類別和作者姓名拉丁字母/漢語拼音順序排序):
- 使用教程
- Goldman, Jean-Philippe (2004)。Praat tutorial and resources.
- [永久失效連結] van Lieshout, Pascal (2005)[永久失效連結]。Praat short tutorial: An introduction.
- Welby, Pauline & Ito, Kiwako (2002)。Praat tutorial.
- Wood, Sidney (2005)。Beginners guide to Praat.
- 熊子瑜(2004)。Praat語音軟件使用手冊。2004年現代語音學暑期講習班課程講義。
- 徐清白(2005-2007)(頁面存檔備份,存於互聯網檔案館)。Praat手冊漢語版。官方手冊的漢語翻譯版本HTML文檔(未完成).
- 視頻教程
- Praat Language Lab 教導英語教學的師生如何以Praat軟件改善發音。
- 腳本
- Agustín Gravano (2006)(頁面存檔備份,存於互聯網檔案館)。ToBI Annotation Environments
- Bert Remijsen (2004)(頁面存檔備份,存於互聯網檔案館)。Bert Remijsen's Praat scripts
- CHILDES (n.d.)。Slicing and Splicing with Praat.
- Chris Darwin (2005)(頁面存檔備份,存於互聯網檔案館)。Praatscripts.
- Florian Jaeger (2004)。Praat scripting tutorial Basics.
- Gareth Walker (2005)。Praat.
- Guillaume Rolland (2000)。Automatic stylisation of the fundamental frequency F0 using MOMEL.
- Ingmar Steiner (2005)。Praat Scripts.
- Johan Frid (2006)。Praat Scripts.
- John Tøndering (n.d.)。Praat.
- Katherine Crosswhite (n.d.)。Praat Scripts and Other Materials.
- Kyuchul Yoon (n.d.)(頁面存檔備份,存於互聯網檔案館)。praat.
- Mietta Lennes (2006)(頁面存檔備份,存於互聯網檔案館)。Mietta's Praat scripts.
- Pauline Welby (n.d.)。Pauline Welby's Praat Info.
- http://fips.igl.uni-freiburg.de/~peter/praatscripts.htm(頁面存檔備份,存於互聯網檔案館)。Kleine Sammlung von PraatScripts.
- Piet Mertens (2004-2005)。Prosogram Additional tools.
- Setsuko Shirai (n.d.)。Praat Scripts
- 許毅 (2006)。TimeNormalizeF0.praat
- 插件
- Mertens, Piet (2005)。Prosogram.
- Plichta, Bartek (2006)。Akustyk.
另外,在一些論壇網站開設的語音學專業版面上,也聚集了水平各異的Praat用戶(按論壇名稱漢語拼音排序):
腳註
編輯- ^ Releases. Github. [3 September 2019]. (原始內容存檔於2017-01-24).
- ^ 詳見What's new?(Praat手冊文檔) (頁面存檔備份,存於互聯網檔案館)的全部記載。
- ^ 大約從4.6版起分成兩個版本,分別適用於Windows 95/98/NT4/ME系統與Windows 2000/XP/Vista系統。
- ^ 參看What's new?(Praat手冊文檔) (頁面存檔備份,存於互聯網檔案館) 2005年9月1日4.3.21版更新說明的第2條。
- ^ 嚴格地講,音高是一個聽覺的心理學概念,而基頻是一個物理學概念,但本文和Praat軟件的界面與文檔中將二者視為等同的概念術語,pitch大多翻譯作音高,而f0或f0一律翻譯作基頻。
- ^ 音節的概念對於不同語言不盡相同,即便是同一種語言,學術界也存在爭議。在工程實現中,具體的語種和應用目的決定音節切分的標準和程序。節拍群等更不必說。因此,這類自動切分程序由各種語言的研究者和工程師提供可能更為合適。
- ^ 參看Paul Boersma's writings on the Praat program (頁面存檔備份,存於互聯網檔案館)或FAQ: How to cite Praat(Praat在線幫助) (頁面存檔備份,存於互聯網檔案館)。
- ^ 有關Praat軟件分析算法的詳細情況,可以參看Paul Boersma's writings on the Praat program (頁面存檔備份,存於互聯網檔案館)所列文獻。
- ^ 參見官方網站的下載說明 (頁面存檔備份,存於互聯網檔案館)。Praat自3.2版開始使用SIL字型,沿襲至今。SIL Doulos IPA 1993 (頁面存檔備份,存於互聯網檔案館)是早期廣為使用的國際音標字型,但SIL已將其作廢 (頁面存檔備份,存於互聯網檔案館),改推薦Unicode的國際音標字型。在使用者討論群組曾有人詢問[失效連結]如何在Praat軟件中顯示非印歐語系的字元,但作者博爾斯馬表示[失效連結],目前尚無此功能,除非他將整個軟件轉換成Unicode版本。作者承諾[失效連結]將在4.7版中提供更多對Unicode的支持,並已從4.6.07版開始逐步提供相應的測試性實現。根據官方公佈的消息 (頁面存檔備份,存於互聯網檔案館),自5.0.21版起,Praat支持在標註功能中使用漢字、韓文、阿拉伯文、基里爾字母等字符。
- ^ 聽覺語音學或心理語言學的實驗涉及對人腦功能的觀測,仍然需要特殊的儀器,而且價格十分昂貴。
- ^ 其中一部分也見於Praat軟件所附手冊文檔。
- ^ www.praat.org只是一個自動轉向這裏的域名。