OmegaT
此條目包含過多僅特定讀者會感興趣的過度細節內容。 (2023年6月1日) |
OmegaT是一個使用Java程式語言編寫的電腦輔助翻譯工具。它是自由軟件,最初的開發由Keith Godfrey在2000年進行,目前的開發工作由Didier Briel帶領的團隊進行。OmegaT名稱在德國是註冊商標。
原作者 | Keith Godfrey |
---|---|
開發者 | Didier Briel, Alex Buloichik, Zoltan Bartko, Tiago Saboga等 |
首次釋出 | 2002年11月28日 |
目前版本 | |
原始碼庫 | |
作業系統 | 跨平台(Java) |
類型 | 電腦輔助翻譯 |
特許條款 | GPL |
網站 | omegat.org |
OmegaT適用於專業譯員。它的功能包括使用正則表達式的可自訂分段,帶有模糊匹配和匹配傳播的翻譯記憶,術語庫匹配,詞典匹配和參考資料搜尋以及使用Hunspell拼寫詞典的行內拼寫檢查功能。
OmegaT可執行於Linux、Mac OS X和Microsoft Windows 98 SE或更高版本,[4]並且需要Java 1.5。它的介面和文件被翻譯成29種語言。在2010年對458名專業譯員的調查[5]表明,OmegaT的用戶數達到Wordfast、DejaVu和MemoQ的1/3,且達到了市場領導者塔多思的1/8。在Bing翻譯的合作夥伴中,OmegaT是其中唯一一個免費的專業級輔助翻譯工具[6] 。
歷史
編輯OmegaT最初由Keith Godfrey開發於2000年。當時使用C++進行編寫。
在2001年二月[7]首次公開發布的版本使用Java寫成。在這個版本中使用專有翻譯記憶庫格式。它能翻譯無格式的純文字檔案、HTML以及執行塊級別的分割規則(即分割成段落而不是句子)。
開發和軟件的釋出
編輯OmegaT的開發寄存在SourceForge。開發團隊由Didier Briel領導。和許多開源專案一樣,新版本的OmegaT會頻繁釋出,通常每個新版本含有2-3個錯誤修改和功能升級。這個指的是「標準」版本,其中總是含有完整的用戶手冊和包含一些還未寫入用戶手冊的功能的「最新」版本。[8]可以從Sourceforge的代碼版本庫的更新源進行更新。[9]
OmegaT的工作原理
編輯對於每個翻譯任務,OmegaT會建立包含指定檔案的專案資料夾的集合。用戶把未翻譯文件複製到其中的/source/子資料夾,而在翻譯結束後,已翻譯的文件會出現在/target/子資料夾中。OmegaT會在編輯窗格的片段中顯示已分段的源文件的可翻譯內容供用戶翻譯。
在開始翻譯前,用戶還可以複製以前的翻譯記憶到/tm/子資料夾,複製術語庫到/glossary/資料夾以及複製StarDict詞典到/dictionary/資料夾,在翻譯時OmegaT會自動查閱它們。
進行翻譯時,OmegaT會自動檢查以前的翻譯以尋找類似的句子,找到後會顯示在模糊匹配窗格中。譯員可以使用快速鍵把模糊匹配插入到編輯窗格。OmegaT還會查閱用戶預先添加到專案資料夾的術語庫和詞典。如果啟用了機器翻譯,例如谷歌翻譯,那麼它會顯示在單獨的機器翻譯窗格。
翻譯結束後,OmegaT會建立已翻譯的檔案,並匯出專案當前的翻譯到TMX檔案中,這樣這些檔案可以在以後翻譯時重用或者和其他使用OmegaT或其他CAT工具的譯員進行交換。
OmegaT的功能
編輯OmegaT擁有主流CAT工具具有的許多功能。包括建立,匯入和匯出翻譯記憶,使用翻譯記憶進行模糊匹配,查詢術語表、索引定位和一致性搜尋。
OmegaT還擁有其他CAT工具不具有的功能,包括:
- OmegaT可以同時翻譯不同檔案格式的多個檔案,且查閱多個翻譯記憶、術語表和詞典(只受電腦可用主記憶體的限制)。
- 通過支援的檔案類型,OmegaT允許用戶自訂副檔名和檔案編碼。對於一些文件類型,用戶還可以有選擇地翻譯哪些元素(例如對於OpenOffice.org Writer檔案,可選擇是否翻譯書籤;對於Microsoft Office 2007/2010 檔案,可選擇是否翻譯註腳;而對於HTML,可選擇是否翻譯圖像的ALT文字)。用戶還可以選擇如何處理第三方翻譯記憶中的非標準元素。
- OmegaT的片段分割規則基於正則表達式。可以組態片段分割規則基於語言或檔案格式,而連續的片段分割規則繼承彼此的值。
- 在編輯窗口,用戶可以直接跳到下一個未翻譯片段或在歷史中前進以及後退。用戶可以復原和重做,複製和貼上,以及用與進階文字編輯器相同的方式切換大小寫狀態。用戶可以選擇檢視已翻譯片段的源文字。編輯窗格還含有使用Hunspell詞典的行內拼寫檢查功能以及使用滑鼠進行互動地拼寫檢查。
- 用戶可以使用鍵盤快速鍵或滑鼠插入模糊匹配。OmegaT使用彩色顯示模糊匹配的相似度。OmegaT還可以顯示翻譯了任意指定片段的日期、時間和用戶名。匹配的術語可以用滑鼠插入。用戶可以選擇把源文字複製到目標文字區域或自動插入最接近的模糊匹配。
- 在搜尋窗口,用戶可以選擇搜尋當前檔案的源文字,目標文字,其他翻譯記憶和參考檔案。搜尋可以是區分大小寫的,還可以使用正則表達式。雙擊搜尋結果可以直接跳轉到編輯窗口中的相應片段。
- 翻譯完成後,OmegaT可以執行標籤檢驗以確保沒有意外的標籤錯誤。OmegaT可以在專案開始前統計專案檔案和翻譯記憶的狀態,以及在翻譯期間顯示翻譯任務的進度。
- OmegaT可以從Apertium、Belazar以及Google翻譯取得機器翻譯並顯示在單獨的窗口中。
- 在OmegaT用戶介面中可以對各個窗口向周圍移動、最大化、平鋪、標籤化和最小化。當OmegaT啟動時會顯示「快速入門指南」的簡短精靈。
支援的文件格式
編輯OmegaT支援直接翻譯多種檔案類型。OmegaT根據副檔名來確定檔案類型。可以自訂副檔名關聯的處理方式和首選的編碼來覆蓋預設設置。
OmegaT把格式轉換成標籤來處理含格式的文件,類似於其他商業的CAT工具。
直接支援的格式
編輯OmegaT可以直接翻譯下列格式:
檔案格式 | 副檔名模式 |
---|---|
文件格式 | |
使用任意 Java 可處理的編碼(包括Unicode)的文字 所有純文字衍生格式,如 DokuWiki, MediaWiki 和 Markdown |
.txt, .txt1, .txt2, .utf8, .md |
HTML/XHTML | .html, .htm, .xhtml, .xht |
OpenDocument (ODF),[10]用於LibreOffice、StarOffice、OpenOffice | .sx?, .st?, .od?, .ot? |
Microsoft OOXML | .doc?, .xls?, .ppt? |
幫助和手冊頁 | .xml, .hmxp |
HTML 幫助編譯器 | .hhc, .hhk |
LaTeX | .tex, .latex |
QuarkXPress CopyFlow Gold | .tag, .xtg |
DocBook | .xml, .dbk |
本地化資源格式 | |
Android 資源 | .xml |
Java properties | .properties |
Typo3 LocManager | .xml |
Mozilla DTD | .dtd |
Windows 資源 | .rc |
WiX 本地化 | .wxl |
ResX | .resx |
有Key=Value 結構的檔案 |
.ini, .lng |
多語言本地化格式 | |
XLIFF | .xlf, .sdlxliff |
Portable Object (PO) | .po, .pot |
其他格式 | |
SubRip 字幕 | .srt |
SVG 向量圖 | .svg |
值得注意的是,OmegaT 還提供 MediaWiki 匯入功能。
間接支援的格式
編輯有兩種方式讓OmegaT處理不支援的格式:
- 把這種格式的副檔名註冊到首選的檔案過濾器 (通常是帶格式的純文字)
- 在這之後可以使用分段設定正則表達式來最佳化結果
- 把這種格式轉換為直接支援的格式
對於XLIFF的支援
編輯Okapi Framework中的Rainbow程式可以把某些檔案格式轉換成OmegaT支援的XLIFF格式。Rainbow還可以從這類文件中建立完整的OmegaT專案資料夾,便於OmegaT的處理。[11]
對於Gettext PO的支援
編輯一些檔案格式可以轉換為能在OmegaT中翻譯的Gettext Portable Object (PO) 檔案。Debian Linux 中的po4a程式可以把類似LaTeX、TeX以及POD的格式轉換為Gettext PO。[12]Translate Toolkit可以把Mozilla .properties 和dtd檔案、CSV 檔案、某些Qt .ts檔案以及某些XLIFF檔案轉換為Gettext PO。
對於Office Open XML和ODF的支援
編輯從版本97到2003的Microsoft Word、Excel以及PowerPoint文件可以轉換為Office Open XML (Microsoft Office 2007/2010)或ODF (OpenOffice.org)格式。這種轉換過程並不是無失真的,可能導致某些格式的遺失。
對於Trados® .ttx檔案的支援
編輯Trados® .ttx可以使用Okapi TTX Filter(頁面存檔備份,存於互聯網檔案館)進行處理。
支援的翻譯記憶和術語庫格式
編輯TMX格式的翻譯記憶
編輯OmegaT的內部翻譯記憶格式對用戶不可見,但每次它自動儲存翻譯專案時,會自動把所有新增和更新的翻譯單元都匯出並添加到三個外部的TMX翻譯記憶:一個原生的OmegaT TMX、一個級別1的TMX以及一個級別2的TMX。
- 原生的TMX是為了用於OmegaT中的專案。
- 級別1的TMX檔案保留了文字資訊,可以用在支援TMX級別1和2的CAT工具中。
- 級別2的檔案保留了文字資訊和相應的行內標籤資訊,可用在支援TMX級別2的CAT工具中。
匯出的級別2檔案包含了封裝在TMX標籤中的OmegaT內部標籤,這樣的TMX檔案可以在支援TMX級別2的CAT工具中生成匹配。在Trados和SDLX中測試通過。
OmegaT支援匯入最高1.4b版本級別1和級別2的TMX檔案。在OmegaT中匯入級別2的檔案會生成相同級別的匹配,因為OmegaT會把外部的TMX標籤轉換為TMX級別2的標籤。對於由Transit建立的TMX檔案測試又通過了。
術語庫
編輯對於術語庫,OmegaT主要使用tab分隔的UTF-8編碼且副檔名為.txt的純文字檔案。術語庫檔案的結構非常簡單:首列包含源語言詞語,第二列包含對應的目標語言詞語,第三列(可省略)與詞語相關的上下文註釋等。文字編輯器中可以很容易建立這樣的術語庫。
還支援使用標準CSV格式的類似結構的檔案,對於TBX檔案同樣如此。
社區用戶的參與
編輯OmegaT專案
編輯此章節的準確性有爭議。(October 2010) |
The OmegaT Project is a sort of 「computer literacy」 group that focus on translators' needs. Users are encouraged to contribute tools written by themselves in response to translators' needs which are not yet addressed by the main OmegaT program itself.[13]
OmegaT的本地化
編輯OmegaT的用戶介面和文件已經被翻譯為大約30種語言。志願翻譯人員可以翻譯用戶介面,「快速入門指南」簡短精靈或完整的用戶手冊(或者所有的三個部分)。所有的語言檔案和用戶手冊的翻譯都包含在標準的OmegaT釋出程式中。
用戶建立的程式
編輯OmegaT用戶社區的特色是對於OmegaT的不足之處經常提示用戶建立實現那些功能的宏、指令碼和程式,儘管有時某些功能後來會成為OmegaT自身的一部分。當OmegaT只能進行段落分割時,有用戶建立了OpenOffice.org宏進行根據句子進行分割。當在OmegaT中自動平衡多個TM仍需合併TM時,有用戶建立了TMX合併指令碼。當OmegaT沒有提供拼寫檢查支援時,有多個用戶建立指令碼或找到解決方案作為OmegaT的一部分用來在翻譯過程中提供拼寫檢查功能。[14]
當前提供了某些功能且尚未內建於OmegaT的工具包括一個用於Trados TagEditor檔案的轉換程式,兩個簡單的對齊器,一個不工作的術語添加工具以及一個把標籤視為預留位置的工具。[15]
基於OmegaT構建的其他軟件
編輯Autshumato translation suite
編輯Autshumato套件包含CAT工具,雙語對齊器,PDF提取器,TMX編輯器和基於抓取數據的公共TM。最終的版本將包含術語管理器和機器翻譯程式。其中的CAT工具是以OmegaT為基礎構建的,且需要OpenOffice.org才能執行。它的開發資金由南非政府的藝術和文化部門提供。[16]
Benten
編輯Benten是基於XLIFF的Eclipse。它使用OmegaT代碼來處理翻譯記憶匹配過程。它的部分開發資金由日本政府提供。[17]
Boltran
編輯Boltran是模仿OmegaT專案工作流程的基於網絡的獨立CAT工具。它基於開源的OmegaT構建,因此能翻譯任何OmegaT可以翻譯的內容,且含有與OmegaT幾乎等同的術語管理和模糊匹配能力。目前,唯一公開的Boltran伺服器是開發者的網站,但在理論上任何人都可以建立公開或私有的Boltran伺服器。[18]
OmegaT+
編輯OmegaT+ 是在 2005 年從 OmegaT 的 1.4.5 版本衍生而來的 CAT 工具。其工作方式類似於 OmegaT,同時開發了一些自己的功能,且使用了與 OmegaT 不相容的專案格式[19]。在許多時候,這個名稱容易讓不了解的人誤以為是 OmegaT 的增強版本,而實際上 OmegaT+ 只是 OmegaT 1.4.5 的增強版本,且從 2005 年至今 OmegaT 中已增加了大量功能增強和新特性。
用戶評價
編輯另請參閱
編輯參考
編輯- ^ https://github.com/omegat-org/omegat/releases/tag/v4.3.3; 出版日期: 2022年3月18日; 檢索日期: 2022年5月27日.
- ^ https://github.com/omegat-org/omegat/releases/tag/v5.7.1; 出版日期: 2022年3月18日; 檢索日期: 2022年5月27日.
- ^ Release 5.8.0. 2023年4月23日 [2023年4月26日].
- ^ 存档副本. [2010-10-24]. (原始內容存檔於2010-03-22).
- ^ 存档副本. [2012-01-14]. (原始內容存檔於2012-02-29).
- ^ 存档副本. [2013-12-21]. (原始內容存檔於2013-11-28). Microsoft Translator Partners
- ^ 存档副本. [2012-01-14]. (原始內容存檔於2010-12-04).
- ^ [1] (頁面存檔備份,存於互聯網檔案館) OmegaT's "standard" and "latest" versions
- ^ [2] Archive.is的存檔,存檔日期2012-07-17 The latest source files are always available from the Sourceforge code repository
- ^ Open Document Format for Office Applications (頁面存檔備份,存於互聯網檔案館) – ISO/IEC 26300:2006 format
- ^ Okapi Framework (頁面存檔備份,存於互聯網檔案館) – Text Extraction utility can create an OmegaT project folder tree
- ^ po4a (頁面存檔備份,存於互聯網檔案館) – A conversion utility to and from the Portable Object format, perl application packaged under Debian
- ^ OmegaT Getting Involved (頁面存檔備份,存於互聯網檔案館) – Translators are encouraged to write their own supplementary tools
- ^ 存档副本. [2012-01-14]. (原始內容存檔於1998-11-30).
- ^ 存档副本. [2012-01-14]. (原始內容存檔於2012-02-08).
- ^ Autshumato. [2012-01-14]. (原始內容存檔於2009-11-11).
- ^ Benten. [2012-01-14]. (原始內容存檔於2012-01-12).
- ^ Boltran. [2012-01-14]. (原始內容存檔於2012-01-24).
- ^ OmegaT+. [2012-01-14]. (原始內容存檔於2010-02-07).
外部連結
編輯- 官方網站(頁面存檔備份,存於互聯網檔案館)——其中英文頁面內容通常較新
- (英文)SourceForge計畫頁面(頁面存檔備份,存於互聯網檔案館)
- (簡體中文)OmegaT 使用簡介(頁面存檔備份,存於互聯網檔案館)
- (繁體中文)OmegaT 使用簡介
- (英文)Velior's blog about OmegaT(頁面存檔備份,存於互聯網檔案館)——包含了眾多 OmegaT 技巧、教程和輔助指令碼等
用戶組
編輯- omegat@yahoogroups.com(頁面存檔備份,存於互聯網檔案館)——多語言用戶郵寄清單(無需訂閱即可搜尋存檔)