OpenNLP
Apache OpenNLP庫是一個基於機器學習的自然語言文字處理的開發工具包,它支援自然語言處理中一些共有的任務,例如:標記化、句子分割、詞性標注、原生實體提取(指在句子中辨認出專有名詞,例如:人名)、淺層分析(句字分塊)、語法分析及指代。這些任務通常都需要較為先進的文字處理服務功能[1] [2]。
開發者 | Apache軟體基金會 |
---|---|
首次釋出 | 2004年4月22日 |
目前版本 | 2.3.0(2023年8月3日 | )
原始碼庫 | |
程式語言 | Java |
作業系統 | 跨平台 |
類型 | 自然語言處理 |
授權條款 | Apache授權條款第二版 |
網站 | opennlp |
參考資料
編輯- ^ Apache OpenNLP Website. [2012-04-20]. (原始內容存檔於2012-04-13).
- ^ Apache OpenNLP Proposal. [2012-04-20]. (原始內容存檔於2012-04-19).
參看
編輯- 非結構化資訊管理架構(Unstructured Information Management Architecture,UIMA)
- 一般文字工程架構(General Architecture for Text Engineering,GATE)
- cTAKES