OpenNLP
Apache OpenNLP库是一个基于机器学习的自然语言文本处理的开发工具包,它支持自然语言处理中一些共有的任务,例如:标记化、句子分割、词性标注、固有实体提取(指在句子中辨认出专有名词,例如:人名)、浅层分析(句字分块)、语法分析及指代。这些任务通常都需要较为先进的文字处理服务功能[1] [2]。
开发者 | Apache软件基金会 |
---|---|
首次发布 | 2004年4月22日 |
当前版本 | 2.3.0(2023年8月3日 | )
原始码库 | |
编程语言 | Java |
操作系统 | 跨平台 |
类型 | 自然语言处理 |
许可协议 | Apache许可证第二版 |
网站 | opennlp |
参考资料
编辑- ^ Apache OpenNLP Website. [2012-04-20]. (原始内容存档于2012-04-13).
- ^ Apache OpenNLP Proposal. [2012-04-20]. (原始内容存档于2012-04-19).
参看
编辑- 非结构化资讯管理架构(Unstructured Information Management Architecture,UIMA)
- 一般文字工程架构(General Architecture for Text Engineering,GATE)
- cTAKES