讨论:光学字符识别
Yug在话题“Chinese OCR improvement using frequency databases”中的最新留言:12年前
本条目页依照页面评级标准评为小作品级。 本条目页属于下列维基专题范畴: |
|||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
OCR 光学字符识别内容太简陋
编辑这个电脑领域的条目实在是过于简陋,应该号召电脑方面精通专家参与,从条目产生至今的编辑次数太贫乏了。显然关注度不够,我认为条目名称取得难以获得认知有关,应当具以直接用OCR来取代,毕竟现在用电脑的人知道OCR的比光学字符识别的多,OCR是惯用名词,叫得顺口易记。 —All my loving (留言) 2010年4月24日 (六) 08:16 (UTC)
Chinese OCR improvement using frequency databases
编辑What steps will reproduce the problem? 1. The Chinese OCR success rate is about 90%
What is the expected output?
- users expect better results.
What version of the product are you using? On what operating system?
- I'm on Android, using the apps "OCR test" https://play.google.com/store/apps/details?id=edu.sfsu.cs.orange.ocr
Please provide any additional information below.
- Errors may be avoid by coupling up with frequency dataset.
- Film subtitle based: SUBTLEX-CH (Cai & Brysbaert 2010) http://expsy.ugent.be/subtlex-ch/
- Newspapers based : DA (2005:Modern Chinese Character Frequency List) http://lingua.mtsu.edu