维基百科:机器人/申请/Cewbot/11
- 状态: 拒绝申请
- 操作者: Kanashimi(留言)
- 提请时间: 2016年4月15日 (五) 12:06 (UTC)
- 编程语言:CeJS library。
- 用途:使用Wikidata数据来清理跨语言链接。例如将[[:ja:日露戦争|日俄戰爭]]轉成[[日俄戰爭]],避免“在条目页面以管道连结的方式外连至其他语言维基页面”。
- 讨论内容连结: 无。
- 编辑时段及频率:平均每分钟最多自动编辑10次。
- 受影响页面:56K+。
- 遵守机器人规范:是。
- 于其它语言所获权限:无。
本次申请为d:WD:Requests_for_permissions/Bot/Cewbot之附属功能。Kanashimi(留言) 2016年4月15日 (五) 12:06 (UTC)
- 测试编辑?这个好像就是Antigng-bot/3 + Liangent-bot的感觉?--Jimmy Xu 论 2016年4月15日 (五) 17:24 (UTC)
- 主要集中在 [[:l:t|T]]轉成[[T]]。先测试了一点点。Kanashimi(留言) 2016年4月17日 (日) 14:54 (UTC)
- 不赞成直接把链接文本替换成条目名。--Jimmy Xu 论 2016年4月17日 (日) 17:34 (UTC)
- 主要集中在 [[:l:t|T]]轉成[[T]]。先测试了一点点。Kanashimi(留言) 2016年4月17日 (日) 14:54 (UTC)
- 现在采:
- [[:en:Day|地球日]] → [[日|地球日]]
- [[:en:Day (disambiguation)]] → [[日 (消歧義)|日]]
- [[:en:Day (disambiguation)|日]] → [[日 (消歧義)|日]]
- [[:en:Day (disambiguation)|Day]] → [[日 (消歧義)|日]]
- [[:en:Day]] → [[日]]
- [[:en:Day|日]] → [[日]]
- [[:en:Day|Day]] → [[日]]
- [[:en:First Last|First]] → [[中文全名]]
- [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [[中文全名]] (译名已汇入 wikidata aliases)
您的意见如何?--Kanashimi(留言) 2016年4月18日 (一) 10:50 (UTC)
- 一般说来,有机物分子在中红外区有着强烈的吸收,因而红外线具有明显的热效应。--Antigng(留言) 2016年4月18日 (一) 13:21 (UTC)
- 我总觉得这是错用了,应该改的是原文本...这种情况下有正当使用的例子吗?Kanashimi(留言) 2016年4月18日 (一) 13:30 (UTC)
- 所以不能错上加错。--Antigng(留言) 2016年4月18日 (一) 13:32 (UTC)
- 我总觉得这是错用了,应该改的是原文本...这种情况下有正当使用的例子吗?Kanashimi(留言) 2016年4月18日 (一) 13:30 (UTC)
- 改成于应州大捷大败达延汗? 或者
- [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [[中文全名|無論是什麼奇怪譯名]]
...? 只是我想奇怪译名的情况会远多于特殊状况...Kanashimi(留言) 2016年4月18日 (一) 13:58 (UTC)
@Kanashimi:测试了一点点 的想办法过滤出来,现在根本看不出测试了什么。Liangent(留言) 2016年4月18日 (一) 18:00 (UTC)
- 已测试。烦请看看有何需要改进之处。Kanashimi(留言) 2016年4月21日 (四) 09:22 (UTC)
- ([1])随便点开就看到一个不恰当的……[2]。Liangent(留言) 2016年4月22日 (五) 04:18 (UTC)
- 有很多类似的
[[中文名]],原名/简称/英文/缩写为[[:en:XXX|XXX]]
,感觉这么暴力清理真的不是很合适。Liangent(留言) 2016年4月22日 (五) 04:26 (UTC)- 若是以
/原名|[文簡简縮缩]|tfrom/
以及其他已发现的模式来筛选连结的前后文,您觉得是否可行呢?或者您是怎么处理原文:{{lang-en|...}}
的呢?可否让我们借镜一下 :) Kanashimi(留言) 2016年4月22日 (五) 07:48 (UTC)- free-form text的我不管……我只处理明确使用了tsl或ilh模板的。Liangent(留言) 2016年4月22日 (五) 19:07 (UTC)
- 谢谢您的意见。这边会考量前后文以后再行测试。以及,或许我们可以把
原文:abc
改成英语:abc
以至之类?我想这是可以在扫描的时候一并完成的。Kanashimi(留言) 2016年4月22日 (五) 23:32 (UTC)
- 已做新的测试。再麻烦看一下有无问题。Kanashimi(留言) 2016年4月27日 (三) 16:01 (UTC)
- [3],我真觉得试图去parse自然语言写的内容不太靠谱……Liangent(留言) 2016年4月29日 (五) 21:53 (UTC)
- 经过处理了几百个例子后,发现因为不能确定前面的一定是泛用的翻译,上面这种转换法似乎已是最好的处理方式了。这样提供了人类编辑时一个好的参考,而且想看中文的就能简单阅览。未知您的意见如何?Kanashimi(留言) 2016年4月29日 (五) 22:46 (UTC)
- 已做了近2K次测试,现在颇稳定了。再麻烦确认一下。Kanashimi(留言) 2016年5月2日 (一) 10:52 (UTC)
- [3],我真觉得试图去parse自然语言写的内容不太靠谱……Liangent(留言) 2016年4月29日 (五) 21:53 (UTC)
- 已做新的测试。再麻烦看一下有无问题。Kanashimi(留言) 2016年4月27日 (三) 16:01 (UTC)
- 谢谢您的意见。这边会考量前后文以后再行测试。以及,或许我们可以把
- free-form text的我不管……我只处理明确使用了tsl或ilh模板的。Liangent(留言) 2016年4月22日 (五) 19:07 (UTC)
- 若是以
- 未完成,如上讨论。--Jimmy Xu 论 2016年5月3日 (二) 03:40 (UTC)