維基百科:機器人/申請/Cewbot/11
- 狀態: 拒絕申請
- 操作者: Kanashimi(留言)
- 提請時間: 2016年4月15日 (五) 12:06 (UTC)
- 程式語言:CeJS library。
- 用途:使用Wikidata數據來清理跨語言連結。例如將[[:ja:日露戦争|日俄戰爭]]轉成[[日俄戰爭]],避免「在條目頁面以管道連結的方式外連至其他語言維基頁面」。
- 討論內容連結: 無。
- 編輯時段及頻率:平均每分鐘最多自動編輯10次。
- 受影響頁面:56K+。
- 遵守機器人規範:是。
- 於其它語言所獲權限:無。
本次申請為d:WD:Requests_for_permissions/Bot/Cewbot之附屬功能。Kanashimi(留言) 2016年4月15日 (五) 12:06 (UTC)
- 測試編輯?這個好像就是Antigng-bot/3 + Liangent-bot的感覺?--Jimmy Xu 論 2016年4月15日 (五) 17:24 (UTC)
- 主要集中在 [[:l:t|T]]轉成[[T]]。先測試了一點點。Kanashimi(留言) 2016年4月17日 (日) 14:54 (UTC)
- 不贊成直接把鏈接文本替換成條目名。--Jimmy Xu 論 2016年4月17日 (日) 17:34 (UTC)
- 主要集中在 [[:l:t|T]]轉成[[T]]。先測試了一點點。Kanashimi(留言) 2016年4月17日 (日) 14:54 (UTC)
- 現在採:
- [[:en:Day|地球日]] → [[日|地球日]]
- [[:en:Day (disambiguation)]] → [[日 (消歧義)|日]]
- [[:en:Day (disambiguation)|日]] → [[日 (消歧義)|日]]
- [[:en:Day (disambiguation)|Day]] → [[日 (消歧義)|日]]
- [[:en:Day]] → [[日]]
- [[:en:Day|日]] → [[日]]
- [[:en:Day|Day]] → [[日]]
- [[:en:First Last|First]] → [[中文全名]]
- [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [[中文全名]] (譯名已匯入 wikidata aliases)
您的意見如何?--Kanashimi(留言) 2016年4月18日 (一) 10:50 (UTC)
- 一般說來,有機物分子在中紅外區有着強烈的吸收,因而紅外線具有明顯的熱效應。--Antigng(留言) 2016年4月18日 (一) 13:21 (UTC)
- 我總覺得這是錯用了,應該改的是原文本...這種情況下有正當使用的例子嗎?Kanashimi(留言) 2016年4月18日 (一) 13:30 (UTC)
- 所以不能錯上加錯。--Antigng(留言) 2016年4月18日 (一) 13:32 (UTC)
- 我總覺得這是錯用了,應該改的是原文本...這種情況下有正當使用的例子嗎?Kanashimi(留言) 2016年4月18日 (一) 13:30 (UTC)
- 改成於應州大捷大敗達延汗? 或者
- [[:en:name of person, book, place, work|無論是什麼奇怪譯名]] → [[中文全名|無論是什麼奇怪譯名]]
...? 只是我想奇怪譯名的情況會遠多於特殊狀況...Kanashimi(留言) 2016年4月18日 (一) 13:58 (UTC)
@Kanashimi:測試了一點點 的想辦法過濾出來,現在根本看不出測試了什麼。Liangent(留言) 2016年4月18日 (一) 18:00 (UTC)
- 已測試。煩請看看有何需要改進之處。Kanashimi(留言) 2016年4月21日 (四) 09:22 (UTC)
- ([1])隨便點開就看到一個不恰當的……[2]。Liangent(留言) 2016年4月22日 (五) 04:18 (UTC)
- 有很多類似的
[[中文名]],原名/简称/英文/缩写为[[:en:XXX|XXX]]
,感覺這麼暴力清理真的不是很合適。Liangent(留言) 2016年4月22日 (五) 04:26 (UTC)- 若是以
/原名|[文簡简縮缩]|tfrom/
以及其他已發現的模式來篩選連結的前後文,您覺得是否可行呢?或者您是怎麼處理原文:{{lang-en|...}}
的呢?可否讓我們借鏡一下 :) Kanashimi(留言) 2016年4月22日 (五) 07:48 (UTC)- free-form text的我不管……我只處理明確使用了tsl或ilh模板的。Liangent(留言) 2016年4月22日 (五) 19:07 (UTC)
- 謝謝您的意見。這邊會考量前後文以後再行測試。以及,或許我們可以把
原文:abc
改成英語:abc
以至之類?我想這是可以在掃瞄的時候一併完成的。Kanashimi(留言) 2016年4月22日 (五) 23:32 (UTC)
- 已做新的測試。再麻煩看一下有無問題。Kanashimi(留言) 2016年4月27日 (三) 16:01 (UTC)
- [3],我真覺得試圖去parse自然語言寫的內容不太靠譜……Liangent(留言) 2016年4月29日 (五) 21:53 (UTC)
- 經過處理了幾百個例子後,發現因為不能確定前面的一定是泛用的翻譯,上面這種轉換法似乎已是最好的處理方式了。這樣提供了人類編輯時一個好的參考,而且想看中文的就能簡單閱覽。未知您的意見如何?Kanashimi(留言) 2016年4月29日 (五) 22:46 (UTC)
- 已做了近2K次測試,現在頗穩定了。再麻煩確認一下。Kanashimi(留言) 2016年5月2日 (一) 10:52 (UTC)
- [3],我真覺得試圖去parse自然語言寫的內容不太靠譜……Liangent(留言) 2016年4月29日 (五) 21:53 (UTC)
- 已做新的測試。再麻煩看一下有無問題。Kanashimi(留言) 2016年4月27日 (三) 16:01 (UTC)
- 謝謝您的意見。這邊會考量前後文以後再行測試。以及,或許我們可以把
- free-form text的我不管……我只處理明確使用了tsl或ilh模板的。Liangent(留言) 2016年4月22日 (五) 19:07 (UTC)
- 若是以
- 未完成,如上討論。--Jimmy Xu 論 2016年5月3日 (二) 03:40 (UTC)