维基百科讨论:机器人/存档
本页是以往讨论的存档。请勿编辑本页。若您想发起新讨论或重启现有讨论,请在当前讨论页进行。 |
不是管理员也能投票么?
不是管理员也能投票么?LiDaobing 16:02 2004年9月16日 (UTC)
Interlanguage specialities at eo:
- Halló! At eo:Vikipedio:Sciindaĵoj#doublex you find a note / an abstract about valid interlanguage links from eo: to other languages which differ from the original titles. Regards eo:Vikipediisto:Gangleri - Gangleri | Th | T 00:25 2005年2月9日 (UTC)
最近见过机器人们 :-P
User:Chobot User:Hashar User:Palica User:Yurik User:Zwobot
--Isnow 12:12 2005年7月25日 (UTC)
对啊,这些是那里来的啊?有没通过申请啊?还是说在其他维基申请过的也可以?--Ffaarr 01:13 2005年7月26日 (UTC)
- 这些是没有注册为机器人的,因为怕修改错了,所以没有注册,这样在最近更改中就有体现,方便核查。--zy26 was here. 01:26 2005年7月26日 (UTC)
又见到一个:User:CyeZBot。--Isnow 18:15 2005年7月26日 (UTC)
I'm asking for permission to use KocjoBot (Python Wikipedia bot) on this WP. Primary mission will be updating interwiki links of all WP. So far the bot was and is running on :sl, :en:, :bs, :hr and :sr. If there is no objections to it, I will request a bot-flag on meta and started to run it here (it's contribs on: :bs, :en, :hr, :sl, :sr). Regards, --Klemen Kocjancic 00:26, 25. 11. 2005 (UTC)
Support
en: I am asking permission to run an interwiki bot under the account User:Chlewbot. I have already tested under my own account on controlled conditions. I plan to run the bot only on pages originated in Spanish language Wikipedia. I am also asking for bot status on meta. — Chlewey 14:59 2005年11月30日 (UTC)
Support
- It seems OK. Moses 08:00 2005年12月5日 (UTC)
For my project INTERWIKI-LINK-CHECKER i use FlaBot to set interwikis. Come and take part of my Link-Checker .. you will get new Interwiki. If somebody wants to transfer the Interface of my programm pse mail me. Greetings de:Benutzer:Flacus owner of User:FlaBot
I requested a botflag for my robot RoboDick to do multilogon interwiki. nl:User:Dutchy-Dick 13:50 2006年1月21日 (UTC)
- Request at meta will wait for local ZH approval. Jcb 14:21 2006年1月21日 (UTC)
- Support - Moses
- Support, I know it's well configured. Jcb 12:02 2006年1月29日 (UTC)
- Support, other pywikipedia bots has ran here without problem. --Vina 02:57 2006年1月30日 (UTC)
Botflag has been granted by a steward. Jcb 01:38 2006年2月2日 (UTC)
机器人问题
from Wikipedia:互助客栈/技术
请问在大陆操作机器人怎样设置代理服务器,我在浏览器中设置145.97.39.140为代理,能够浏览。但是使用pywikipedia登录不上。错误如下:
C:\pywikipedia>login.py Checked for running processes. 1 processes currently running, including the curr ent process. Password for user Vipbot on wikisource:zh: Logging in to wikisource:zh as Vipbot Traceback (most recent call last): File "C:\pywikipedia\login.py", line 218, in ? main() File "C:\pywikipedia\login.py", line 214, in main loginMan.login() File "C:\pywikipedia\login.py", line 167, in login cookiedata = self.getCookie() File "C:\pywikipedia\login.py", line 119, in getCookie conn.request("POST", pagename, data, headers) File "C:\Python24\lib\httplib.py", line 804, in request self._send_request(method, url, body, headers) File "C:\Python24\lib\httplib.py", line 827, in _send_request self.endheaders() File "C:\Python24\lib\httplib.py", line 798, in endheaders self._send_output() File "C:\Python24\lib\httplib.py", line 679, in _send_output self.send(msg) File "C:\Python24\lib\httplib.py", line 646, in send self.connect() File "C:\Python24\lib\httplib.py", line 630, in connect raise socket.error, msg socket.error: (10060, 'Operation timed out')
请各位帮忙找找原因。谢谢--维游 《@_@》 15:30 2006年5月10日 (UTC)
这可能是因为interwiki bot不支持代理可以参考Pywikipedia bot on non-Wikimedia projects进行设置。但是我不知道在python上,对https协议如何处理?我试了几次,都因为https的缘故,不能连接--百無一用是書生 (☎) 15:39 2006年5月10日 (UTC)
- 我可以去问一下bot开发人,有没有一种技术可以支持代理。我在美国,有什么需要运行的机器人我可以来。--Vina 19:24 2006年5月20日 (UTC)
如何通过https进行bot操作
如何通过维基百科的https链接进行bot操作?例如使用python编程的interwiki bot,如何能够实现这个功能?python可有什么库可以调用?--百無一用是書生 (☎) 15:35 2006年5月10日 (UTC)
请教几个机器人问题
- 元维基上面说,若该语言的维基计划已有bureaucrats,则不需要再到元维基上申请为bot,那是否要在中文维基百科执行机器人的话,获得投票通过后直接找User:Shizhao申请吗?
- 除了用python写的pywikipediabot以外,还有别的bot程式吗?
--Ellery 17:49 2006年5月31日 (UTC)
- 是的,Shizhao 可以加bot。别的bot也有,但是您需要自己写。可以用pywikipediabot为基础加别的,我在英文维基上也看到有用Perl写的。--Vina 08:06 2006年6月1日 (UTC)
- 我的机器人User:STcatBot就是用Perl写的。-下一次登录 06:40 2006年11月24日 (UTC)
- 此机器人申请已经移到Help:机器人#TuvicBot,请至该页面投票讨论。
- 如有异议,请谘询互助客栈或其他管理员。执行人:— fdcn talk — 2008年5月21日 (三) 14:55 (UTC+8) — 2008年5月21日 (三) 06:55 (UTC)
I would like a bot flag to run my interwiki-bot TuvicBot (using Pywikipedia). This bot will run in manually assisted mode, adding and updating interwiki-links, using the Dutch wiki as a starting point. I'm mostly planning to solve interwikis that autonomous bot skip because they're ambigious. (And sorry for not speaking in your language :-() --Tuvic 18:54 2006年7月22日 (UTC)
- If nobody has any objections, I'll start my bot tomorrow. --Tuvic 14:33 2006年7月30日 (UTC)
机器人用户框
我做了一个用户框用以说明这用户是个机器人:Template:User robot 请问你们有兴趣或意愿将这个用户框用于机器人吗?=_="--KOS-MOS 17:21 2006年8月10日 (UTC)
中文维基至今为止还没有能"新增条目"的机器人啊?
先让我声明,我支持中文维基要扩大规模的宗旨是“质、量并重”(否则又有一堆人要来说‘提高现有条目水准才重要’)。言归正传,中文虽然号称是世界上最多人使用的语言,但是中文维基条目新增的速度--每天一两百个--实在有待增加,虽然中共封锁维基和其他种种因素都是造成此现象的原因,但要增加条目数量也是要靠现有维基人的努力。像是英文维基中有几个机器人能够将某些现有资料库以“小条目”的方式自动新增大量的条目(像是大量新增印度城市的小条目等),我们中文维基到目前为止似乎没有能自动新增条目的机器人,大家有什么点子是能找到一些现有资料,以机器人大量新增后再让有兴趣的人去改写提升水准,这应该也是个不错的方法。--嘉禾 06:03 2006年10月22日 (UTC)
对阿!支持支持!Wikipedia的宗旨是要包揽全人类的所有知识!要是不增加更多条目的话,怎么会有人去修改这些条目呢?我极力推荐大家制作可以增加条目的机械人,但是最可惜的就是我自己不会制作机械人!有人可以教我吗?钢琴小子 2007年9月14日 (五) 10:47 (UTC)
有没有那种根据百科中存在的条目自动在内容添加链接的机器人?
现在这里还有没有人讨论啊?
--66.230.200.227 10:53 2006年10月25日 (UTC)
关于机器人的问题
移自wikipedia:詢問處
刚刚翻译出一个新条目,我知道有在不同语言相关条目之间建立链接(即左边菜单下部‘其他语言’部分)的机器人,但是如果不想等二到三个昼夜,要马上启动机器人在比较短时间内作出那些跨语言链接行吗? Coolant 2007年5月7日 (一) 07:07 (UTC)
Sandbot机器人
建议参考en:user:Sandbot、en:Wikipedia:Sandbox制造一个Sandbot机器人,可以在一段特定时间自动reset沙盒,亦可以人手reset沙盒--L!tt|eTung?\2oO7=] 2007年5月13日 (日) 10:36 (UTC)
- 亦可试用模板解决。见:m:help:recursive conversion of wikitext, m:template:eraser templates, m:template:erase on day left, m:template:erase on day right. *: )---Hillgentleman | 书 | 2007年5月13日( 日 ), 11时23分24秒.
- 我有兴趣写一个类似的bot,不过我想知道重置沙盒有没有特别步骤?因为我见过好像需要处理页面历史?——蕃薯 (留言给我) 2007年5月23日 (三) 11:08 (UTC)
bot请求
现在沙盒机器人和欢迎机器人都有现成的程序可以使用:
但是可能在中文版上使用需要稍微修正一下程序。
如果有人感兴趣,可以申请机器人账号运行:wikipedia:机器人--百無一用是書生 (☎) 2007年6月25日 (一) 16:48 (UTC)
工具伺服机(toolserver)
长远提议:德国维基媒体协会有其 Toolserver [3] , m:toolserver,很多常用的 interwiki机械人及工具(如大家常用之编辑计算工具)都在其中运行。中文维基社群的相应协会(如中华民国、香港、星加波。。。)有无打算(将来)设立工具伺服器,以利中文维基社群发展机械人及其他重要工具?* : -) ---Hillgentleman | 书 | 二零零七年七月二十二号(星期日)格林尼治 10时42分33秒。
- 大致来讲,Toolserver会定期从维基媒体的主资料库中取得一份资料库(而这就是导致editcount等数据会有延迟时间的原因),然后利用这份备份来进行各种数据的分析。但在维基server日渐壮大的情况下(ex:enwiki),要养这样的设备需要庞大的预算吧 Orz。--笨笨的小B | 20巷 2007年7月22日 (日) 12:31 (UTC)
- 德国维基媒体协会的Toolserver,硬体是由昇阳(Sun Microsystem)捐助的。若懂Mediawiki相关的程式设计,可自行在该处申请帐号来放程式。—Ellery 2007年8月7日 (二) 14:00 (UTC)
执错字机械人
from Wikipedia:互助客栈/技术 Template:RFC error
我想问问:我见在英语维基经常都人执错字的机械人在活动。在中文维基能否作出类似的东东?经常在这里看到很多因为打错字或手写版而引起的问题。若经常要人手处理的话,又未必经常有空。常见错字如下:
- 玆 --> 兹
- 彊土 --> 疆土
- 曰 --> 日 (例如:若“曰”字之前是数字,又或是在超连结内,可以假设是日期)
- 己 --> 已 (例如:己经 --> 已经)
--石添小草 (talk to me) 2007年7月25日 (三) 07:28 (UTC)
- 可能算法上不好写,英文可以改错字是因为单词之间都有空格,而中文行文之间没有空格,不好判断这个字是属于前一个词还是后一个词的。可能得要有某些突破才可以。—Ksyrie(Talkie talkie) 2007年7月25日 (三) 07:43 (UTC)
- 但若是“疆土”、“已经”的话,基本上只要可以配词就可以替代,不用处理空格。--石添小草 (talk to me) 2007年7月25日 (三) 09:12 (UTC)
- 实行上有很大的危险,必须谨慎评估。参考方案︰先利用可靠工具(如Google)找出要修改的词(如“己经”),注意其前后文是否有错改的危险(可由多人检查),检查完毕后若确认可行,则一次性修改完毕(可缩小执行范围减轻工作),机器人停止工作,进入下一次的循环。尽量不要让机器人自动修改,改错了很麻烦。改错例︰“……XX一己经XX方式……”“一曰︰XXXXX,二曰︰XXXXX”除此之外,还要注意繁简之间可能带来的问题--Hiaeoupyc 2007年7月26日 (四) 00:55 (UTC)
- 其实这正是我现时的做法。不过,做多了就会觉得很累,因为现时太多学生参与,所以写错字的频率很高。一直由人来做的话会很累。--石添小草 (talk to me) 2007年7月26日 (四) 03:45 (UTC)
- 中文字的组合性太强了,任何组合都有可能出现,我以前偷懒,想要用工具快速修正一堆文字档案的误字,后来发现非常容易改错,就不这样做了。看看现在的简繁转换,不也有同样的问题--经常转错。说到这,罢了,罢了。--Hiaeoupyc 2007年7月26日 (四) 23:39 (UTC)
- 疆土不太可行把,比如一个句子中有边疆土地疆土到底是属于那个词是个问题,而且添字后意思又会变化,那边疆土地广人稀,究竟怎么判断?—Ksyrie(Talkie talkie) 2007年7月26日 (四) 01:01 (UTC)
- 这对我来说完全不要紧,我只是不想再看到有“边彊”、“彊土”就足够了。只要集齐全套有“疆”字的词语,再把这些词语里的“疆”打错成“彊”的情况换置就可以。--石添小草 (talk to me) 2007年7月26日 (四) 03:45 (UTC)
- 还是留给维基人来处理吧,中文很复杂,这方面不适合给机器人做。--一叶知秋→切磋 2007年7月26日 (四) 10:00 (UTC)
- ‘只要集齐全套有“疆”字的词语’←关于这点……“边疆”、“苗疆”、“新疆”、“疆场”、“疆界”、“疆域”……够不够?—Xtctjames 2007年8月26日 (日) 16:33 (UTC)
- 还是留给维基人来处理吧,中文很复杂,这方面不适合给机器人做。--一叶知秋→切磋 2007年7月26日 (四) 10:00 (UTC)
- 举个例子把,如果有人有这样的句子 那边彊敌之类的词语,你用这个机器人改为那边疆敌,岂不在制造错误。—Ksyrie(Talkie talkie) 2007年7月26日 (四) 14:17 (UTC)
- 刚刚想到一个好办法,把条目的全部内容贴到Microsoft Word里面,然后让它来纠错,如果有明显的错字,它会用红色的下划线来提示。—长夜无风(风语者) 2007年7月26日 (四) 16:59 (UTC)
- 那也要中文版的Word才可以。我现在用的Word不是中文版,经常把标点自动改掉,每次拷过来要预览好几遍才放心。我觉得维基人还是看到了顺手改掉比较好。中文实在是浩大精深,机器人的算法没有那么智能的。—木木 2007年7月26日 (四) 21:09 (UTC)
本百科经常乱码 请看新会区,此条目经常乱码. —膑膑 2007年7月28日 (六) 12:05 (UTC)
- 还有很多错别字,比如说:根据/跟据、藉/籍、仕/士、饥/饥、号召/号招、占/占、辨/办、份/分,我一直在努力中,但这些错别字条目数量之多,实在吓人,凭我一人之力,实在修正不了那么多:(
- 即使不能用机械人,也得想想别的办法,因为这情况实在很影响维基的质素—Xtctjames 2007年7月28日 (六) 17:06 (UTC)
- 用Microsoft Word来改错,当把文字再转贴回编辑页面时,人名间隔号会自动由“·”转成“‧”的,这会令内连结失效,也令参考资料消失,造成莫大困扰。
- 我就是曾经长时间犯了这个错,所以我知道:P—Xtctjames 2007年7月28日 (六) 17:22 (UTC)
- 不如赵SIR发起一队执错别字小组,由赵SIR指挥,有计画地按需要和人力资源(愿意参与小组工作的人手),大家分工合作,监察和清理堆积如山的错字条目吧,大家以为如何?—Xtctjames 2007年7月29日 (日) 06:59 (UTC)
- 其实我一直在做这方面的修改,我已经改过的有:毫/亳、侯/候、回/迥、刺/剌、侯/候、疆/彊、蜥蝪/蜥蜴、诉/䜣,现在,这几个字的混用情况少了些了,如果大家发现还有的话,请参与我的工作,一起修正—Xtctjames 2007年7月29日 (日) 11:01 (UTC)
- 汇报:截至这个发言这一刻,我已经把所有“跟据”改为“根据”(花了几天时间^^"),大家一起来见证一下,看看多少天之后,中文维基又再出现“跟据”充斥的情况。这可作为人力监察和修正的成效的一个量度—Xtctjames 2007年7月30日 (一) 07:58 (UTC)
- 坐言不如起行,我现在开始修改“跟本/根本”的混用,然且这只是“跟”和“根”混用的例子的其中一个而已,做了这么久,修正了的只是冰山一角而已—Xtctjames 2007年7月30日 (一) 08:30 (UTC)
- 汇报:截至这个发言这一刻,我已经把所有“决择”改为“抉择”,把所有“蜥蝪”改为“蜥蜴”。—Xtctjames 2007年7月31日 (二) 09:29 (UTC)
- 用OpenOffice如何?也许没有这问题- Shack Talk 2007年8月16日 (四) 04:39 (UTC)
- 我没有Open Office,没试过:P—Xtctjames 2007年8月17日 (五) 15:17 (UTC)
- 将内容复制到OpenOffice,存档后再打开贴回原条目,比对功能显示结果无异。测试条目为胡安·塞巴斯蒂安·贝隆。--RalfX(议) 2007年8月26日 (日) 22:20 (UTC)
- 我没有Open Office,没试过:P—Xtctjames 2007年8月17日 (五) 15:17 (UTC)
- 用OpenOffice如何?也许没有这问题- Shack Talk 2007年8月16日 (四) 04:39 (UTC)
在正常的行文中,不会把强字强行写成彊字。我想除了古文外,凡用彊字的多数是使用者打错字。--✉Hello World! 2007年8月1日 (三) 17:03 (UTC)
- 汇报:我已经把部分“疆”和“彊”混用的情况清除,计有“彊土”、“彊界”、“彊域”、“彊场”、“苗彊”、“新彊”里的“彊”都改回为“疆”了,还有哪些混用的用例,请提点小弟,在还没有改错字机械人(和改错字同袍)前,我会继续当人肉机械人,试图愚公移山^^"Xtctjames
- 回上,占是佔的简化字,会否改错改过龙?--✉Hello World! 2007年8月2日 (四) 16:52 (UTC)
- 对,“佔”的简化形式是“占”。
- 因此,在显示方面,“佔”在简体版会显示成“占”。
- 但“占”在繁体版好像不会显示成“佔”。
- 在繁体字里,“占”和“佔”各有分工,在某些方言里,“占”跟佔更不同音,因此在某些方言区里,人们绝对不会把两字搞混来念。
- 因此,我主张把“占領”改成“佔領”,因为这对简体字使用者不会造成影响,但对繁体字使用者来说,就纠正了一个字误。
- 不过,我也明白这有争议性,因此,我还没开始动手大举改动“占”和“佔”的混用情况。
- 再说,只得我一个人,“大举”得来么?:)
- 所以需要多些人集思广益啰:)
- 我试过把“决择”改成“抉择”,都有人不高兴,把我的改动彻回(更不用说“大相迳庭”和“大相径庭”了)^^",因此,现在,我只敢改动一些“低争议性”的字误(不敢说“没争议性”^^"),譬如说“书藉→书籍”、“蜥蝪→蜥蜴”等。
- 我没主动找“份”和“分”的字误来改,因为,似乎已经有朋友在专职从事这个分工了,是吧?
- 还是那句,有哪位有兴趣加入“愚公移山”的行例吗?^_^—Xtctjames 2007年8月3日 (五) 11:32 (UTC)
- 刚才找到了一个“跟据”。(笑)—木木 2007年8月9日 (四) 20:54 (UTC)
- 七月三十日清理完毕,八月九日已找到“跟据”了,说明了清道夫的工作是要每天做的:P—Xtctjames 2007年8月10日 (五) 07:32 (UTC)
- 建议可以用机器人加上注释,这样就不怕错误判断。再建立专题由人工来处理。—不想放弃 (留言) 2008年1月17日 (四) 06:12 (UTC)
执错字人肉机械人队伍
经常在这里看到很多因为打错字或手写版而引起的问题。若经常要人手处理的话,又未必经常有空
做多了就会觉得很累,因为现时太多学生参与,所以写错字的频率很高。一直由人来做的话会很累
赵Sir正在做的事,其实我也一直在做^_^
不如这样吧,就由赵Sir发起组织一支改错队伍,招募成员,商讨并选择哪些常出现字误的词汇,分派给队伍成员定时监察及修正,字误不太多的词汇可以一个人修正及定时监察,甚至一个人监察几个词汇,字误太多的词汇则可以由几个人一起修正及定时监察,这样既不会累坏某几个个别改错手,又可以让维基条目的字误得到有策略、有系统的维护,赵Sir以为如何?—Xtctjames 2007年8月16日 (四) 14:13 (UTC)
- 不知阁下们有没有使用过AWB呢,这工具倒是很有用的。--Shinjiman ⇔ ♨ 2007年8月16日 (四) 16:04 (UTC)
- 没有喔,其实我来这里没多久,很多维基的规条和功能都不懂,望前辈指教^_^
- 其实小弟有某类的学障,有某类资料小弟是没能力阅读的…… -_-
- 不过,不怕见笑,小弟有个构想,如果有足够的志同道合的朋友,有一个小组的工作页面,我们可以商讨出要定时监察和即时维护的错别字或词的清单,并共商工作指引、守则,然后开始分配工作。
- 第一类工作是按清单分配人手即时修正需维护的有字误条目,清单上需要人手负责的字词,由组员自愿“认头”负责修正,如果字误条目特多的字或词,则由数人共同修正该个字或词。已完全清除的字误则拨入监察清单
- 第二类工作是分配人手负责定期巡视监察清单上的词条有没有复现(有些常见字误,即使已完全清除了,也复现得很快),工作分配也是用一词一人的方法。
- 不过,即使没朋友响应,小弟还是会独力继续“愚公移山”下去的:)
- 期待著良性互动……^^"—Xtctjames 2007年8月17日 (五) 10:31 (UTC)
- 按赵Sir最初的建议,我试著到Wikipedia:机器人/提议提出初步建议了
- 如果大家当真觉得这是一件好事,过去Wikipedia:机器人/提议声援一下或发表改善建议吧—Xtctjames 2007年8月18日 (六) 13:48 (UTC)
刚想到还有一个词语:“熟悉”和“熟识”。有没有“熟识”这个词语?--✉Hello World! 2007年8月22日 (三) 16:31 (UTC)
- 有,[4]。--RalfX(议) 2007年8月22日 (三) 16:39 (UTC)
- 我还以为这项目已经没人看的了,原来还是有的,真好^_^—Xtctjames 2007年8月22日 (三) 17:03 (UTC)
不如先弄一个wikipedia:常见别字列表吧。Stewart~恶龙 2007年8月25日 (六) 17:30 (UTC)
- Wikipedia:机器人/提议←我在这里提出的,差不多等如是常见别字列表了,因为里面的内容都是我在条目中大量发现过有出错的(大都已整修过了)—Xtctjames 2007年8月26日 (日) 13:37 (UTC)
- 先别提编辑百科全书那么大条,我们平时写东西给人家看,“不要写错字”即使不是第一个要求、首要要求,也是起码要求之一了,但更多时候,“不要写错字”却成了最后都没达到的要求…… -_- —Xtctjames 2007年8月26日 (日) 16:33 (UTC)
- 我被Xtctjames执了两次错字,真丢脸。另外,Xtctjames君,感谢你的帮忙,谢谢。--すぐる@武蔵×桂言葉 2007年8月26日 (日) 16:38 (UTC)
- 幸勿见怪^^"—Xtctjames 2007年8月31日 (五) 10:28 (UTC)
- 我被Xtctjames执了两次错字,真丢脸。另外,Xtctjames君,感谢你的帮忙,谢谢。--すぐる@武蔵×桂言葉 2007年8月26日 (日) 16:38 (UTC)
- 再有一个:粤语使用者常把小字当作少字来用-✉Hello World! 2007年8月26日 (日) 19:19 (UTC)
- 有趣的是,甲骨文小少也常互换,意形尚未明确分化。HenryLi (留言) 2008年1月12日 (六) 16:09 (UTC)
机械人紧急停止按钮
是不是已登入的维基用户才能按?若否,很可能会有恶意按停机器人的匿名用户。若能把程式修改至已登入的维基用户才能按按钮,那用不用规定凡已注册之机器人也必须要在用户页加上此按钮呢?此外,也建议按按钮后,连结至另一页面,需要用户再次确定要按按钮,以防有用户因手误而按停机器人。机械人紧急停止按钮例子:DragonBot、Welcomebot。Angelalive (留言) 2008年3月20日 (四) 07:55 (UTC)
- 只有管理员才能使用。其实这就是封禁用户功能--百無一用是書生 (☎) 2008年3月26日 (三) 15:23 (UTC)
错别字修正机器人
目前由本人操作的机器人P-bot可以提供错别字修正的功能,如果您发现了需要进行大规模修复的错别字,请前往User:P-bot/错别字修正表提交。—菲菇@维基食用菌协会 2008年6月8日 (日) 12:23 (UTC)
- 不太懂怎样提交…你可否亲自加一个上去(e.g.“改篇”→“改编”),我看看历史差别就会明白了。YunHuBuXi 2008年6月9日 (一) 08:20 (UTC)
- 现在已经跑了一阵子了,其实如果看不懂正则表达式或者不懂得该怎么写的话,直接写在上面或者放在我的讨论页都可以(机器人并不是直接从User:P-bot/错别字修正表上获取需要修正的错字的,那上面只是方便透明与提交),只要能让我看懂我就可以改成需要的表达式。—菲菇@维基食用菌协会 2008年6月11日 (三) 09:37 (UTC)
几个和字词转换相关的机器人程序
最近P-bot开始运行了几个新的机器人程序,基本上都与字词转换有关:其一为Fdcn兄帮忙出了大力气完善的字词转换代码标准化(几乎完全重写了我先前的纯正则代码),因为Fdcn兄的帮忙,这个程序在转换代码的标准化(主要就是实现重新排序,以便于以后通过机器人对转换代码进行进一步的整理(比如说把zh-hans中误填写的繁体内容转换为简体,或者补填必填但未填的部分))方面已渐趋完善,前几日试跑的时候总会有那么几个条目要犯下错(比如多加几个分号),有一些我没发现的错误编辑也麻烦了好几位维基人到我讨论页提醒,不过现在应该已不会了。另外,转换代码标准化程序中还带有针对NoteTA的功能,可以直接把分散在文中的-{}-与-{A|}-(均带有至少一个转换标签,如zh-hans)整理到NoteTA中——但目前这个还在测试当中,也犯了一些错……不过基本上都被我马上抓着回退了>.<,因为-{}-中装的东西太复杂,相信即使是以后要跑NoteTA的功能,也只有半自动操作,随时人工盯着机器人;或者是自动模式下只把-{A|}-抓到NoteTA中。
此外,还有一个可以进行自动简繁重定向的机器人,使用了这里Xie Yanbo编写的python繁简转换程序,而这个程序的繁简映射表还来自于MediaWiki。因为简繁重定向相对比较简单,因此程序写好后(话说还是俺第一次写python程序)便测试了十多个页面,确定没有问题后现在已处于自动运行状态。
最后,错别字修正经几名维基人提醒发现还有不足之处,而且打算用fixes.py来兼容所有的UTF-8字符,现在已暂时停跑,不过依然欢迎提交错别字报告。—菲菇@维基食用菌协会 2008年6月14日 (六) 21:15 (UTC)
可向现有机器人申请工作指令吗
现存很多条目在引用百度百科及香港网络大典作外部链接时,规格很不一致。对此,我参考了Template:Imdb name的做法,制作了Template:Baidubaike及Template:Evchk以作外部资源之用,效果如下:
输入:
{{Baidubaike|id=71120|name=電子地圖}}
将会显示:
另外,输入:
{{Evchk|id=陳冠希}}
则会显示:
已把部份现存条目换上了此两个模版,但只占所有条目中的冰山一角。现存不合规格的条目太多了(特别是百度百科的外部链接),逐条人手更换累人不已。有现有机器人是做类似工作的吗?可向该机器人的创建者申请,增加此两项工作指令吗?银狐 (留言) 2008年6月26日 (四) 05:06 (UTC)
- 很显然您的这个请求应该会被驳回,事实上,针对您所创见的这些外连结模板是否适合放在维基百科上,在此处正发起讨论中,也欢迎您前往参与。迄今为止参与讨论的用户,大都抱持禁止增添此模板的意见。—泅水大象 讦谯☎ 2008年6月26日 (四) 14:36 (UTC)
- 从技术上,我可以说pywikipedia本身的某个工具可以不经修改便能完成上述操作,然而我个人对将百度百科以及香港网络大典的链接加入维基百科持保留态度。如果方针那边的讨论共识最后决定可以这么做,我可以帮忙运行一下机器人,但我说的前提必须满足。—菲菇@维基食用菌协会 2008年6月26日 (四) 16:24 (UTC)
P-bot机器人窜改条目用字
- 看过维基上的资料,P-bot机器人似乎应是执行一些编辑任务的,但在我的条目中发现P-bot机器人窜改我的用字,而且有违维基的原则。在童话枪手小红帽登场人物中,P-bot进行的“机器人:字词转换代码NoteTA化”里,有以下问题:
- 1.最先撰写人以繁体字来撰写,以繁体为准,并用TA模版支援简体转换。但P-bot机器人改行把转换表,全都改为以简体行先、以简体为准,违反尊重用户原来繁简字的做法。
- 2.条目内文的译名中,使用繁体中文的译名为准,其他地区译名以TA模版的列表支援转换。当中有些在条目中不常提及,只出现一两次的名字,则不列入模版,直接在相关地方用TA转换。P-bot机器人改为把这些地方都列入开头的列表中,但在对应内文时,就修改为用简体地区译名为准。这做法违反译名先到先得原则,我看过有许多其他维基人否决他人的译名,就是声称先到先得的。
- 综合来说,看到这个修改(类似的情况,看过有人以破坏来描述),本来我想马上还原。但由于P-bot机器人是执行编辑任务,害怕会得罪人或者反被指我是破坏,因此先行询问:我可否还原,取消它的修订(破坏)。然而,如果真的不允许取消其修订(破坏),我会觉得维基是个双重标准,令人不悦的地方,本来维基给人表面上的印象是开明的,但若亲身参与过后发现原来是假象,我亦似乎没有什么理由,继续支持一个假象的地方。--TVBdata1 (留言) 2008年6月21日 (六) 17:20 (UTC)
- 我觉得太过斤斤计较了,转换没错就好了,noteTA列表中zh-hans排前面还是zh-hant排前面没关系吧。至于内文用字的话,你要改回你原本优先使用的繁体也可以,对转换结果也没影响。--百楽兎 2008年6月22日 (日) 00:12 (UTC)
- 最近有维基人使用我的条目一词。我的看法是不应该有谁的条目。否则如果有人离开维基,那他的条目又变成谁的条目了。当然,如果你觉得转换不当可以和机器人的主人联系。—不想放弃 (留言) 2008年6月22日 (日) 06:22 (UTC)
对转换variant进行排序仅仅是为了让算法能判断有没有重复的转换项,因为合并noteTA会产生重复转换项。我个人觉得:
- 这首先不要指责是想伤害你的先得权利,算法并没有去想这些事,如果你愿意,以后完全可以考虑把hant排在前面,但算法上想统一一下这个顺序。在noteTA中或T转换A转换中的词汇顺序其实是很不重要的,如果没有很干扰你的感情,不妨认可机器人的排序吧。
- 其次只有一两个TA转换也最好改成noteTA,因为可以提供给读者更多信息;
- 合并-{}-到noteTA时,留在原地的词你认为应当留哪一个好呢?是书写的第一个还是某种顺序排下来的第一个?机器人没有去想谁更合适,仅是依照一个顺序选了第一个有效的。这一点上,如果认为机器人没有尊重你的意愿,完成可以把留下的这个词恢复成你希望的地区字汇,机器人不太好判断哪一地区词是作者的心仪,还是关心它的人来做吧。我想,恢复机器人的选择,大家也不会认为你的恢复是破坏,但请保留机器人的主要工作。
— fdcn talk — 2008年6月22日 (日) 16:56 (UTC+8) — 2008年6月22日 (日) 08:56 (UTC)
而且我也发现现时P-bot将NoteTA的问题简单化,忽略了一些特殊例子。有些条目的引言是“ -{zh:繁體名稱;zh-hant:繁體名稱;zh-hans简体名稱}-,又稱-{zh:簡體名稱;zh-hant:簡體名稱;zh-hans:繁体名稱}-,是......”,在繁体环境下先显示繁体名称,再显示简体名称(简体环境则相反)。P-bot却将这些转换统一在NoteTA,令这些条目的引言出错。例如光害条目中,出现“光害,又名为光害”(繁体)或“光污染,又名为光污染”(简体)的滑稽句子(原文在繁体环境下理应显示为“光害,又名为光污染”,简体则相反)。 -- Kevinhksouth (Talk) 2008年6月22日 (日) 11:05 (UTC)
- 我注意到菲菇并没有操作P-bot去替换非A转换到noteTA。关于光害出错,是因为把特殊说明之后的A转换提前到最顶处的noteTA时造成,A转换之前并没有用-{zh:繁體名稱;zh-hant:繁體名稱;zh-hans简体名稱}-(如果用了反而不会出错了)。这个应当人来修正,也建议手动转换有A标签时,这些特殊说明用-{}-来避免转换。— fdcn talk — 2008年6月22日 (日) 20:48 (UTC+8) — 2008年6月22日 (日) 12:48 (UTC)
- 最开始原文无论在简繁体情况下均为“光害,又名为光污染”(参见此处)。—菲菇@维基食用菌协会 2008年6月23日 (一) 10:53 (UTC)
- 谢谢大家的回应,我现在才知道机械人是程式来的,这点之前不知道。另外我也没有我的条目这种概念,我知道维基是大家都可以撰写和编辑的。只是就在个人看到的一些条目,就看到不少把别人撰写的译名打回头,指责别人破坏了或者不尊重他先到先得译名的做法之例子,这些例子又包括了维基编辑。现在看到P-bot这样做,所以就觉得标准莫衷一是。以我这还算新的人来看,无所适从。--TVBdata1 (留言) 2008年6月22日 (日) 16:51 (UTC)
- 起初通过机器人对转换代码进行重新排序的目的,不仅是为了通过整理除去重复的项目(如有两个zh-hans),而且还是进一步编写更多的字词转换自动程序的前提。比如说,现有的zh-conversion-to-noteta机器人可以在noteTA中合并转换内容完全相同的转换代码,例如把"zh-hant:xxx;zh-hans:yyy"与"zh-hans:yyy;zh-hant:xxx"合并为同一个,但是这必须要建立在两段字符串完全相同的情况下,因此这就需要对两段字符串中的转换代码先进行排序,然后再进行比较。以上便是一个需要排序的应用。以后还会有更多的字词转换处理程序出现,肯定还会有用到这种排序的情况。—菲菇@维基食用菌协会 2008年6月23日 (一) 10:34 (UTC)
- 谢谢大家的回应,我现在才知道机械人是程式来的,这点之前不知道。另外我也没有我的条目这种概念,我知道维基是大家都可以撰写和编辑的。只是就在个人看到的一些条目,就看到不少把别人撰写的译名打回头,指责别人破坏了或者不尊重他先到先得译名的做法之例子,这些例子又包括了维基编辑。现在看到P-bot这样做,所以就觉得标准莫衷一是。以我这还算新的人来看,无所适从。--TVBdata1 (留言) 2008年6月22日 (日) 16:51 (UTC)
Wikipedia:机器人方针修订
由于之前全局机器人的问题,现在参照meta上的标准bot方针,在原有内容上进行了大量的补充和修订。此外,Wikipedia:机器人作为中文版申请bot权限的方针已经行之多年,故此加上了正式方针的模板。对于新增加的内容,看还有什么需要修订的地方没有?—百無一用是書生 (☎) 2008年10月7日 (二) 19:12 (UTC)
机械人申请的审查和通过标准
本人一直对中文维基百科的机械人申请颇感不满。本人早曾申请一机械人,无人反对(曾有反对者,但讨论后均转为同意或中立)。如今已过去了三个多月,审查方面毫无消息,本人只申请就此荒废在那里。维基百科:机械人没有列明主持机械人申请事宜的行政员名单,也没有明确的通过步骤,甚至连通过要求也没有。这样一来,申请人便不知自己申请的机械人是否达到了要求,或还须如何改进,更不知道行政员是否有真正理会过机械人申请,或被莫名其妙地拒绝。而且,没有客观标准,会使行政员有太大的权力控制机械人上台或下台,往往会导致“公报私仇”问题的出现。本人很希望维基社群共同提出客观的通过标准,促进日后自动化编辑的发展。谢谢。钢琴小子 (留言) 2009年3月22日 (日) 10:34 (UTC)
应修改成
自动批准
- 中文维基百科允许bot的操作者直接向监管员请求授权,本地社群将视为授权给监管员而自动批准。对于自动批准的bot,必须符合下列要求:
- bot须先申请bot试运行权限,以此权限于中文维基百科至少编辑一周或至少编辑100次,用以演示其运行过程。
- bot只能用于维护跨语言链接和修复重定向