Cewbot | |
---|---|
(讨论 · 贡献) | |
操作者 | kanashimi |
设计者 | kanashimi |
是否已批准? | Yes |
机器人权限? | 是 |
任务 | 见作业列表 |
编辑频率 | 平均每分钟12次 |
编辑时段 | 定期/常时持续 |
自动/手动 | 全自动编辑 |
编程语言 | JavaScript |
遵守机器人规范? | 是 |
源代码公开? | GitHub上的wikibot页面。 另见各作业说明 |
可以紧急停止? | 是 |
Cewbot的用户框 |
此为机械人帐号,使用wikiapi,操作者为kanashimi(讨论),属合规附属帐户,以半自动或全自动方式协助用户处理繁琐而重复的工作。此机械人已得到许可,亦正在运作中。申请存档见此 管理员︰若然此机械人失灵或作出有问题编辑,请施予封禁。 |
按下作业列表之“停止”连结可停止个别作业。机器人会在正当前批次处理完成后停止,通常是两三百个页面。 按左方封禁钮将封锁此帐号,并停止所有作业。 |
欢迎提供各种特殊情况以作测试,并请协助检查错误。 若对我输出的任何文本内容有改进建议,请前往讨论页提出修改意见。 |
此机器人在Wikimedia Toolforge上运行,工具账户名为cewbot。 致管理员:如果这个机器人因程序故障需要封禁,封禁时请禁用自动封禁以免影响其他在Toolforge上运行的机器人。 |
机器人设计理念
编辑以下列出理想之机器人设计理念:
- 最小化更动
- 若是完全不更动也能接受,就不更动。若必须更动,则在可确认的范围内一次更改到位,包括规范化;否则仅作最小修正。
- 除非是非修正不可的问题,否则应该尽量避免修改封存纪录。
- 一次到位
- 更动具稳定度。同样操作执行一次后,第二次执行就不该有更动。
- 仅更动筛选过的内容
- 仅处理确认属于本次任务之 pattern。对于无法解析或有问题者,跳过不处理之。宁可漏判 (false negative) 也不误判 (false positive)。例如先对内容作尽可能精准之模式匹配,并针对符合之部分方作更动。若模糊无法判别,则不更动,而注记为可能需要增加模式、或需要人工判别之内容。
- cf. 最小权限原则
- 考量特殊wikitext
- 处理页面最好采用语法解析器。直接处理wikitext时,须考量特殊情形。如:
- 考量相同表现之语法。如:要寻找所有“軟體”亦须匹配字词转换语法「軟-{}-體」。
- 要侦测所有{{Tl}}须排除“
<!-- {{Template:Tl}} -->
”或在<nowiki></nowiki>
中的情况。 - 使用
{{-}}
、{{!}}
、{{=}}
、解析器函数、特殊字符与魔术字的情况。例如要找“机器人”,也得考虑“{{{name|{{int:Group-bot}}}}}
”。
因此:
- 依据规范产生wikitext,少用花俏(漂亮舒适而繁杂)但能产生(解析出)相同表现之语法。
- 对大量使用之外部链接,以模板替代之。e.g., 近代デジタルライブラリーのアドレス変更およびテンプートによるカプセル化
- 繁简文字直接用分歧性最大的语言,于分歧性小的语言自动转换就没有这个烦恼了。就“-{回复}-”、“-{回復}-”、“-{回覆}-”来说,使用繁体,简体自动转换。遇到“著”这个这个字则分开成“着”和“著”(
由于“著”字意思太多,香港和大陆将“着”、“著”二字分家,其实比台湾只用一字更能消除歧义。
)。这样都能显著降低转换错误的困扰。(Wikipedia:互助客栈/其他#假如有很简洁扼要的方法能解决繁简转换问题,是否有必要特地使用复杂的手工转换标签?有相关讨论) - 字词转换应该尽可能维持整个词汇的完整,这样除了人类容易读原始码,亦可方便机器处理。若无必要,建议采用「-{軟體}-」而非「軟-{}-體」以方便搜寻。必要时,亦可考虑以零宽空格代替<nowiki>。
- 完整记录
- 尽可能作完整记录。可能的话还包含 undo script。
- 更动后须测试再上路
- 每次更动后皆先作小幅度测试。若发生问题则即时回复,确保没问题再正式上路,应用于成品/上线环境 (production environment)。
- 考量人类作业的因素
- 机器人的操作应该能够让人类理解。并且若是人类手动代替机器人操作部分作业时,机器人也能够正确判别以及运作。
- 机器人对使用者编辑的修正应采用友善的语气。
- 当机器人失灵时,人类应当有办法手动代替作业。例如不能够把知道某些密码、密钥或是杂凑值或者其生成方法当作编辑后能够正确运作的条件。
- 机器人应考虑作业到一半被其他人或者其他机器人插断、编辑冲突的情况,若可行则再次作业,或采行相对应的措施。
- 开放原始码并且维持一个能够即时修改维护程式的团队
- 这可以让机器人在出问题、有漏洞时可以即时更正,并且避免机器人年久失修、无人维护。
Cewbot 作业列表
编辑# | 作业用途 说明 | 状态 | 备注 |
---|---|---|---|
1 | 替换台铁图徽为SVG版本 | 已完成 | 开始机器人作业请求 |
2 | 添加规范控制模板 | 已完成 | |
3 | 修正不适宜用词:相关词条 | 未批准 | |
4 | 修正错别字:钱钟→钱锺 | 已完成 | |
5 | 修正配音误用模板 | 已完成 | |
6 | 提报关注度不足过期提醒 | daily 每日运行 «停止» | |
7 | 拆分或合并维护模板 {{Multiple issues}} | regularly 定期运行 «停止» | |
s:1 | 校订繁简转换,修正错别字 | 未批准 | @维基文库 |
8 9 10 13 18 |
修复维基百科语法错误 (WP:WPCHECK), Special:LintErrors错误语法清理 |
regularly 定期运行 «停止» | |
N/A | 记录页面之维护清理与归档封存作业 仅执行于使用者与bot页面 |
regularly 定期运行 | 2016/3/23– @zhwiki 2016/6/9– @jawiki 只在拥有者用户空间编辑,依据方针毋需申请 |
d:1 | Import labels/aliases | regularly 定期运行 | @wikidata |
11 | 使用Wikidata数据来清理跨语言连结 | 未批准 | 由机器人修复跨语言连结 |
ja:1 | 仮リンク整備 | regularly 定期运行 | @jawiki |
d:2 | Synchronize data | regularly 定期运行 | @wikidata |
ja:1-2 | Bot作業依頼 | 不定期运行 | @jawiki |
en:1 | Convert interlanguage link templates with local article to wikilinks | weekly 每周运行 | @enwiki, also help bot requests |
n:1 | 检查与维护外部链接 | 停止运行 | @wikinews |
n:2 | 汇入每日报纸头条新闻标题 | daily 每日运行 | @wikinews |
n:3 | 存档保护作业 | daily 每日运行 | @wikinews |
n:4 | 自动定时清理沙盒 | daily 每日运行 | @wikinews |
d:3 | Import data from 台湾物种名录 (Q26218155) to wikidata. | regularly 定期运行 | @wikidata, 台湾物种名录 |
12 | 将跨语言连结模板转为内部链接(一般 wikilink) | regularly 定期运行«停止» | 受影响页面 |
ja:2 | ウィキ文法のチェックと修正 | 不定期运行 | @jawiki |
moegirl 1 | 自动存档萌娘百科讨论版、提问求助区。自动定时清理沙盒。 | 清理沙盒由星海-adminbot代 continuous 持续运行 自动存档: 由AnnAngela-abot取代 |
@萌娘百科 |
c:1 | Add photo links on TAIBNET of species. | Declined 因版权问题未批准 |
@commons |
c:2 | Upload images from 慕光之城 蛾类世界. | Declined 因版权问题未批准 |
@commons |
c:3 | Upload pictures from Public Domain Pictures.net with tags. | Declined 因版权问题未批准 |
@commons |
14 | fix LanguageConverter syntax | 未批准 | |
15 | 帮忙补签名 | continuous 持续运行 «停止» | |
大典:1 | 沙盒清理+帮忙补签名+语法校正 | continuous 持续运行 | @大典, approved |
n:5 | 半自动汇入美国之音的报导 | continuous 持续运行 | @wikinews 常时运行 |
n:6 | 帮忙补签名 | continuous 持续运行 | @wikinews |
n:7 | 更新讨论页面主题列表 | continuous 持续运行 | @wikinews |
n:8 | 定期封存讨论页面 | regularly 定期运行 | @wikinews |
大典:2 | 更新讨论页面主题列表 | continuous 持续运行 | @大典 |
c:4 | Cleanup Panoramio files needing categories | completed 已完成 | @commons, also help bot requests |
16 | 更新讨论页面主题列表 | continuous 持续运行 «停止» | |
ja:3 | 見やすい議題一覧表の作成 | continuous 常時稼働中 | @jawiki |
s:2 | 更新讨论页面主题列表+补签名+沙盒清理 | continuous 持续运行 | @维基文库 |
17 | 自动定时清理沙盒 | regularly 定期运行 «停止» | |
c:5 | Import M 6+ USGS earthquake shakemaps and DYFI City Maps | daily 每日运行 | @commons |
incubator:1 | 为闽东语维基新闻自动添加每日报章头条 | 停止运行 | 以一般用户身分运行 @Wikimedia Incubator |
moegirl 2 | 帮忙补签名 | 由星海-adminbot代 continuous 持续运行 |
@萌娘百科 |
v:1 (+bot) | 更新讨论页面主题列表+补签名+沙盒清理 | continuous 持续运行 | @维基学院 |
19 | 自动更新 zhwiki 首页特色内容、优良条目 | daily 每日运行 «停止» | 除修正页面、更新列表外, 以一般用户身分运行 |
c:6 | Cleaning over-categorization 清理过度分类 | regularly 定期运行 | @commons running regularly |
c:7 | Automatically uploading hurricane track maps | daily 每日运行 | @commons |
20 | BOTREQ: 清理Category:公司信息框使用额外地区代码参数的页面 | weekly 每周运行 «停止» | |
c:8, + | Generate topic list for discussion pages | continuous 持续运行 | @commons |
21 | 维护讨论页之存废讨论纪录与模板 {{Old vfd multi}} | regularly 定期运行 «停止» | |
22 | 更新Wikipedia:资料库报告页面 | regularly 定期运行 | |
en:2 | Updating the section counts and article assessment icons for all levels of Wikipedia:Vital articles. |
daily 每日运行 | @enwiki |
en:3 | Maintaining the template {{Vital article}} in the talk pages. | daily 每日运行 | @enwiki |
en:4 | To inform of the article's PROD eligibility. | daily 每日运行 | @enwiki |
moegirl 3 | 更新讨论页面主题列表 | 由星海-adminbot代 continuous 持续运行 |
@萌娘百科
测试程式码能否正常运作 |
en:5 | Normalizing {{Multiple issues}} | weekly 每周运行 | @enwiki |
23 | 修正失效的章节标题 Fixing broken anchors | continuous 持续运行 «停止» | |
en:6 | 修正失效的章节标题 Fixing broken anchors | continuous 持续运行 | @enwiki |
ja:4 | 壊れたアンカーの修正 Fixing broken anchors | continuous 常時稼働中 | @jawiki |
simple:1 | fixing broken anchors, adding {{Unsigned}}, and {{Article issues}}. | continuous 持续运行 | @simplewiki |
moegirl 4 | 修正失效的章节标题 Fixing broken anchors | 由星海-adminbot代 continuous 持续运行 |
@萌娘百科 |
en:7 | Sorting category of Thai names | weekly 每周运行 | @enwiki |
24 | 调整页面的字词转换规则 | weekly 每周运行 «停止» | |
25 | 正规化日期格式、清理引文模组未知参数 | weekly 每周运行 «停止» | |
c:userland | Notify new files in category. | daily 每日运行 | @commons userland |
en:8 | Maintaining challenge templates on corresponding pages. | daily 每日运行 | @enwiki |
en:9 | Updating all levels of Wikipedia:Vital people. | no consensus | @enwiki |
ja: | 诸言语版のFA及びGA、FLの更新 | weekly 每周运行 | @jawiki |
26 | 强化 维基百科:其他语言的维基百科典范条目 | weekly 每周运行 | |
ks:1 | Normalizing {{Multiple issues}} | weekly 每周运行 | @kswiki |
wikt:1 | 目录列表、补签名、修正错误锚点之类 | continuous 持续运行 | @zhwiktionary 顺便处理机器人请求 |
en:10 | Create lists for w:en:Wikipedia:Featured articles in other languages and for GA, FL | weekly 每周运行 | @enwiki |
n:9 | 同步通用页面 | regularly 定期运行 | @wikinews |
wikt:2 | 自动存档机制+同步通用页面 | daily 每日运行 | @zhwiktionary 顺便处理机器人请求 |
d:4 | Import new articles from online recsources. | regularly 定期运行 | @wikidata |
b:1 | topic list、补签名、存档、修正错误锚点、清理沙盒之类 | regularly 定期运行 | @zh.wikibooks |
n:10 | 创建每日/每月新闻摘要页面+分类 | regularly 定期运行 | @wikinews |
en:11 | Generate topic list for discussion pages | continuous | @enwiki |
de:1 | Fixing broken anchors | continuous | @dewiki |
simple:2 | Convert interlanguage link templates with local article to wikilinks. | weekly 每周运行 | @simplewiki |
n:11 | 清理重定向的分类 | regularly 定期运行 | @wikinews |
27 | 清理重定向的分类 | weekly 每周运行 | |
28 | 清理导航模板的重导向内部链接,转换模板中的内部链接为目标页面标题。 | weekly 每周运行 | |
en:12 | Maintain {{WikiProject banner shell}} | regularly 定期运行 | @enwiki |
29 | 维护 {{WikiProject banner shell}} | regularly 定期运行 | |
30 | 修正拼写错误连结 | weekly 每周运行 |
申请中作业
编辑正在处理...目前正审批(请求bot权限中)之作业
运行中作业
编辑TODO: w:en:Template:Log, w:en:Template:ToDo
提报关注度不足过期提醒
编辑- 利用
{{Notability-talk}}
将提交到通用关注度分类下的、列入超过30天的页面的用户讨论页上留言,询问是否需要提删。 «停止»
- 若您不想接受关注度提醒,请利用
{{bots|optout=afd}}
模板。或利用{{Personal announcement}}
模板之类,在您的用户讨论页中加入如下列之提醒:“请勿在讨论页中放入关注度信息”。 - 长期性作业,将定期运行。编辑频率:每天一次。
- bot 运作记录: User:cewbot/log/20150503
- TODO:
{{bots|optout=np}}
- 已批准。
拆分或合并维护模板
编辑- 长期性作业,将会定期运行或不定期手动执行。编辑频率:每月或每周一次。
- 设定参数: User:Cewbot/规范多个问题模板设定
- bot 运作记录: User:cewbot/log/20150916
- 已批准。
修复维基百科语法错误
编辑- 长期性作业,将会定期运行或不定期手动执行。编辑频率:每月或每周一次。
- bot 运作记录: User:cewbot/log/20151002
- 多项已批准。
将跨语言连结模板转为内部链接
编辑- 长期性作业,将会定期运行。编辑频率:每周一次。
- 已批准。
- GitHub上的原始码 (source code)
帮忙补签名
编辑- 帮忙补签名«停止»
- 长期性作业,将会持续运行。
- bot 运作记录: User:Cewbot/log/20170515
- 已批准。
- GitHub上的原始码 (source code)
- 您可于特定页面加入
{{Bots|optout=SIGN}}
来避免机器人添加签名标记。 - 您可在您的用户页或您的用户讨论页加入
{{NoAutosign}}
来避免机器人为您自动补签名。 - 若您只是暂存,请在编辑注解加上"暂存"字样即可避免补签名。若您希望自行手动补签名,请迳行修改即可。
增加讨论页面主题列表
编辑- 增加讨论页面 topic list 主题列表«停止»
- 长期性作业,将会持续运行。
- 设定参数: User:Cewbot/讨论页面主题列表设定
- 已批准。
- GitHub上的原始码 (source code)
自动更新首页特色内容
编辑- 长期性作业,以一般用户身分运行。编辑频率:对于明天以及后天的特色内容与优良条目,每天2次。«停止»
- Wikipedia:首页/特色内容展示设定、Wikipedia:首页/特色内容展示报告、Wikipedia:首页/优良条目展示报告。
- GitHub上的原始码 (source code)
- 已批准。
清理Category:公司信息框使用额外地区代码参数的页面
编辑- 用途:BOTREQ:清理Category:公司信息框使用额外地区代码参数的页面
- GitHub上的原始码 (source code)
- 长期性作业,将会持续运行。
- 已批准。
Fix broken anchor
编辑- Configuration: User:Cewbot/log/20201008/configuration
- GitHub上的Source code
- The bot also notify broken anchors in the talk page via {{Broken anchors}}.
- 已批准。
- I don't want the bot to modify my archives!
- Please using
{{bots|optout=anchor-fixing}}
, the bot will skip this page.
已完成或结束作业
编辑已结案: 完成、 已完成、停止作业(任务型),请协助检查错误。
添加规范控制模板
编辑- 转移 en wiki 之规范控制 (Authority control) 模板。
- bot 运作记录: User:cewbot/log/20150109
- Wikidata:WikiProject Authority control/Status
- 规范控制模板使用数目: 461277
- 已批准。
修正配音误用模板
编辑- 正规化角色介绍,修正配音误用已解决
{{Language icon}}
。
- bot 运作记录: User:cewbot/log/20150227
- 已批准。
修正错别字:钱钟→钱锺
编辑- 已修复 钱钟→钱锺
- bot 运作记录: User:cewbot/log/20150210
- 本例已批准。
替换台铁图徽为SVG版本
编辑- 将台铁图徽TRA_Logo.png替换为SVG版本File:TRA Logo.svg,以利后续将PNG版本删除。
- bot 运作记录: User:cewbot/log/20150103
- 已批准。
添加维基文库中提及本年的原始文献连结
编辑- 对前699年–1910年批量添加{{wikisource year mention}}
- GitHub上的原始码 (source code)
未批准作业
编辑不合要求、 驳回、 搁置作业、 不可行、 不建议机器人处理(建议手动修改)、撤回请求
修正不适宜用词:相关词条
编辑
相关词条→相关条目
bot 运作记录: User:cewbot/log/20150120没有必要。
撤回请求作业
已取消作业
机器人制作软体架构
编辑Cewbot 采用了包含制作机器人功能的 JavaScript 软体架构,可离线开发和运行。
- framework: wikiapi / CeJS MediaWiki 自动化作业用的程式库
- 可执行环境: node.js, JScript
- 采用 CeJS 函式库来制作维基百科机器人的范例
Screenshot when fixing WPCHECK
The User agent is CeJS/2.0 (https://github.com/kanasimi/CeJS)
when it's running under node.js.
API 功能使用状况
在 Wikimedia Toolforge 配置 node.js 任务的注意事项
编辑- Wikimedia Toolforge 采用的是 node v0.10.25, npm 1.3.10。
- 检查好函式库路径。跑 crontab 或以 jsub 执行时,自行以 npm 安装的 package 可能无效。得不依赖工作目录才行。
- 把配置记忆体增大。node.js 会因为记忆体不够大而 crash。
- 可以直接在 command 下
/usr/bin/jsub -N cron-tools.cewbot-1 -mem 1g -once -quiet __work__
测试。
- Wikimedia Toolforge 上之资料库仅为正式上线版之删节副本。资料并非最新版本(但误差多于数分内),也不完全。
- ref. mw:Toolserver:Servers IP: w:en:Wikipedia:Blocking IP addresses#Sensitive for other reasons (91.198.174.0/24, 185.15.56.0/22, 198.35.26.0/23, 208.80.152.0/22), mw:Toolserver:Admin:DNS, mw:Meza/Install on Wikimedia Cloud VPS instance (172.16.0.0/16)
机器人常用关联资料
编辑- Cewbot status
- 机器人编辑纪录 跨语言活动 Global user contributions
- 全域帐号资讯 SUL
- Global latest edit XTools WikiChecker
- API feature usage 功能使用状况
- Sub pages 机器人所有子页面
- toolsadmin k8s-status
- toollabs:cewbot web page
tool |
---|
cewbot |
signature-checker |
toc |
anchor-corrector |
(mgp-cewbot) @ zh.moegirl |
- 机器人 status
- 29个机器人清单, 使用者权限级别, 使用者群组权限一览
- 机器人操作列表 (bot activity by last edit)
- List of bots by editcount List of bots by editcount (wikidata) zh.wikiscan
- 维基百科数据 汉语
- Debian Stretch grid status, Project: Tools Wikimedia Toolforge Tools 对外出口IP 185.15.56.0/24 (ask from IRC, not wikitech:News/CloudVPS NAT wikis)
- 维基媒体集群负载/内存状态概述 wikidata edits
- Edit summary search
- Icons
- Boards
- Development information
- Test pages and sites
- Sandbox: 沙盒 模板测试沙盒 模板沙盒 Module测试沙盒 (Module:沙盒) API沙盒 Flow测试页面
- testwiki: test2wiki: testwikidata: zh Beta Cluster en Beta Cluster
- misc