维基百科:机器人/申请/WhitePhosphorus-bot/3
- 状态: 撤回申请
- 操作者: 砜中嘌呤的白磷萃取 打谱
- 提请时间: 2017年2月10日 (五) 14:11 (UTC)
- 自动化程度:全自动
- 程式语言:Python
- 用途:自动更新条目中的Alexa排名
- 源代码连结:
- 编辑时段及频率:每月跑一次,最大15/min
- 受影响页面:Special:链入页面/Template:Infobox website、Special:链入页面/Template:Infobox dot-com company中的部分条目
- 遵守机器人规范:不相关
- 已有机器人权限:是
- 其他信息:
- 没在条目做改动,只在沙盒做了编辑展示一下格式:这是差异链接(只列出了信息框),请关注一下
|alexa=
参数和最后效果,格式可以商榷。 - 只有同时检测到
|url=
(类似伪基百科这种有多条时只跑第一条url)和|alexa=
(防止中文维基百科这种alexa排名完全与维基百科相同的)参数时,才会跑这个条目。 - 支持三种
|url=
参数的格式:{{url|域名}}
、[域名 说明文字]
,这两种都没检测到就直接把整个参数当成域名。如果404了就不更新此条目。 - 用的是alexa的api
http://data.alexa.com/data?cli=10&&url=域名
。404的判断也是从这里获得的。
- 没在条目做改动,只在沙盒做了编辑展示一下格式:这是差异链接(只列出了信息框),请关注一下
- 以上。 --砜中嘌呤的白磷萃取 打谱 2017年2月10日 (五) 14:11 (UTC)
- 这种应当搬到wikidata,并且到那上面去跑。--Antigng(留言) 2017年2月10日 (五) 14:13 (UTC)
- 不是很了解那里,之前去那边的互助客栈问了。 --砜中嘌呤的白磷萃取 打谱 2017年2月10日 (五) 15:51 (UTC)
- 这种应当搬到wikidata,并且到那上面去跑。--Antigng(留言) 2017年2月10日 (五) 14:13 (UTC)
- github不是中国网站,却来个中国排名,比较奇怪....alexa排名只有wikipedia.org这样的才有,其下的二级域名都算wikipedia.org的,所以目前的检测方式似乎可能不太恰当。另,我也觉得应该在wikidata跑--百無一用是書生 (☎) 2017年2月13日 (一) 09:25 (UTC)
- Traffic Rank in Country也是那个接口给的,是按国家排名最靠前的(The site with the highest combination of visitors and pageviews is ranked #1 in that country.)。二级域名的问题,现在如我所述是假设有
|alexa=
参数的都有独立的alexa排名(即不会自作主张地加入alexa排名,只会更新),所以不会跑那些维基百科的二级域名,暂时没看到什么不妥。最后,如果wikidata的alexa排名能很方便地同步到zhwp的信息框(不太懂这个),我很乐意在data上跑。顺便,那边的人说“running the bot once per year is fine to update the Alexa rankings”,因为不删除旧的数据。 --砜中嘌呤的白磷萃取 打谱 2017年2月13日 (一) 09:40 (UTC)- 国家排名这个数据太诡异,谨慎一点的话,建议先不要,只要全球排名数据比较好。wikidata数据可以通过#property语法来调用,但现在一般都是包装在lua里来实现--百無一用是書生 (☎) 2017年2月14日 (二) 03:46 (UTC)
- 调用方法是{{#invoke:Wikidata|getValue|P1661|FETCH_WIKIDATA}},效果见Quora。如果要显示日期要复杂一些,Module:Wikidata不能实现,需要引进d:Module:Wikidata。--GZWDer(留言) 2017年2月14日 (二) 13:54 (UTC)
- 国家排名这个数据太诡异,谨慎一点的话,建议先不要,只要全球排名数据比较好。wikidata数据可以通过#property语法来调用,但现在一般都是包装在lua里来实现--百無一用是書生 (☎) 2017年2月14日 (二) 03:46 (UTC)
- Traffic Rank in Country也是那个接口给的,是按国家排名最靠前的(The site with the highest combination of visitors and pageviews is ranked #1 in that country.)。二级域名的问题,现在如我所述是假设有
- github不是中国网站,却来个中国排名,比较奇怪....alexa排名只有wikipedia.org这样的才有,其下的二级域名都算wikipedia.org的,所以目前的检测方式似乎可能不太恰当。另,我也觉得应该在wikidata跑--百無一用是書生 (☎) 2017年2月13日 (一) 09:25 (UTC)
感谢各位的帮助。那我就 操作者撤回申请了,有空会考虑写一个在wikidata运行的机器人。 --砜中嘌呤的白磷萃取 打谱 2017年2月14日 (二) 14:35 (UTC)
- @WhitePhosphorus:建议你先去了解一下wikidata的数据模型,了解一下什么是Statement、Qualifier、Rank、Reference,以及怎么表示。--GZWDer(留言) 2017年2月14日 (二) 15:24 (UTC)