维基百科:维基简讯/2012/31/技术报告
SVG档案翻译技术即将革新
编辑2011年7月9日南苏丹宣布独立,而一年后的今日已经有142个语言版本的维基百科都对于此事件有所描述,这之中也不乏在最初消息遭到证实后立即进行的修改。然伴随著资讯的快速流通,义大利语维基共享资源贡献者“Danielemezzalira”创建了有关国界新变动以及民族分布的新地图,随后该地图也被翻译成数10种不同语言,这包括有英语、希腊语、加泰隆尼亚语、马其顿语等等。这些修改过的图片随后作为不同的单读图片,陆陆续续上传到维基共享资源上提供维基百科使用。
到目前为止一切都很好,然而南苏丹现今仍然只是一个处于刚起步阶段的国家。由于南苏丹独立所引起的众多边界冲突仍然没有停歇,没有人能够知道地图上的国家的边界是否永远都不会改变。想当然尔,那么人们也会想到是否地图在未来10年内又要有显著修改。这个修改并不是指大规模改变下的编辑修正,而是各个维基百科计画人士迅速更新自己语言版本的地图。这样做的话,老实讲懂技巧的话其实只需要20分钟的时间,但是包括加泰隆尼亚语、希腊语、马其顿语都要不断复制档案而只为了同一个目的?由于维基百科志愿者和其他用户往往只会更新他们所使用语言的档案版本,这意味著之后每个人总共要花费数小时的时间,来让几10个档案文件一一上传到维基共享资源上。不过更令人惊讶的是,在这些贡献者的努力下这些图像往往能够同时更新,也因此长期以来这也被视为维基百科计画的小缺点看待。
不过正在参加今年8月Google夏日程式码大赛的维基计画开发者哈利·伯特(Harry Burt)决定展开一项名为“TranslateSvg”的计画,改变当前常见的工作流程,而首要目的之一便是有效率使用SVG档案。计画首先借由程式设计的方式来让人们更容易翻译这些档案,紧接著设计出让人能够直接在同一个SVG档案中嵌入新的翻译字词;如果这项计画成功的话,将能够有效减少中文维基百科中常见的使用非中文语系图表的问题。以这次案例来说意味著今后只要有人将图片因应时势而修改图片边界的话,一瞬间各个语言版本的贡献者便能够在这档案中直接进行翻译。而用户也不需要担心是否要在Inkscape等软体上处理这些流程,如果这技术成功引入的话用户在任何时间只会看见一组翻译文字,甚至能够轻易修改这些不同语言文字标签的位置。这对于规模较小的修改能够获得许多正面帮助,因为“TranslateSvg”能够让正在进行大规模计画性修改的用户即时更新,但对于维基百科计画而言也有可能收到不佳回馈。
对于当前“TranslateSvg”发展的进度伯特抱持乐观的态度,到目前为止主要的障碍是有关程式码的内容审查,并在此期间也会决定是否要继续实施“TranslateSvg”的技术。如果顺利获得使用核准的话,“TranslateSvg”最快便能够在今年年底以前成为维基共享资源的修改方式之一。
维基百科条目回馈工具再次更新
编辑对于维基百科要如何让浏览者能够发表意见始终是一大挑战,其中维基媒体基金会的开发人员法布里斯·弗洛林(Fabrice Florin)便在2012年维基媒体国际会议就在第二天便对于条目回馈工具表达意见。在这场演讲中弗洛林提到基于先前条目评分工具使用的经验,维基媒体基金会将另外推出新的第五版本条目回馈工具。
这使得被视为旧版本的条目评分工具其地位陷入一种尴尬的地位,因为已经陆续有其他语言版本的维基百科都曾经或者正在使用这一工具,这包括有英语维基百科、德语维基百科和中文维基百科等。就设计概念而言条目评分工具其部分功能就如同过去传统使用的评分工具,在维基媒体基金会期望能够给予读者基会表达意见、进而评估个别条目品质的方针下广为推广。其中德语维基百科也在2008年提出类似想想法,但是对于德语维基社群来说也陆续有人强烈质疑实际的评估作用,最后德语维基百科放弃继续使用条目评分工具。
虽然说借由评分回馈的设计功能能够让维基百科用户对于条目水准有一定了解,其中英语维基百科当前所使用的第四版本条目回馈工具以及中文维基百科所使用的条目评分工具都是以“评分”为主,但由于德语维基百科本身对于条目文章会由内部自行评估情况下并未被采纳。在2011年7月英语维基百科开始使用第四版本条目回馈工具,中文维基百科也在同年11月开始采用条目评分工具。其中两者为了能够调查浏览者对于文章的反应,因此设计出4种个不同的问题来让浏览者评选等级,而分数从1颗星(完全不符合标准)到5颗星(非常优秀)给予用户选择。其中这些评分将重点放在:
- 可信度:你觉得本条目有足够的参考文献,并且这些文献的来源可靠吗?
- 客观性:你觉得本条目是否已经公正合理地描述了各方观点?
- 完整性:你觉得本条目是否已经涵盖了所有必要的内容?
- 可读性:你觉得本条目内容的组织和撰写是否精心完美?
然而应与维基百科在这时使用后,法布里斯和他的研究小组发现评分的方式也证实先前德语维基百科的担忧,也就是条目回馈借由评分的方式并无法确定是否客观,对于维基百科用户而言也无法判断浏览者是因为条目主题或者是内容来评分。因此法布里斯决定另外开发新版本的条目回馈来解决这问题,在新第五版本条目回馈工具中不再提供用户用星星评分,但也给读者的机会,但也允许用户借由撰写评论的方式来评估条目品质。这种直接的回馈方式预估能够比条目对话页更加直接且有效,此外比起过去评分功能来说撰写评论的方式更能提供条目编辑用户优先考虑。甚至也有可能鼓励原本只将维基百科作为搜寻资料工具的浏览者,一同加入维基百科编辑用户的行列。
英语维基百科开始推动第五版本条目回馈工具准备采用,而在最近上传有关浏览者如何与维基百科用户互动的影片中也有所提及。目前大约有3%的英语维基百科条目开始安设新型回馈工具来调查用户反应,包括英语维基百科的“Barack Obama”等经常浏览条目首先测试。英语维基百科计画在7月底时将工具使用比例扩大到10%,并在9月下旬扩展到整个英语维基百科之中。但尽管如此,关于第五版本条目回馈工具是否真的能够解决过去评分问题仍需要时间验证,而中文维基百科是否会跟进使用则须要等待进一步的讨论。
维基媒体基金会的分析团队与技术
编辑在过去几个月中,维基媒体基金会为了能够准备推出种种新的想法,往往都会在事前不断就用户习惯进行调查。因此也理所当然早以组织了一个分析团队,然而一直到最近维基媒体基金会才向维基百科计画的用户揭露这批幕后帮手。
当前维基媒体基金会分析团队的成员,包括有程式设计师大卫·斯库诺弗(David Schoonover )与安德鲁·奥托(Andrew Otto)、资深数据分析师Erik Zachte和不知名产品经理蒂耶德里克·范·利埃(Diederik van Liere)。维基媒体基金会在推动一些想法或者正在进行的计画时,往往会希望这个分析团队能够先提出相关的调查报告;到了今日他们所推出的维基报告(Wikimedia Report Card)已经成为许多计画是否成功的判读数据之一,而在平日也由他们对于维基百科的浏览次数、特殊的浏览者、编辑活动数量等等进行调查。
而为了能够提供维基报告来给其他维基百科用户了解,分析团队借由JavaScript编写的图形使用者介面工具包Limn来让数据直接以图表呈现,这让更多非技术性出身的用户能够自行分析艰深数据而不需要依靠分析团队或者其他分析师。作为一个维基媒体基金会所推广的应用软体,维基媒体基金会分析团队希望这样能有助于数据分析资料能被广泛推广运用。
数据服务平台
编辑不过维基媒体基金会分析团队还有另一个更大规模的计画,也就是建立一个维基百科通用的电脑数据分析平台,并将其代称为“海妖”(Kraken)。分析团队能够建立一个平台来调查维基百科社群中所有转换、储存和查询等数据资料并加以分析之,期望这样能够协助维基媒体基金会推动更多计画。实际上对于分析团队而言维基百科与姐妹计画的成功反而是个坏处,因为有的时候维基媒体基金会便是要在大量数据中找出最为重要的少数资料来作分析;但是当前对于分析团队而言光是回答“葡萄牙和巴西的浏览者所青睐的不同内容为何?”就必须困难的逐一分析搜索,为此分析团队便期望能够借由“海妖”来解决这一问题。
此外“海妖”的推出也能够协助维基百科等页面进行A/B测试(A/B testing),来让维基百科社群了解各个版本对于浏览者的影响,甚至也能够向编辑用户了解到浏览者所看到的资讯与反应。从这一观点,“海妖”数据服务平台将是一个功能强大且统一规格的工具包,能够方便维基媒体基金会分析团队有效分析这些数据流动的趋势,也能够让维基用户轻易了解各种大型或小型计画背后影响的差异之处,进而能够实质意义上协助维基百科社群活动时的策划安排。
计算次数但并不跟踪
编辑然而就像任何分析系统般在分系数据情必须先统整所有资讯内容,“海妖”也必须从用户的各种应用软体获取缓存资料来转换分析数据,并且将这些数据储存起来以方便之后继续使用。但不同于其他“八爪章鱼”(Datenkrake)般,维基媒体基金会所使用的“海妖”并不会尝试侵犯用户的隐私。
同样受到维基媒体基金会的隐私政策限制,维基媒体基金会分析团队的行为都不能任意侵犯他人隐私权益。同样地广泛搜索用户资讯的“海妖”也将被视为一个数据平台看待,而不是来跟踪用户行为。不过为了能够分析不同数据来回复各种提问,分析团队的确也有必要将这些资讯储存起来,为此分析团队定时向大众公开自身所搜集到的资料并具体提到这些资料的用处。常见的储存资料包括有用户意见、网页图像、搜寻资料、编辑次数和新进用户的注册人数等等,而分析团队也会在元维基发表数据来让其他关注用户了解,同时用户也能够简单找到自己所需要的资料。另外分析团队对于相关连资讯也会协助用户分析,例如分类页面的资讯便可能与“机器人”使用量有关,而行动电话浏览的涨幅也往往影响到其他移动设备使用比率。借由分析这些资讯的方式,也能够让维基媒体基金会重新比较《维基百科五年战略计划》的发展状况。
透过存档了解过去维基大事,立即翻查。