Searx (/sɜːrks/) 是一款自由元搜索引擎[2][3][4][5][6][7][8][9],其以AGPLv3许可,目标是保护其用户的隐私权[10][11][12][13]。所以Searx不会搜集结果并与搜索引擎分享用户的IP地址或搜索历史。搜索引擎的追踪cookies也被阻挡,避免产生过滤气泡[14][15][16]。默认情况下,Searx透过HTTP POST发送查询请求,借此避免用户查询的字符串出现在网页伺服器上的日志中[17]。Searx的灵感来自Seeks英语Seeks项目[18],但其并未实现Seeks的P2P用户结果排名。

Searx
Searx网页接口
Searx网页接口
开发者Adam Tauber(昵称为asciimoo
首次发布2014年1月22日,​10年前​(2014-01-22
当前版本1.0.0(2021年3月27日,​3年前​(2021-03-27
原始码库github.com/asciimoo/searx
编程语言Python
类型元搜索引擎
许可协议自由软件 (AGPLv3)
网站asciimoo.github.io/searx/

每个搜索结果都是指向目标网页的直接链接,而非如Google所使用的追踪重定向链接。此外,如果有的话,这些直接链接也会有“缓存”与/或“代理”链接,这些链接让用户可以在不用实际进入结果页面的情况下查看网页。“缓存”链接指向archive.org中的存档版本,而“代理”链接则是透过以Searx为基础的网页代理来查看当下的页面。除了一般的搜索以外,这个搜索引擎也有可以搜索特定领域的标签页:文件、图片、资讯科技、地图、音乐、新闻、科学、社交媒体与影片等[19][20]

除了searx.me这个最广为人知的站台以外,Searx也有许多不同网址,由用户自行维护的站台[21][22],其中一些提供了透过Tor连线的服务[21]。"Meta-searx"网站则每次搜索都会从不同的随机站台中搜索[21]。Searx也提供了公开的API[23][24][25],同时也有Firefox的搜索提供者插件[26],还有Android应用程式[27]

搜索引擎与其他设置

编辑

Searx可以从82种不同的引擎中截取所有类别的结果。这包含了主要的搜索引擎与特定站点的搜索,如BingGoogleReddit维基百科YahooYandex[28]。每个类别的搜索引擎都可以透过“偏好设置”接口进行设置,而这些设置将会存储在用户浏览器的cookie中,不会存储在服务端,且出于隐私的原因,Searx并未实现用户登录模型。其他设置(如搜索接口语言与搜索结果语言等)也可以透过相同的方式设置[17]

除了偏好设置的cookie以外,也可以在搜索关键字前加上特定字符串来修改每次查询要使用的引擎、搜索分类与/或要搜索的语言[29]

  • !分類 — 搜索指定的分类。
  • ?分類 — 除了默认的分类以外,同时也搜索指定的分类。
  • !引擎 — 使用指定的引擎搜索。
  • ?引擎 — 除了默认的引擎以外,同时也使用指定的引擎搜索。
  • :語言 — 使用指定的语言搜索。

!?运算符可以多次指定来选取多个分类或引擎,例如!google !deviantart ?images :japanese cow

站台

编辑

任何用户都可以维护自行建立的Searx站台[30][31][32],这样就可以拥有最大化的隐私、避免公开站台壅塞、即使清除浏览器cookie也可以保留自定义的设置、可以审核执行的代码等等[33][34][35]。用户可以把他们建立的站台新增到所有公开站台的可编辑清单上,或是让其保持隐秘[28][33]。还可以将公开站台上没有的搜索引擎新增到自行架设的站台上[36]

还有另一个使用不同Searx站台与/或自行维护站台的理由是,自2019年起,Google已经开始屏蔽某些站台,包含某些searx.me所使用的IP,此时从这些站台搜索会出现“Google(意外当机:需要CAPTCHA)”错误[37]。作为回应,某些站台已修改为默默跳过使用Google搜索,即便它是唯一一个指定的引擎也一样[38][39]

参考资料

编辑
  1. ^ searx.me Site Info. Alexa Internet. [2019-07-29]. (原始内容存档于2019-07-19). 
  2. ^ Searx metasearch engine | Trisquel GNU/Linux - Run free!. trisquel.info. [2017-08-31]. (原始内容存档于2017-09-04) (英语). 
  3. ^ Libre Projects. libreprojects.net. [2017-08-31]. (原始内容存档于2017-08-22). 
  4. ^ Searx | Me and my Shadow. [2017-08-31]. (原始内容存档于2018-07-03). 
  5. ^ New search kid on the block | Glynsky and Pete. [2017-08-31]. (原始内容存档于2017-09-04). 
  6. ^ James, Author. SearX for Anonymous Search. IslandEarth. 2016-09-03 [2017-08-31]. (原始内容存档于2017-09-04). 
  7. ^ Kühnast, Charly. Peppered with Hits » Linux Magazine. Linux Magazine. [2017-08-31]. (原始内容存档于2017-09-04) (美国英语). 
  8. ^ 5 Best Search Engines That Respect Your Privacy. BestVPN.com. 2016-12-23 [2017-08-31] (美国英语). 
  9. ^ Motori di ricerca alternativi | Signor D. [2017-08-31]. (原始内容存档于2017-09-04). 
  10. ^ searx, selfhosted search engine with your own privacy | Freedif. freedif.org. [2017-08-30]. (原始内容存档于2017-09-04) (美国英语). 
  11. ^ Bradbury, Danny. Self-hosted search option is a new approach to bursting the filter bubble. Naked Security. 2017-08-10 [2017-08-30]. (原始内容存档于2017-09-04). 
  12. ^ Zak, Robert. What Is the Best Search Engine for Privacy?. Make Tech Easier. 2017-04-03 [2017-08-30]. (原始内容存档于2018-07-03). 
  13. ^ Sonmez, John. Searx: self-hosted web metasearch engine. Tuxdiary. 2014-12-22 [2017-08-31]. (原始内容存档于2017-07-07). 
  14. ^ New fast and private searX instance for private websearches. Tapatalk.com. [2017-08-30]. (原始内容存档于2017-09-04) (英语). 
  15. ^ administrator, Acc. Як захистити свої дані в інтернеті: 11 корисних додатків. Новини АСС. [2017-08-31]. (原始内容存档于2017-09-04) (乌克兰语). 
  16. ^ Searx: Die konfigurierbare Suchmaschine, die deine Privatsphäre respektiert. t3n News. [2017-08-31]. (原始内容存档于2017-09-04) (德语). 
  17. ^ 17.0 17.1 preferences - searx.me. searx.me. [2017-09-25]. (原始内容存档于2018-03-20). 
  18. ^ about - searx.me. searx.me. [2017-08-30]. (原始内容存档于2017-06-11) (英语). 
  19. ^ A Primer on Staying Secure and Anonymous on the Dark Web. TechSpot. [2017-08-30]. (原始内容存档于2017-09-04) (美国英语). 
  20. ^ Searx 0.10.0: Die eigene Suchmaschine auf einem Raspberry Pi - Golem.de. [2017-08-31]. (原始内容存档于2017-09-04) (德语). 
  21. ^ 21.0 21.1 21.2 Searx instances · asciimoo/searx Wiki. GitHub. 2017-08-29 [2017-09-25]. (原始内容存档于2017-09-09). 
  22. ^ searx-stats. stats.searx.oe5tpo.com. [2017-09-25]. (原始内容存档于2017-10-03). 
  23. ^ Search API — searx 0.12.0 documentation. asciimoo.github.io. [2017-08-31]. (原始内容存档于2017-09-25). 
  24. ^ Building a Keyword Monitoring Pipeline with Python, Pastebin and Searx | Automating OSINT Blog. www.automatingosint.com. [2017-08-31]. (原始内容存档于2017-09-16) (美国英语). 
  25. ^ Building a Keyword Monitoring Pipeline with Python, Pastebin and Searx - bellingcat. bellingcat. 2017-04-21 [2017-08-31]. (原始内容存档于2017-04-24) (美国英语). 
  26. ^ Search results for "searx" – Add-ons for Firefox (en-US). addons.mozilla.org. [2019-07-15]. (原始内容存档于2020-11-11). 
  27. ^ Searx - Apps on Google Play. play.google.com. 
  28. ^ 28.0 28.1 Tauber, Adam. searx: Privacy-respecting metasearch engine. 2017-08-30 [2017-08-31]. (原始内容存档于2017-08-25). 
  29. ^ Search syntax — searx 0.12.0 documentation. asciimoo.github.io. [2017-08-30]. (原始内容存档于2017-08-30). 
  30. ^ My Searx instance - Logan Marchione. Logan Marchione. 2015-10-18 [2017-08-31]. (原始内容存档于2018-12-08) (美国英语). 
  31. ^ New fast and private searX instance in Europe for private websearches • r/privacy. Reddit. [2017-08-31]. (原始内容存档于2018-12-07) (英语). 
  32. ^ How to setup your own privacy respecting search engine in a couple of hours with a free ssl certificate • r/privacytoolsIO. Reddit. [2017-08-31]. (原始内容存档于2018-03-18) (英语). 
  33. ^ 33.0 33.1 Why use a private instance? — searx 0.12.0 documentation. asciimoo.github.io. [2017-08-31]. (原始内容存档于2017-08-30). 
  34. ^ Privacy advantages of running my own searx instance • r/privacytoolsIO. Reddit. [2017-08-31]. (原始内容存档于2017-09-17) (英语). 
  35. ^ Searx.me is overloaded. Privacytools.io should link to just the instances page or randomize. • r/privacytoolsIO. Reddit. [2017-08-31]. (原始内容存档于2018-03-20) (英语). 
  36. ^ Engine overview — searx 0.12.0 documentation. asciimoo.github.io. [2017-08-31]. (原始内容存档于2017-09-25). 
  37. ^ !google cow - searx.me. searx.me. [2019-07-15]. (原始内容存档于2021-03-03). Error! Engines cannot retrieve results.  google (unexpected crash: CAPTCHA required)  Please, try again later or find another searx instance. 
  38. ^ !google cow - searx. searx.info. [2019-07-15]. Sorry! we didn't find any results. Please use another query or search in more categories. [永久失效链接]
  39. ^ !google cow - searx. search.disroot.org. [2019-07-15]. Sorry! we didn't find any results. Please use another query or search in more categories. 

外部链接

编辑