Come funziona Wikipedia?

Ti sei mai chiesto cosa accade quando cerchi qualcosa su Wikipedia? Chiamata diretta per….scoprilo subito.

Wikipedia ha posseduto un unico server fino al 2004, anno dell’inizio della sua espansione quando si è espanso ad un’architettura n-tier. In realtà non è wikipedia ad avere dei server, ma la fondazione che cura anche gli altri servizi e cioè la Wikipedia Foundation. Nel Gennaio 2005, la fondazione aveva raggiunto la quota di 39 server dedicati in Florida. Questa configurazione prevedeva un database server MySQL principale, diversi server database di replica, 21 server web Apache HTTP Server e soprattutto ben 7 Squid cache server.

Wikimedia attualmente si appoggia a cluster (insieme di computer connessi tra loro tramite rete) Linux – principalmente Ubuntu. Nel Dicembre del 2009 si è arrivati persino a 300 server in Florida e 44 ad Amsterdam. Il numero di server ha raggiunto la sua quota massima dal 2015, quando solo nel cluster principale se ne contavano 520.

Architettura di Wikipedia, Ottobre 2015. By Timo Tijhof, CC BY 4.0, https://commons.wikimedia.org/w/index.php?curid=44432612

Dal 2015, la fondazione inizia a sfruttare la tecnica del cache server. Questa prevede che le richieste delle voci da parte di utenti non registrati, non vengano inviate al cluster principale ma a dei server che contengono delle copie statiche delle pagine (Squid Cache). Essendo proprio le richieste da parte di utenti “ospiti” di Wikipedia quelle di numero maggiore, è ovvio che tali server gestiscono la maggior parte del traffico del sito. Questo permette di non coinvolgere e, soprattutto, sovraccaricare i server web ed SQL. Le richieste che le squid cache non possono soddisfare vengono inviate ai server dedicati al bilanciamento del carico che a loro volta inoltrano la richiesta ad uno dei web server di Apache. Su tali server avviene il rendering della pagina richiesta a partire dai dati presenti nel database.

Il Software

Agli albori dei tempi Wikipedia girava su UseModWiki, una piattaforma open source abbastanza primitiva. Questo sistema viene definito da Wikimedia come Fase I. 

Wikipedia nel 2001, su piattaforma UseModWiki.

Nel 2002, UseModWiki fu sostituito da un software wiki in PHP con database MySQL, progettato appositamente per l’enciclopedia online da Magnus Manske. Il software fu migliorato continuamente in risposta al crescente numero di visite e viene definito Fase II. Nel Luglio del 2002, Lee Daniel Crocker lo riscrisse dando vita al famoso CMS MediaWiki. Rilasciato sotto licenza GNU, è definito anche Fase III.

 

Fonti

Francesco Grecucci

Sono nato a Taranto e mi sono diplomato in Informatica e Telecomunicazioni. Ho questo blog dal 2016 e cerco sempre di migliorarlo, ogni giorno. Mi piacciono molto anche la musica, il vintage, le fotografie. Amo molto scrivere, non solo di informatica, ma anche di narrativa. 😉

Francesco Grecucci

Francesco Grecucci

Sono nato a Taranto e mi sono diplomato in Informatica e Telecomunicazioni. Ho questo blog dal 2016 e cerco sempre di migliorarlo, ogni giorno. Mi piacciono molto anche la musica, il vintage, le fotografie. Amo molto scrivere, non solo di informatica, ma anche di narrativa. ;)