Diritto alla conoscenza Disinformazione Intelligenza Artificiale

METAstasiVERSO vs POLIVERSO: ecco come l’informazione italiana ha ignorato il più grande sversamento di rifiuti compiuto da Facebook nel Web

La schermata dei crawler di Meta

Poliverso.org è il sito che abbiamo creato nell’estate del 2021 e contiene un social network piccolo fatto da poche centinaia di persone che ogni mese accedono al proprio profilo, ma integrato con il grande universo social costituito dal Fediverso che conta qualche milione di utenti in tutto il mondo.

Questo post verrà pubblicato anche sulla comunità Lemmy @[email protected]

Se qualcuno se lo stesse chiedendo, no: il nome Poliverso non vuole affatto richiamare il “metaverso” di Meta, che all’epoca neanche esisteva e che, per chi se lo fosse dimenticato, era il progetto che Meta lanciò quasi 3 mesi dopo, ossia il 18 ottobre di quell’anno, per “rivoluzionare il web” (=spacciare una Second Life opportunamente ruminata per essere più conformista e ancora più commerciale).

Poliverso è oggi la seconda istanza Friendica al mondo (ad agosto siamo anche stati temporaneamente primi…), l’iscrizione è davvero gratuita, nel senso che non offriamo spazio in cambio di dati personali, come fanno i social commerciali, né per veicolare pubblicità generalista ai nostri utenti, ma solo per far provare al pubblico italiano un’alternativa ai social commerciali e, in particolare, a Facebook.

Friendica infatti, a differenza del ben più famoso (e ricco) Mastodon con cui pure è perfettamente interconnessa e che ricalca la logica di Twitter (brevi messaggi, timeline sequenziale, niente formattazione), consente la scrittura di post lunghi e ricchi di formattazione, presenta una timeline legata alle conversazioni e non solo cronologica oltre a tante altre peculiarità (calendario eventi, lettore RSS, post programmati, cerchie di amici differenziate per tipologia, etc).

Il nostro server presenta costi vivi piuttosto contenuti, pari a una trentina di euro al mese ma al momento si mantiene per il 75% con l’autofinanziamento degli amministratori e per il restante 25% grazie alle donazioni degli utenti (a proposito, se volete aiutarci, potete farlo qui).

Ovviamente il “modello di sostenibilità” di Poliverso è delicato (ne parleremo in un prossimo post) e per renderlo il più stabile possibile, abbiamo cercato di manutenerlo con cura e responsabilità che si riflettono in una moderazione accurata per evitare gli abusi e l’iscrizione di bot, una pubblicità molto contenuta, potremmo chiamarla una disincentività, per evitare un numero eccessivo di iscrizioni e, soprattutto, un’attenta gestione delle risorse hardware che abbiamo ottenuto grazie al supporto volontario della figura chiave del progetto: il sistemista coamministratore anonimo che chiameremo Dr. Polivers*. Grazie a lui, Poliverso.org e la sua sorellina Poliversity.it (un’istanza mastodon dedicata a giornalismo e università) sono stati ospitati in un server dedicato e le prestazioni del 2024 sono migliorate sensibilmente.

Purtroppo da fine agosto abbiamo iniziato ad avere alcuni problemi di tenuta: il server si piantava con cadenza quasi giornaliera a causa di un sovraccarico di traffico e doveva essere riavviato manualmente. All’inizio abbiamo pensato che il problema potesse essere dovuto all’installazione a fine agosto della nuova release 2024.08 di Friendica, rilasciata da @heluecht ossia Michael Vogel e che apporta modifiche molto importanti al DB; in seguito abbiamo pensato che il problema potesse essere causato dagli stress-test che, proprio a fine agosto, avevamo iniziato a fare su Raccoon for Friendica, una nuova app per Friendica sviluppata da @dieguitux8623 e sulla quale abbiamo scritto un post.

Non escludiamo che queste cause possano aver avuto un ruolo, ma probabilmente il problema era un altro, ossia il METAstasiVERSO, ossia quella parte di universo raggiunta dalle mutazioni contaminanti che la holding di Facebook ha determinato sul Web e su Internet.

Christo cammina sulle acque del lago
Il primo pensiaero che abbiamo avuto, quando ci siamo accorti dei crawler di Meta

Il Metastasiverso e la spazzatura IA

Non riuscendo a spiegare questi blocchi e alcuni picchi di traffico che non potevano essere dovuti né a problemi di DB, né a imprevisti accessi DDoS dell’app, Dr. Polivers* ha iniziato a osservare i log di accesso al sistema e ha notato un picco di accessi da parte di crowler provenienti da Facebook.

Il log di Poliverso mostra i crawler di Meta

Dopo un paio di googlate, si è reso conto che il problema era riconducibile a questa porcheria:

Si tratta di un progetto di scandaglio del web avviato -appunto- a fine agosto e finalizzato fondamentalmente ad alimentare l’intelligenza artificiale di Meta. Con tutta la potenza di fuoco di cui Meta può disporre a seguito di un controllo ventennale sul traffico del Web, ecco inondare il Web con le sue “sentinelle”

Una "sentinella", dal film Matrix
Come noi immaginiamo i crawler di Meta

“Meta utilizza crawler web (software che recuperano contenuti da siti web o app web) per diversi scopi. Questa pagina elenca le stringhe User Agent (UA) che identificano i crawler web di Meta più comuni e per cosa vengono impiegati. Questa pagina fornisce anche indicazioni su come configurare il file robots.txt in modo che i nostri crawler interagiscano correttamente con il tuo si”

A cosa servono questi Crawler?

Lo scopo principale di FacebookExternalHit è scansionare i contenuti di un’app o di un sito web condivisi su una delle app di Meta, come Facebook, Instagram o Messenger. Il link potrebbe essere stato condiviso con il copia e incolla oppure usando il plug-in social di Facebook. Questo crawler raccoglie, memorizza nella cache e visualizza le informazioni sull’app o sul sito web come il titolo, la descrizione e l’immagine in miniatura.

E ancora:

Meta-ExternalFetcher

Il crawler Meta-ExternalFetcher esegue recuperi iniziati dall’utente di singoli link per supportare specifiche funzioni del prodotto. Poiché il recupero viene iniziato da un utente, questo crawler può bypassare le regole del file robots.txt.

E infine:

Il crawler FacebookExternalHit può bypassare robots.txt quando esegue controlli di sicurezza o integrità, come la verifica della presenza di malware o contenuti dannosi.

In pratica, siccome Meta ha sguinzagliato le sue sentinelle per tutto il web, questo traffico ci stava soffocando il server.

Alla fine il nostro Dr. Polivers* ha sistemato la situazione, bloccando l’accesso.

Neo blocca una sentinella con la sola imposizione delle mani. Da uno dei primi due inutili sequel di Matrix
Dr. Polivers* prova a bloccare i crawler di Meta

Purtroppo dovremmo monitorare con continuità, in quanto questi indirizzi IP cambiano spesso.

Si tratta di un problema gravissimo, paragonabile nella realtà al lancio di migliaia di tonnellate di volantini sulle città di tutto il mondo, con tutti i danni che ne conseguirebbero, e siamo certi che questo problema sta riguardando diversi siti e servizi web e che in molti non se ne siano accorti.

Ma perché siamo convinti che in molti non se ne siano accorti?

Il silenzio della stampa italiana sul METAstasiVERSO

Come molti di voi sapranno, il blog Informapirata ha un’estensione significativa nei suoi tre principali account di informazione: il canale Telegram, l’account Mastodon @informapirata e l’account Twitter.

L’attività più apprezzata da chi segue i nostri account è la nostra capacità di riportare notizie legate più o meno al mondo dell’informatica provenienti dalla stampa estera, anglosassone soprattutto, ma anche tedesca e francese, che spesso non compaiono sulla stampa nostrana se non a distanza di giorni e, a dire il vero, spesso sotto forma di traduzioni malfatte.

Non è un caso che ormai le nostre fonti italiane si limitano soprattutto a quelle testate come Il Post e Wired Italia, oltre che a una manciata di siti di informazione indipendente come IRPI Media o Slow News e ad alcune singole firme di qualità che scrivono su testate che non sempre brillano per accuratezza, attendibilità e onestà mentale.

Oltre a queste fonti abbiamo la fortuna di attingere a una comunità eterogenea che va dai più affezionati utenti del gruppo telegram Comunicazione Pirata, alle comunità di Feddit.it, l’istanza Lemmy che abbiamo creato con @lealternative per offrire un’alternativa libera a Reddit e, in generale, a tutti i social che frequentiamo, i cui utenti spesso ci segnalano qualcosa di interessante che ci era sfuggito.

Eppure, malgrado questo flusso non comune di informazione cui siamo soggetti, non abbiamo saputo nulla di questa caccia al contenuto avviata da Meta. Perché?

Abbiamo quindi provato a esplorare con Google la copertura mediatica data a questa importante notizia e abbiamo effettivamente notato che la stampa internazionale ne aveva dato una certa risonanza (link alla pagina Google):

La schermata che mostra l’adeguata copertura internazionale sulla notizia

Ok, colpa nostra: questo ci era sfuggito e ci scusiamo con i nostri lettori per la disattenzione.

Ieri, abbiamo notato anche un post comparso su Mastodon in cui @admin ossia Gerald Lerman, amministratore di sistema dell’istanza hear-me.social si chiedeva come mai Facebook e i suoi Meta bot stessero colpendo la pagina di iscrizione della sua istanza mastodon una o due volte ogni ora; in risposta, @paul ossia Paul Chamber, amministratore dell’istanza Mastodon oldfriends.live, rispondeva segnalando il link della pagina Developers di Facebook

Nel non dare opportuna copertura alla questione non siamo stati però soli. Ecco la copertura italiana alla notizia (link a Google):

Copertura dei media italiani (schermata da Google)

Praticamente zero informazioni dai media italiani.

Un po’ così, come i media italiani

Non si capisce se le redazioni dedicate a Meta erano troppo impegnate a spiegare agli utenti italiani come attivare su Threads la federazione con il Fediverso, traducendo -male- i comunicati stampa che la camarilla di Menlo Park si preoccupa di recapitare alle redazioni, senza però rivelare il trascurabile dettaglio per cui gli utenti europei e quindi anche quelli italiani, non possono attivare il Fediverso.

Ma i comunicati stampa di Meta arrivano così alle redazioni italiane?

Dov’è oggi il problema principale

Il problema più grave è che, anche assumendo la buona fede dell’informazione italiana e anche assumendo che l’omissione sia avvenuta per errore o per una valutazione sbagliata dell’importanza della notizia, siamo certi che l’informazione italiana non farà alcuna retromarcia e, semplicemente, continuerà a non parlare di una notizia ormai vecchia più di quaranta giorni.

Noi però crediamo che sia importante diffondere l’informazione di questa piaga e invitare non solo i webmaster professionisti (che solitamente sono piuttosto informati), ma quelli che si dilettano con il proprio blog autoospitato o gli amministratori di istanza del Fediverso che spesso non sono webmaster o qualunque soggetto interessato. In particolare, gli amministratori di un social devono gestire spesso decine di migliaia di pagine potenziali, almeno una per ogni utente e una per ogni thread e questo aumenta drasticamente la superficie di attacco!

Al momento noi abbiamo risolto il nostro problema con Poliverso, almeno temporaneamente, ma il problema è globale. Poliverso è un piccolo simbolo di una realtà circoscritta, autofinanziata e fragile di fronte a un gigante che, come una METAstasi, sembra spuntare all’improvviso per infestare il web libero con le sue pericolose mutazioni. Tutte le realtà piccole come Poliverso hanno pochi strumenti di difesa, ma per esercitarli hanno bisogno di essere informate.

Preghiamo perciò tutti i nostri lettori di aiutarci in questa impresa!

Forse l’ho già detto, ma se volete aiutarci, potete farlo qui!

Vuoi segnalare un errore o dare un suggerimento? Scrivici su FriendicaTwitterMastodon o sul gruppo telegram Comunicazione Pirata

7 comments on “METAstasiVERSO vs POLIVERSO: ecco come l’informazione italiana ha ignorato il più grande sversamento di rifiuti compiuto da Facebook nel Web

  1. @nicolaottomano mi astengo sul terzo sequel solo perché non l’ho mai guardato… 😁

    @informapirata @lealternative @informapirata @dieguitux8623

  2. @[email protected]

    #Metastasiverso come definizione di quello che stanno facendo (ovvero rubando) le big tech con l'AI, mi pare semplicemente perfetta

    @fediverso @heluecht @dieguitux8623 @[email protected] @lealternative @admin @paul

  3. @informapirata Non ho mai pensato di associare Meta al termine metastasi. Se non vi dispiace rubo l’idea 😁

    @heluecht @informapirata @lealternative @paul @admin @dieguitux8623

  4. @[email protected] @fediverso @informapirata

    Caspita.
    E pensare che Meta rompe tanto le palle su 'ste cose… che scraping dai loro siti non si deve fare per ToS, che se lo fai ti ratelimitano pesantemente, a tal punto che succede che ti bloccano anche se vedi troppa roba in giro da un normale browser senza un account loggato… però poi loro sono i primi.

Comments are closed.