Els articles que es publiquen al web poden contenir enllaços que busquen donar crèdit a la informació. En la majoria dels casos, una agència de notícies o una plataforma de verificació d’informació afegirà el major nombre d’enllaços a fi de donar més credibilitat a la publicació. Però què passa quan els links estan trencats i no brinden més dades que les que ofereix el periodista en un primer pla de la notícia? La credibilitat queda en dubte, almenys, per a diversos experts reunits a la Winter School, organitzada per la Digital Methods Initiative (DMI) i que va tenir lloc a la Universitat d’Amsterdam el passat gener.
Quan es trenca l’enllaç que ens vincula aquella informació a comptes de Facebook, Twitter o altres mitjans, significa que no s’han arxivat correctament, un fenomen conegut com a pèrdua de memòria (el memory loss) de la informació digital i, en particular, de les petjades de la desinformació després de la publicació de revisions. Alguns dels 230 professionals, entre acadèmics investigadors, enginyers, dissenyadors, informàtics, estudiants de doctorat i periodistes, s’han dedicat precisament a investigar el memory loss durant cinc dies, nou hores per dia i milers de dades.
El punt de partida de la recerca ha estat comprovar si els llocs que són arxivats, són arxivats correctament o també estan perduts; és a dir, analitzar el que es perd del que es publica. A través de la llista d’articles de fact checking sobre la guerra a Ucraïna creat per l’EDMO (European Digital Mitjana Observatory) han estudiat com les diferents agències europees de verificació arxiven els enllaços que serveixen d’evidència per justificar la perfecció d’una revisió.
Projecte Vera
Precisament, a Europa hi ha més preocupació que mai sobre aquest tema. La prova és el projecte europeu Vera.ai, una iniciativa de recerca i desenvolupament, finançat per la UE, centrat en l’ús de la intel·ligència artificial en la lluita contra la desinformació. En un sondeig realitzat per Vera, els usuaris i una majoria d’autenticadors van citar la detecció de desinformació i l’arxiu de les petjades, com dues de les seves prioritats. Per aquest motiu, es va iniciar aquest projecte a Amsterdam amb la voluntat final d’avaluar l’abast del problema i començar a pensar en possibles solucions.
El periodista Denis Teyssou, responsable de MediaLab a l’Agència France Presse (AFP) i responsable de la innovació del projecte Vera, assegura que “les plataformes, moltes vegades no permeten als arxivadors recuperar aquests enllaços i recuperar les imatges, els vídeos”. D’aquí sorgeix la necessitat d’avaluar i cartografiar per saber com estan desapareixent alguns continguts “llevats per les plataformes després que els propis usuaris ho pugin a la xarxa”. Sota la tutela del periodista francès, han treballat una desena d’experts amb una anàlisi de gairebé 2.000 enllaços i un sondeig sobre una mostra aleatòria de 100 enllaços d’arxiu d’Archive.today i Perma.cc, (els principals serveis d’arxiu juntament amb Web.archive). A tenir en compte que un mètode secundari en tots els serveis són les captures de pantalla.
Segons Ángeles Briones, dissenyadora i experta en dades, l’objectiu és que “detectant aquestes pràctiques podem formular alguns suggeriments a les agències de fact checking sobre com millorar el seu treball per tal d’arxivar correctament els enllaços que serveixen per fer verificacions”. Una setmana de treball no ha estat suficient per “mapejar” completament la manera en què s’arxiven els enllaços per al fact checking i respondre a la pregunta sobre quins són totes les pràctiques de memory loss. No obstant això, Briones assegura que ha servit perquè “hem trobat moltes limitacions per processar els enllaços i entendre’ls completament”; en aquest sentit, el treball de la setmana és “un punt de partida per a dissenyar noves estratègies i futures recerques”.
Proporció d’enllaços trencats
El grup ha comprovat fets relacionats amb la guerra d’Ucraïna des que va començar al febrer de 2022 fins a gener de 2023, i ha analitzat una altra mostra de 100 comprovacions, per comprovar una a una les “aparences (petjades de desinformació) i les evidències (proves de desinformació)” dels enllaços dels serveis d’arxiu.
Dins de la primera mostra, el 55% estan correctament arxivats, mentre que el 43% presenten errors d’arxiu importants. Els errors d’arxiu solen venir per elements multimèdia no reproduïbles, restriccions d’accés en les plataformes i limitació de les captures de pantalla. Una altra de les conclusions és que Archive.today genera més errors d’arxiu que Perma.cc, i que el procés d’automatització per explorar un gran nombre de llocs o, fins i tot, arxius és limitat, ja que els llocs web més populars estan equipats amb tecnologies anti-bots/anti-DDOS com ReCaptcha o Cloudflare Browser Check.
Els rastrejadors no obtenen necessàriament els mateixos resultats que l’usuari en visitar la mateixa pàgina web, ni que sigui un navegador popular com Google Chrome. Els errors, els murs de pagament i les restriccions d’accés no utilitzen protocols unificats, per la qual cosa l’automatització és limitada i és necessari resoldre el problema cas per cas per tal d’identificar-los. Per exemple, Facebook té diversos missatges d’error: “està temporalment bloquejat”, “iniciï sessió en Facebook”, etc.
Doble cara de la notícia
A manera de resum, la bona notícia és que el gran percentatge de la informació ha estat arxivada, per tant, s’hi pot fer referència i pot ser estudiada. No obstant això, hi ha motius per a la preocupació i la ràpida reacció dels organismes. Kalina Bontcheva de la Universitat de Sheffield, es mostra preocupada perquè el 15% de tota la desinformació arxivada (en tot el conjunt de dades) no ho ha estat amb èxit, amb la qual cosa, “no s’està preservant la metadata, malgrat els periodistes i els mitjans de comunicació donin per fet que s’ha preservat”.
El grup d’experts d’Amsterdam s’ha centrat, sobretot, en els verificadors de fets i ha analitzat en quins aspectes es queda curta la tecnologia actual d’arxiu. Encara que les conclusions de l’estudi no tinguin “un impacte directe en els ciutadans”, asseguren que és important en tant que, si sabem que els arxius no estan funcionant correctament, llavors el consumidor pot dubtar sobre si aquesta desinformació desapareguda de la plataforma ha existit o no.
Repensar nous mètodes
En definitiva, saber com succeeix el memory loss permet donar suggeriments per a qui faci fact checking, permet ajudar a saber com preservar l’evidència. En paraules de Briones, això és fonamental si entenem la rellevància que té el fact checking en un món on estem envoltats de desinformació.
La idea és que el següent pas sigui intentar millorar la tecnologia d’arxivat per resoldre alguns dels problemes existents. D’aquesta manera, el ciutadà podrà trobar comprovacions de fets realitzats per verificadors i periodistes que tracten de preservar la desinformació arxivant-la correctament, en cas que desaparegui de la xarxa.
És en aquest context que, dins del projecte IVERES, s’inclou tot un capítol encaminat a les tasques d’arxiu en l’entorn d’una redacció especialitzada en verificació, com és el cas de VerificaRTVE. El desenvolupament d’aquest sistema d’arxiu s’està fent en col·laboració amb investigadors de la Universitat Carlos III, dins del context de la càtedra RTVE-UC3.
RTVE està treballant per dur a terme el projecte IVERES liderat per l’ens públic juntament amb la Universitat Autònoma de Barcelona i finançat pel Ministeri de Ciència i Innovació dins del programa estatal de R+D+I orientada als reptes de la societat en el marc del pla de recerca científica i tècnica i d’innovació 2017-2020 amb fons Next Generation EU.
Text: Montserrat Rigall, periodista de RTVE Catalunya.