Negli assistant generativi, l’attribuzione delle fonti nelle risposte degli assistenti resta il tallone d’Achille. Il nuovo studio EBU guidato dalla BBC rileva che il 45% delle risposte contiene problemi significativi (31% criticità di sourcing; 20% inesattezze), con Gemini peggiore al 76% di risposte problematiche, indipendentemente da lingua o paese. Un’analisi accademica su ScienceDirect, focalizzata su Copilot durante le elezioni di Taiwan 2024, conferma misattribuzioni e un forte sbilanciamento verso fonti UK/US, con marginalizzazione delle prospettive locali. In questo articolo sintetizziamo i dati, spieghiamo perché la distorsione incide su fiducia e partecipazione democratica, e proponiamo un set di metriche operative e requisiti tecnici per migliorare trasparenza delle citazioni nelle piattaforme AI e l’accuratezza delle notizie generate da modelli linguistici.
Tassi di distorsione: errori di attribuzione, inesattezze e differenze tra modelli
Lo studio EBU/BBC (3.000 risposte valutate per ChatGPT, Copilot, Gemini e Perplexity) rileva: 45% risposte con problemi; 31% criticità di sourcing (citazioni mancanti/errate); 20% inesattezze; Gemini peggiore (76% di risposte con issue), trainato da scarsa trasparenza di fonte. Nel paper su Telecommunications Policy (caso Copilot, 5 lingue), il 62,9% delle affermazioni usate in sinossi è corretto e correttamente attribuito; tuttavia, il 20,4% degli errori deriva da mis-summarization del contenuto di testate professionali (misinformation introdotta dal modello) e sono rilevate misattribuzioni e link rotti. Implicazione: l’accuratezza delle notizie generate da modelli linguistici non è ancora affidabile per un consumo “a prova di clic”, specie in contesti sensibili (elezioni, crisi). Fonti: EBU/BBC; ScienceDirect.
Bias linguistico: prevalenza di fonti in inglese e marginalizzazione delle prospettive locali
L’audit su Copilot mostra un bias sistemico: predominio di fonti UK/US in tutte le lingue (eccezione: tedesco), forte uso di Wikipedia in cinese (tradizionale e semplificato), e per le query in svedese un ricorso prevalente a fonti in inglese nonostante la disponibilità di news locali. In tradizionale cinese cresce la quota di fonti taiwanesi, ma resta alta la dipendenza da BBC Chinese e testate anglofone. Questo “anglocentrismo strutturale” restringe la pluralità informativa e può offuscare prospettive regionali, con rischi per la qualità del dibattito e la rappresentanza delle minoranze linguistiche. Come rileva EBU, la distorsione indebolisce la fiducia e scoraggia la partecipazione democratica, specie tra i più giovani che già usano assistant come gateway informativo.
Requisiti tecnici e governance: citazioni cliccabili, AI Act UE e KPI operativi
Per alzare lo standard, servono: citazioni cliccabili obbligatorie nei passaggi assertivi, time-stamp su fonti e risposte, versioning delle sinossi, enforcement delle citazioni (blocco output se i link mancano), retrieval da fonti licenziate/affidabili (RAG), fallback a non-risposta quando l’evidenza è insufficiente. Sul fronte normativo, DSA richiede risk assessment sulle “rischiosità sistemiche” (elezioni), mentre l’AI Act impone trasparenza, documentazione tecnica e rispetto del copyright; EBU sollecita audit indipendenti e monitoraggio continuo. Proponiamo KPI replicabili: Attribution Accuracy Rate = affermazioni correttamente attribuite/affermazioni con citazione; Source Diversity Index per lingua/area; Update Latency (gap temporale fonte→risposta); Hallucination Rate; Citation Enforcement Rate; Coverage per lingua/mercato. Soglie-obiettivo realistiche: AAR ≥ 90%, HR ≤ 1%, UL ≤ 15 minuti in breaking news.
Quick Takeaways
- 45% delle risposte degli assistant presenta problemi; Gemini peggiore (76%).
- Copilot: 62,9% corretto+attribuito; 20,4% errori da mis-summarization di testate professionali.
- Bias linguistico: prevalenza UK/US e inglese anche in ricerche non anglofone; Wikipedia molto usata in cinese.
- Priorità: citazioni cliccabili, time-stamp, RAG su fonti licenziate, audit indipendenti, KPI pubblici.
Conclusione
L’AI nelle redazioni non è più opzionale, ma la qualità del news sourcing degli assistant resta fragile. Per tutelare fiducia e pluralismo servono standard tecnici rigorosi (citazioni verificabili, time-stamp, versioning), governance e auditing continui in linea con AI Act/DSA, e metriche trasparenti pubblicate con cadenza regolare. Editor e policy maker possono accelerare: adottando il toolkit EBU, negoziando licensing chiari, pubblicando policy di disclosure e segnali strutturati (schema.org, byline, note di correzione). Team di prodotto e modelli devono implementare retrieval da fonti affidabili, enforcement delle citazioni e fallback alla non-risposta quando i dati non reggono. La posta in gioco è la qualità del discorso pubblico.
FAQ
-
Che differenza c’è tra misattribuzione e mis-summary?
Misattribuzione: la fonte citata non contiene l’informazione. Mis-summary: il modello riassume in modo errato una fonte corretta, introducendo misinformation. -
Come misurare l’attribuzione delle fonti nelle risposte degli assistenti?
Usa l’Attribution Accuracy Rate: affermazioni correttamente attribuite diviso affermazioni con citazione. Pubblica il valore per lingua, tema e modello. -
Cosa richiede l’AI Act UE per gli assistant news?
Trasparenza d’uso AI, documentazione tecnica, sintesi dei dati di training e conformità IP; insieme al DSA, risk assessment, mitigazioni e audit sulle rischiosità sistemiche (es. integrità elettorale).
Fonti chiave: EBU/BBC – “Largest study…” (22/10/2025); ScienceDirect – “Sourcing behavior…” (Telecommunications Policy, 06/2025); IBM Think – “How is AI being used in journalism?”.
Scopri la consulenza →

