· 7 min di lettura · Revisionato dal team editoriale di DNA Info Lab
Come interpretare i tuoi dati grezzi 23andMe
Se hai scaricato il tuo file DNA grezzo da 23andMe (o AncestryDNA, o MyHeritage — il principio è lo stesso), hai un file di testo semplice con circa 650.000 righe. Ogni riga è una posizione genetica che il chip ha misurato. La domanda naturale: cosa puoi farci?
Questa guida ripercorre tre modi per interpretare il tuo file — dal più semplice (cercare varianti specifiche a mano) al più utile (incrociarlo con la ricerca pubblicata). Più i limiti onesti.
Cosa c'è davvero nel file
Il file grezzo 23andMe è un testo separato da tab con quattro colonne:
rsid chromosome position genotype
rs4988235 2 136608646 AG
rs6025 1 169519049 TT
rs429358 19 45411941 CT- rsid — l'identificatore unico di una variante genetica in dbSNP (es. rs429358 = la variante APOE).
- chromosome — uno dei tuoi 23 cromosomi (1-22, X, Y, MT).
- position — la posizione esatta in coppie di basi su quel cromosoma.
- genotype — le due lettere che hai in quella posizione (una ereditata da ciascun genitore).
Tutto qui. Non è il tuo genoma completo — è un campione di ~650.000 posizioni su 3 miliardi (~0,02%). Ma queste posizioni sono scelte con cura per coprire la maggior parte delle varianti associate a malattie.
Metodo 1: cercare varianti specifiche a mano
Il modo più diretto è cercare rsid specifici di cui hai sentito parlare. Per ogni variante puoi controllare cosa significano le tue lettere in tre database:
- SNPedia — wiki di varianti rilevanti per consumatori con sommari in linguaggio semplice
- dbSNP — il database ufficiale NCBI con tutte le varianti note
- Catalogo GWAS — associazioni con malattie peer-reviewed con dimensioni dell'effetto
Varianti famose che la gente cerca
- rs429358 + rs7412 — insieme definiscono gli alleli APOE, il fattore di rischio genetico comune più forte per l'Alzheimer.
- rs6025 — Fattore V di Leiden, rischio di coagulazione del sangue.
- rs1801133 — variante MTHFR, metabolismo dei folati (controversa — vedi SNPedia).
- rs4988235 — LCT, tolleranza al lattosio.
- rs9939609 — FTO, associazione con l'obesità.
- rs1051730 — CHRNA3, dipendenza dalla nicotina.
- rs1815739 — ACTN3, il "gene dello sprint" (prestazioni sportive).
È informativo ma lento — puoi interpretare forse 5-10 varianti in una serata, e devi stare attento agli effetti specifici dell'ascendenza e a non sovrainterpretare singoli SNP.
Metodo 2: incrociare con database curati
Diversi strumenti prendono il tuo file completo e lo incrociano automaticamente con database curati e peer-reviewed. I tre che contano di più sono:
- Catalogo GWAS → punteggi di rischio poligenico. Somma i piccoli effetti di centinaia di varianti associate a tratti come diabete tipo 2, malattia cardiaca, Alzheimer, depressione.
- PharmGKB → farmacogenomica. Ti dice come il tuo genotipo può influire sulla risposta a farmaci come warfarin, statine, codeina, clopidogrel, SSRI, metformina e altri.
- ClinVar → varianti cliniche. Segnala le posizioni in cui porti una variante che i laboratori hanno classificato come patogenica o probabilmente patogenica per una condizione specifica.
Questo è ciò che fa il nostro servizio. Carica il tuo file grezzo (zippato o estratto) e ricevi un rapporto strutturato che copre 11 categorie di tratti con fonti peer-reviewed e spiegazioni in linguaggio semplice. Gratis, in 30 secondi.
Metodo 3: sequenziamento del genoma intero
Se vuoi ogni posizione del tuo genoma, i test basati su microarray non bastano. I servizi di sequenziamento del genoma intero (Nebula, Dante Labs, Sequencing.com e altri) consegnano il quadro completo per qualche centinaio di euro. Per la maggior parte delle domande di consumo, però, i dati microarray di 23andMe o AncestryDNA sono più che sufficienti — hai davvero bisogno del WGS solo se stai investigando varianti rare nella tua famiglia.
Le grandi avvertenze
Prima di andare a caccia di varianti, tre cose da tenere a mente:
- La maggior parte degli studi è sbilanciata verso l'ascendenza europea. ~90% dei partecipanti GWAS è di discendenza europea. I moltiplicatori di rischio che leggi potrebbero non applicarsi a te con la stessa entità.
- Una singola variante raramente significa molto. Anche varianti forti come APOE ε4 modulano il rischio solo di 3-12×. La maggior parte del rischio di malattia è poligenico — centinaia di piccoli effetti sommati.
- Questo non è un parere medico. I tuoi dati grezzi sono un punto di partenza per una conversazione con un medico, non una diagnosi. Qualsiasi cosa sembri allarmante merita un seguito clinico, non panico.
Farlo nel modo facile
La ricerca manuale insegna molto ma porta via ore. Se vuoi solo la risposta, carica il tuo file grezzo nel nostro strumento gratuito — lo incrociamo con il Catalogo GWAS (~60.000 varianti), PharmGKB e ClinVar, e poi spieghiamo ogni risultato in linguaggio semplice. Equivalente a diverse ore di ricerca manuale, in meno di un minuto.
Domande frequenti
Posso aprire il mio file grezzo di 23andMe in Excel?▼
Tecnicamente sì — è un file di testo separato da tab. Ma Excel si inceppa con le ~650.000 righe su macchine vecchie e può auto-formattare le colonne (convertendo rsid che iniziano con un numero in date, per esempio). Per uno sguardo veloce va bene; per analizzare usa un editor di testo come VS Code o uno script.
È sicuro caricare i miei dati DNA grezzi online?▼
Dipende dal servizio. Leggi la sua privacy policy prima di caricare qualcosa. Noi elaboriamo i file in Europa (Germania), non vendiamo né condividiamo mai i tuoi dati, e puoi esportarli o cancellarli in qualsiasi momento dalla pagina account. Se un servizio non sa rispondere "che fine fanno i miei dati" in una frase, non caricare lì.
Qual è la differenza tra rs429358 e rs7412?▼
Entrambi sono posizioni nel gene APOE. Insieme definiscono gli alleli ε2 / ε3 / ε4. Servono entrambi per interpretare il tuo stato APOE — rs429358 da solo è ambiguo perché può significare ε3 o ε4 a seconda di cosa c'è in rs7412. Qualsiasi strumento decente li combina automaticamente.
Come faccio a sapere quale versione del chip ha usato 23andMe per il mio campione?▼
Guarda i commenti in cima al tuo file grezzo — 23andMe scrive lì la versione (es. "v5" o "GSA-MD"). I chip più recenti includono più varianti medicamente rilevanti e marcatori farmacogenomici. Gli strumenti di interpretazione funzionano con qualsiasi versione.
Il mio rapporto sarà diverso se uso dati AncestryDNA o MyHeritage?▼
Leggermente diverso ma molto simile. 23andMe copre più varianti farmacogenomiche e ClinVar; AncestryDNA copre più marcatori informativi sull'ancestralità. Per i punteggi di rischio poligenico la sovrapposizione tra i due è sufficiente perché i punteggi siano praticamente identici. Rileviamo il formato automaticamente e ci adattiamo.
Letture correlate
- 23andMe vs AncestryDNA: quale file grezzo è migliore? → — confronto provider per provider.
- Punteggi di rischio poligenico (PRS) per non scienziati → — come funziona davvero il Metodo 2.
- APOE e rs429358: il gene dell'Alzheimer spiegato → — approfondimento su una delle varianti famose.
Interpreta il tuo file grezzo automaticamente
Carica il tuo file 23andMe, AncestryDNA o MyHeritage (zippato o estratto) e ottieni un rapporto genetico strutturato in pochi minuti. Gratis, privato, senza bisogno di kit.
Analizza il mio DNA →Questo articolo ha scopo esclusivamente educativo e non costituisce un parere medico, una diagnosi o un trattamento. Consulta sempre un professionista sanitario per decisioni sulla tua salute.