Genetisk data
FinnGens ThermoFisher Axiom-anpassade chiparray (v2) innehåller 723 376 sonduppsättningar för 664 510 genetiska markörer. Förutom de centrala GWAS-markörerna (cirka 500 000) innehåller chipet cirka 116 000 kodningsvarianter som är berikade i Finland, >10 000 specifika markörer för HLA/KIR-regionen, nästan 15 000 ClinVar-variationer, cirka 4 600 farmakogenomiska varianter och 57 000 utvalda markörer som var av särskilt intresse för partner. Ungefär 121 000 unika prover genotypades med v1 av det anpassade chipmatriset och 328 000 med v2 av det anpassade matriset. Från v2 av matriset togs icke-funktionella sonduppsättningar bort och nya anpassade sonduppsättningar, inklusive mitokondriella, Y-kromosomala samt markörer av särskilt intresse för partner, tillades.
Innehållet av markörer i FinnGens ThermoFisher Axiom anpassade array v2 (aktuella versionen) kan laddas ner här. Innehållet för v1 (657 675 markörer) är nedladdningsbart här.
FinnGen har utnyttjat vad som kallas "äldre genotyper", vilket hänvisar till chipgenotyper som genererats från biobanksproverna innan FinnGen initierades. Dessa prover genotypades över tid med hjälp av olika generationer av Illumina GWAS-matris, främst hämtade från Institutet för hälsa och välfärd (länk till THL biobank).
För att öka nyttan av både den anpassade chipen och äldre genotyper genomförde FinnGen imputation på alla prover med hjälp av en referensdatamängd härledd från finländska helgenomsekvenser, som omfattar cirka 8700 individer. Denna process resulterade i en underförstådd genomsekvens, vilket möjliggör analys av en omfattande uppsättning av cirka 21 miljoner varianter per individ. På grund av Finlands distinkta populationsstruktur är imputationsnoggrannheten märkbart högre och omfattar varianter som är relativt sällsynta, inklusive många sjukdomsmutationer specifika för det finska arvet, till skillnad från imputation i populationer som är genetiskt mer varierade.
Dessutom inkluderar FinnGen-studiekohorten exomsekvenseringsvarianter från cirka 25 000 och genomsekvenseringsvarianter från ungefär 6 000 prover från FinnGen-försökspersoner. Dessa dataset berikar ytterligare de genetiska resurserna som finns tillgängliga för FinnGen-studien och har huvudsakligen införskaffats genom THL biobank.