Il microbiota .3

Campioni di feci

A tutti i partecipanti è stato chiesto di donare un campione di feci. A coloro che erano disposti a farlo sono state date istruzioni e attrezzature per raccogliere un campione di feci a casa, quindi inviarlo durante la notte tra lunedì e giovedì al personale dello studio utilizzando pacchi postali prepagati nelle tipiche condizioni invernali finlandesi. I campioni sono stati raccolti in provette Falcon da 50 ml senza soluzione stabilizzante. Le provette sono state preidentificate con i rispettivi ID dello studio dei partecipanti e congelate immediatamente dopo la ricezione. I campioni sono stati conservati non scongelati a -20°C fino al sequenziamento.

I dati metagenomici erano basati sul sequenziamento shotgun dell’intero genoma, non mirato e superficiale, analizzato presso l’Università della California, San Diego, California. I campioni sono stati normalizzati a 5-ng di input utilizzando un robot acustico di manipolazione dei liquidi Echo 550 e sono stati sequenziati utilizzando Illumina Hi-Seq 4000 (Illumina Inc., San Diego, CA, USA) per paired-end 150-bp legge. Il conteggio medio è stato di circa 900.000 letture per campione. Una descrizione più dettagliata dei protocolli per l’estrazione del DNA e la preparazione biblioteca è stato riportato altrove. Classificazione e assegnazione dei dati di sequenza grezzi in taxa microbici sono stati eseguiti utilizzando SHallow shOtGUN profiler (SHOGUN) v1.0. 5 (Knights Lab, University of Minnesota, Minneapolis, MN, USA) (39) contro un database di genomi completi arcaici, batterici e virali in NCBI Reference Sequence Database (NCBI RefSeq) v82 [National Center for Biotechnology Information (NCBI), U.S. National Library of Medicine, Bethesda, MD, USA; 8 maggio 2017]. I dati microbici classificati sono stati utilizzati nel modulo dei dati di composizione. Le variabili di lotto non sono state prese in considerazione nelle analisi.

Nelle analisi per taxa, i taxa sono stati filtrati fino a un microbiota di base che comprendeva qualsiasi genere con un’abbondanza minima dello 0,1% e una prevalenza di almeno l’1% in tutti i campioni, simile alle soglie di filtraggio utilizzate da Salosensaari et al.. Le specie batteriche con il potenziale di produrre SCFA sono state identificate sulla base di una revisione della letteratura corrente. Le specie classificate e presenti nei campioni sono state selezionate per le analisi per-taxa a livello di specie. Queste specie erano Akkermansia muciniphila, Faecalibacterium prausnitzii e Roseburia intestinalis.

Metodi statistici

La diversità alfa è una misura che quantifica la diversità intra-individuale del microbiota e agisce come un indicatore approssimativo della ricchezza complessiva delle specie di un singolo individuo. La diversità beta quantifica la diversità interindividuale e fornisce informazioni sulle differenze di microbiota tra gli individui, agendo così come una misura della composizione. In questo studio, abbiamo quantificato la diversità alfa usando l’indice di Shannon e la diversità beta usando i punteggi di dissimilarità di Bray-Curtis. Tutte le analisi sono state aggiustate per età, sesso, BMI, fumo e uso di farmaci potenzialmente in grado di alterare il microbiota. Gli effetti di interazione del punteggio HFC con il sesso e l’età non erano statisticamente significativi e quindi sono stati esclusi dalle analisi finali.

Abbiamo valutato le associazioni tra diversità alfa e dieta usando la regressione lineare. L’analisi delle coordinate principali (PCA), l’analisi multivariata permutazionale della varianza (PERMANOVA), l’analisi della ridondanza basata sulla distanza (dbRDA) e l’analisi delle somiglianze (ANOSIM) sono state utilizzate per analizzare la diversità beta. La PCA, insieme all’ANOSIM, è stata usata per valutare il raggruppamento dei campioni; la PERMANOVA è stata usata per valutare la quantità di varianza che ogni variabile può spiegare nelle distanze tra i campioni; e infine la dbRDA è stata usata per scoprire la direzione che ciascuna di quelle variabili prende per quella varianza. Una dbRDA si distingue da una PCA in quanto è un metodo di ordinamento vincolato che visualizza e spiega la variazione in un insieme di variabili di risposta che sono vincolate da un insieme di variabili predittive, collegando efficacemente l’analisi di regressione multivariata e la PCA (46). La varianza vincolata in un dbRDA è la porzione di varianza totale nell’insieme delle variabili di risposta (le distanze Bray-Curtis dei campioni in questo caso) che può essere spiegata dall’insieme fornito di variabili predittive.

PERMANOVA, dbRDA e ANOSIM sono stati tutti eseguiti con 999 permutazioni. Per le analisi per taxa, è stato utilizzato uno strumento di analisi chiamato MaAsLin (associazione multivariata con modelli lineari) (48). Abbiamo usato lo strumento per eseguire una serie di modelli di regressione lineare multivariata con aggiustamenti fatti per le covariate e i confronti multipli. Le abbondanze relative dei taxa sono state trasformate in radice quadrata di arcsina prima dell’analisi. Nei modelli, le abbondanze sono state utilizzate come variabili dipendenti e gli elementi alimentari come variabili indipendenti. Ogni esecuzione di MaAsLin ha prodotto risultati per le associazioni tra tutti i taxa e l’elemento alimentare scelto. Un’analisi dei percorsi è stata fatta associando i gruppi KO con il punteggio HFC in modelli di regressione lineare. Le abbondanze relative dei gruppi KO per ogni campione sono state raccolte dagli output a livello di ceppo di SHOGUN. I dati dei gruppi KO sono stati standardizzati con una trasformazione log10 prima dell’analisi, e solo le associazioni statisticamente significative sono state selezionate e visualizzate usando FuncTree (Yamada Lab, Tokyo Institute of Technology, Tokyo, Giappone). Sono stati fatti diagrammi separati per le stime che avevano associazioni positive e negative.

La diversità alfa, la diversità beta e le analisi per taxa sono state fatte per il punteggio HFC nel suo complesso, così come per i suoi singoli componenti. Un’analisi dei percorsi è stata fatta solo per il punteggio HFC. Le stime date dai modelli di regressione per la diversità alfa e per le analisi per taxa sono state standardizzate per 1 SD. Il livello di significatività statistica per tutte le analisi, ad eccezione delle analisi per taxa, è stato fissato ad un valore P a 2 lati < 0,05. Per le analisi per taxa, è stato utilizzato un valore Q corretto da Benjamini-Hochberg per i valori P ottenuti dai modelli lineari che valutano le associazioni taxa-dieta.

Le variabili di risultato primarie per questo studio erano le associazioni del punteggio HFC con 1) la misura della diversità Shannon alpha; 2) i punteggi di dissimilarità Bray-Curtis; 3) le abbondanze di taxa specifici; e 4) i gruppi KO. Le variabili di risultato secondarie erano associazioni dei componenti dietetici del punteggio HFC con le stesse variabili elencate, esclusi i gruppi KO.

Tutte le analisi statistiche sono state eseguite utilizzando R versione 3.6.1 (R Core Team, Vienna, Austria). I pacchetti phyloseq, microbiome e vegan sono stati centrali per le analisi statistiche.

Risultati

Statistiche descrittive

Le caratteristiche dettagliate del campione dello studio sono mostrate nella tabella 2. L’età media dei partecipanti era di 48 anni, con una leggera sovrarappresentazione delle donne (53%). L’IMC medio dei partecipanti era di 26,9 kg/m2; il 37,1% faceva uso di farmaci potenzialmente in grado di alterare il microbiota e il 23,7% era un fumatore. Le donne tendevano ad avere un punteggio HFC più alto rispetto agli uomini (217,8 ± 90,6/mo rispetto a 176,9 ± 80,4/mo, rispettivamente). Le differenze di sesso erano particolarmente notevoli per l’assunzione di verdure (15.2/mo superiore per le donne), frutta (10.1/mo superiore per le donne), prodotti a base di carne rossa e lavorata (8.6/mo superiore per gli uomini), formaggi magri (7.4/mo superiore per le donne), e bacche (3.9/mo superiore per le donne).

TABLE 2

Descriptive characteristics of the study sample

Men (n = 2311)Women (n = 2619)All (n = 4930)
VariableMean ± SDMedian (IQR)Mean ± SDMedian (IQR)Mean ± SDMedian (IQR)
Age, y 49 ± 12.8 — 47 ± 12.8 — 48 ± 12.8 — 
BMI, kg/m2 27.3 ± 4.1 — 26.5 ± 5.0 — 26.9 ± 4.6 — 
Medication users, n 680 (29.4%) — 1151 (43.9%) — 1831 (37.1%) — 
Current smokers, n 659 (28.5%) — 510 (19.5%) — 1169 (23.7%) — 
HFC score, 1/mo 219.2 ± 91.1 203.6 (116.9) 277.2 ± 105.6 266.3 (151.4) 250.0 ± 103.2 234.9 (144.1) 
Breads, 1/mo 64.1 ± 29.6 64.3 (38.5) 65.5 ± 30.4 64.3 (38.5) 64.8 ± 30.0 64.3 (38.5) 
Vegetables, 1/mo 33.3 ± 29.8 24.5 (36.7) 48.5 ± 35.2 38.7 (48.6) 41.4 ± 33.7 31.1 (50.1) 
Fruits, 1/mo 20.2 ± 20.1 8.6 (17.2) 30.3 ± 23.0 21.5 (51.4) 25.6 ± 22.3 21.5 (51.4) 
Berries, 1/mo 7.9 ± 11.0 4.3 (7.1) 11.8 ± 13.4 8.6 (20.0) 10.0 ± 12.5 4.3 (7.1) 
Fruit and berry juices, 1/mo 15.7 ± 15.5 8.6 (20.0) 16.4 ± 15.8 8.6 (20.0) 16.1 ± 15.7 8.6 (20.0) 
Fish, 1/mo 5.7 ± 5.6 4.3 (7.1) 5.5 ± 4.8 4.3 (7.1) 5.6 ± 5.2 4.3 (7.1) 
Red and processed meat products, 1/mo 40.0 ± 23.3 35.9 (32.1) 31.4 ± 22.0 27.8 (28.6) 35.4 ± 23.0 32.1 (31.6) 
Poultry, 1/mo 4.6 ± 4.5 4.3 (7.1) 5.4 ± 4.8 4.3 (7.1) 5.0 ± 4.7, 4.3 (7.1) 
Low-fat cheeses, 1/mo 13.6 ± 19.2 4.3 (21.0) 21.0 ± 23.0 8.6 (20.0) 17.6 ± 21.6 8.6 (20.0) 
Dressings and oils, 1/mo 6.6 ± 10.0 1.5 (8.1) 7.5 ± 10.8 1.5 (8.1) 7.1 ± 10.5 1.5 (8.1) 
Nuts and seeds, 1/mo 2.4 ± 6.0 1.0 (0) 3.3 ± 7.7 1.0 (1.

TABELLA 2 Caratteristiche descrittive del campione di studio

Uomini (n = 2311) Donne (n = 2619) Tutti (n = 4930)

Variabile Media ± SD Mediana (IQR) Media ± SD Mediana (IQR) Media ± SD Mediana (IQR)

Età, y 49 ± 12.8 – 47 ± 12.8 – 48 ± 12.8 – 

BMI, kg/m2 27.3 ± 4.1 – 26.5 ± 5.0 – 26.9 ± 4.6 – 

Consumatori di farmaci, n 680 (29,4%) – 1151 (43,9%) – 1831 (37,1%) – 

Fumatori attuali, n 659 (28,5%) – 510 (19,5%) – 1169 (23,7%) – 

Punteggio HFC, 1/mo 219.2 ± 91.1 203.6 (116.9) 277.2 ± 105.6 266.3 (151.4) 250.0 ± 103.2 234.9 (144.1) 

Pane, 1/mo 64.1 ± 29.6 64.3 (38.5) 65.5 ± 30.4 64.3 (38.5) 64.8 ± 30.0 64.3 (38.5) 

Verdure, 1/mo 33.3 ± 29.8 24.5 (36.7) 48.5 ± 35.2 38.7 (48.6) 41.4 ± 33.7 31.1 (50.1) 

Frutta, 1/mo 20.2 ± 20.1 8.6 (17.2) 30.3 ± 23.0 21.5 (51.4) 25.6 ± 22.3 21.5 (51.4) 

Bacche, 1/mo 7.9 ± 11.0 4.3 (7.1) 11.8 ± 13.4 8.6 (20.0) 10.0 ± 12.5 4.3 (7.1) 

Succhi di frutta e bacche, 1/mo 15.7 ± 15.5 8.6 (20.0) 16.4 ± 15.8 8.6 (20.0) 16.1 ± 15.7 8.6 (20.0) 

Pesce, 1/mo 5.7 ± 5.6 4.3 (7.1) 5.5 ± 4.8 4.3 (7.1) 5.6 ± 5.2 4.3 (7.1) 

Prodotti a base di carne rossa e lavorata, 1/mo 40.0 ± 23.3 35.9 (32.1) 31.4 ± 22.0 27.8 (28.6) 35.4 ± 23.0 32.1 (31.6) 

Pollame, 1/mo 4.6 ± 4.5 4.3 (7.1) 5.4 ± 4.8 4.3 (7.1) 5.0 ± 4.7, 4.3 (7.1) 

Formaggi magri, 1/mo 13.6 ± 19.2 4.3 (21.0) 21.0 ± 23.0 8.6 (20.0) 17.6 ± 21.6 8.6 (20.0) 

Condimenti e oli, 1/mo 6.6 ± 10.0 1.5 (8.1) 7.5 ± 10.8 1.5 (8.1) 7.1 ± 10.5 1.5 (8.1) 

Noci e semi, 1/mo 2.4 ± 6.0 1.0 (0) 3.3 ± 7.7 1.0 (1.0) 2.8 ± 7.0 1.0 (1.0) 

I consumatori di farmaci sono individui che hanno usato farmaci potenzialmente in grado di alterare il microbiota (elencati nei metodi supplementari) nei 3 mesi precedenti l’esame. I fumatori attuali sono individui che hanno fumato nei 6 mesi precedenti l’esame. I valori sono mezzi ± 1 SD (esclusi i consumatori di farmaci e i fumatori attuali), seguiti dalla mediana, con l’IQR tra parentesi per le variabili nutrizionali. Le unità per i componenti della dieta sono le rispettive frequenze di consumo per ogni voce come volte al mese. Il punteggio HFC è stato calcolato trasformando prima le risposte originali del FPQ in valori tempo per mese e poi sommando questi valori per gli alimenti che sono considerati parte di una dieta sana. I valori tempo-mese per i prodotti a base di carne rossa e lavorata sono stati invertiti prima di aggiungerli al punteggio HFC, per tener conto del loro ruolo negativo nella dieta. Abbreviazioni: FPQ, questionario di propensione alimentare; HFC, scelte alimentari sane.

Per verificare la rappresentatività del nostro campione di popolazione, abbiamo confrontato le caratteristiche degli individui che non hanno donato un campione di feci (n = 1019) con quelli inclusi in questo studio (n = 4930). I gruppi differivano significativamente in tutte le variabili confrontate: età, sesso, BMI, fumo, uso di farmaci e punteggio HFC. Il gruppo che non ha donato un campione era più giovane, era composto da più uomini, aveva un BMI leggermente più basso in media, era composto da più fumatori e meno consumatori di farmaci, e gli individui avevano un punteggio HFC più basso in media (Tabella supplementare 2).

Diversità microbica

Il campione dello studio aveva una misura media di diversità Shannon alfa di 3,44 e una SD di 0,41. La misura era statisticamente significativa in un modello di regressione lineare multipla con l’indice di diversità alfa Shannon come variabile dipendente e il punteggio HFC come variabile indipendente. I dati di base su età, sesso, BMI, fumo e uso di farmaci che alterano il microbiota sono stati usati come covariati. La diversità alfa è aumentata di circa 0,044 punti per 1 variazione SD nel punteggio HFC (P = 2,21 × 10-3; Figura 1; Tabella 3). Effetti covariati per 1 SD (β/SD) per la diversità alfa prevista erano 0.054 (età; P = 1.42 × 10-4), -0.039 (sesso; codificato come femmine = 0, maschi = 1; P = 6.29 × 10-3), -0.082 (BMI; P = 7.60 × 10-9), -0.049 (fumo; P = 6.03 × 10-4) e -0.039 (uso di farmaci; P = 5.71 × 10-3). Per un elenco più completo dei risultati, insieme agli IC, si veda la tabella supplementare 3.

FIGURA 1

Risultati della diversità alfa e beta (n = 4930). Il punteggio HFC è una variabile riassuntiva che consiste nella somma delle frequenze di consumo mensile dei singoli componenti alimentari elencati sotto di essa. I prodotti a base di carne rossa e lavorata hanno una classificazione inversa rispetto a quella degli altri componenti per tener conto del loro impatto negativo sulla qualità della dieta; quindi, un punteggio più alto implica un basso uso di tali prodotti. Il punteggio combinato delle fonti di fibre è una variabile riassuntiva che include solo i componenti alimentari che sono fonti di fibre alimentari. La diversità alfa (indice di Shannon; media, 3,44; DS, 0,41) sulla sinistra è stata analizzata utilizzando modelli di regressione lineare ed è stata standardizzata per DS. L’ombreggiatura delle caselle a sinistra corrisponde alla forza dell’associazione. I risultati di PERMANOVA (R2) per la diversità beta (dissimilarità di Bray-Curtis) sono sulla destra. Entrambe le analisi sono state aggiustate per l’età, il sesso, l’IMC e l’uso di farmaci potenzialmente in grado di alterare il microbiota nei 3 mesi precedenti lo studio. *Risultati statisticamente significativi (valore P < 0,05), con il valore P etichettato sulla destra. Abbreviazioni: HFC, scelte alimentari sane; PERMANOVA, analisi multivariata permutata della varianza.

TABLE 3

Results of linear regression models predicting Shannon alpha diversity measure

Variableβ/SDSEP value
HFC score 0.044 6.18 × 10−5 2.21 × 10−3 
Combined fiber sources score 0.049 8.75 × 10−5 5.31 × 10−4 
Fiber-rich breads 0.043 1.97 × 10−4 2.70 × 10−3 
Poultry 0.036 1.26 × 10−3 1.28 × 10−2 
Fruits 0.035 2.73 × 10−4 1.44 × 10−2 
Low-fat cheeses 0.035 2.75 × 10−4 1.51 × 10−2 
Berries 0.033 4.98 × 10−4 2.12 × 10−2 
Vegetables 0.026 1.80 × 10−4 6.38 × 10−2 
Fruit and berry juices 0.0025 3.72 × 10−4 8.59 × 10−1 
Nuts and seeds 0.020 8.39 × 10−4 1.64 × 10−1 
Fish 0.010 1.15 × 10−3 4.65 × 10−1 
Red and processed meat products (low use) −0.0051 1.50 × 10−4 7.21 × 10−1 
Dressings and oils −0.0062 5.57 × 10−4 6.66 × 10−1 

Ogni riga rappresenta i risultati di un modello di regressione, ordinati per forza dell’effetto standardizzato con il punteggio HFC sulla prima riga e il punteggio combinato delle fonti di fibre sulla seconda riga. I singoli componenti dei punteggi sono elencati a partire dalla terza riga. Le covariate in ogni modello includono età, sesso, BMI, fumo e farmaci potenzialmente in grado di alterare il microbiota. Gli effetti di interazione non erano significativi e quindi sono stati omessi dalle analisi. Abbreviazioni: HFC, scelte alimentari sane.

Il punteggio per le fonti di fibre combinate aveva un’associazione positiva con la diversità alfa (β/SD, 0.049; P = 5.31 × 10-4). Le associazioni positive più forti tra la diversità alfa e i componenti del punteggio HFC sono state osservate per il pane ricco di fibre, seguito da pollame, frutta, formaggi a basso contenuto di grassi e bacche (Tabella 3). Non sono state osservate associazioni negative statisticamente significative per nessun componente del punteggio.

3. Continua.