Download du 454 au MiSeq
Transcript
Analyse de communautés bactériennes Analyse de communautés bactériennes complexes: du 454 au MiSeq Sylvie COMBES, Laurent CAUQUIL, Olivier ZEMB, Béatrice GABINAUD, Géraldine PASCAL TANDEM Olivier BOUCHEZ, Frédéric ESCUDIER, Sophie VALIERE 30 Sept 2013 Microbiote dominant 20 to 40% Re‐évaluation par approches moléculaires indépendantes de la culture indépendantes de la culture 16S RNA Light Li ht subunit Heavy y subunit Miseq: mode d'emploi CONSTRUCTION Séquençage paire Séquençage paire‐end end 2x250nt 2x250nt Géolocalisé (R1 & R2 associés) Séquence Région V3‐V4 Séquence Région V3 V4 de l de l’ADNr ADNr 16S (440 16S (440 ‐ 460 pb) 460 pb) R1 = 250pb V4 V3 Primer F amplicon zone hypervariable Primer R Index Adapt P7 R2 = 250pb Run de 104 échantillons (index de 6 nt): • Communauté digestive lapin (n=80) • Communauté digestive porc (n Communauté digestive porc (n=21) 21) • Plasmides contenant la séquence ADNr 16S de bacterie connues (n=2) • Mélange 4 bactéries marines (n=1) .04 Miseq: les données Nombre de reads par echantillon Nombre de reads après filtrage Illumina: 24 854 086 (8 % de reads supprimées) soit 12 427 043 R1 12 427 043 R2 12 427 043 R2 REPARTITION DES SEQUENCES DANS REPARTITION DES SEQUENCES DANS LES 104 ECHANTILLONS Problème technique: 27 échantillons ont moins de 50 000 séquences après filtrage Illumina q p g Problème d’amplification sur PCR1 présence d’inhibiteur Suite de la présentation sur 104‐27 = 77 .06 CONTIGAGE PAR FLASH 430nt 460nt R1 qualité OK sur 250 nt R2 q qualité OK sur 240 nt overlap minimum 10 bases notre construction nécessite un overlap de min 20 et max 35 nt .07 CONTIGAGE PAR FLASH 430nt 460nt R1 qualité OK sur 250 nt R2 q qualité OK sur 240 nt overlap minimum 10 bases notre construction nécessite un overlap de min 20 et max 35 nt et max 35 nt élimine une grande partie des reads contenant des "N" mais pas tous .08 CONTIGAGE PAR FLASH 3 seuils de mismatch testés: 5%, 10%, 15% A 5% 65 % des couples R1 R2 sont contigués 8 millions A 10% 75 % A 15% 80 % % de reads g contigués Echantillons .09 LES PLASMIDES Vérifier la qualité du contigage et du processus de séquençage Plasmides Prevotella bryantii (Bacteroides): NED4B6 (454nt) >gi|129594480|gb|EF445235.1| Uncultured bacterium clone NED4B6 16S ribosomal RNA gene, partial sequence TACGGGAGGCAGCAGTGAGGAATATTGGTCAATGGACGGAAGTCTGAACCAGCCAAGTAGCGTGCAGGATGACGGCCCTATGGGTTGTAAACTGCTTTTTTAGGGGA ATAAAGTTAGCCACGTGTGGTTATTTGCATGTACCCTACGAATAAGGACCGGCTAATTCCGTGCCAGCAGCCGCGGTAATACGGAAGGTCCGGGCGTTATCCGGATTT ATTGGGTTTAAAGGGAGCGCAGGCCGTTTGGTAAGCGTGTTGTGAAATGTCCGGGCTCAACCTGGGCACTGCAGCGCGAACTGCCAGACTTGAGTGCACAGGAAGCG GGCGGAATTCGTGGTGTAGCGGTGAAATGCTTAGATATCACGAAGAACTCCAATTGCGAAGGCAGCTCGCTGTAGTGTTACTGACGCTAAAGCTCGAAAGTGCGGGTA TCGAACAGGATTAGATACCCTGGTA 208 824 R1 ou R2 brut 137 622 contigs (66%) Butyrivibrio fibrisolvens (Firmicutes): NED4E2 (450nt) >gi|129594507|gb|EF445262.1| Uncultured >gi|129594507|gb|EF445262 1| Uncultured bacterium clone NED4E2 16S ribosomal RNA gene, partial sequence clone NED4E2 16S ribosomal RNA gene partial sequence TACGGGAGGCAGCAGTGGGGGATATTGCACAATGGGCGAAAGCCTGATGCAGCGACGCCGCGTGAGTGAAGAAGTATTTCGGTATGTAAAGCTCTATCAGCAGG GAAGAAAGACCTCGTAAGAGGGGATGACGGTACCTGAGTAAGAAGCCCCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGGGCAAGCGTTATCCGG ATTTACTGGGTGTAAAGGGAGCGTAGACGGTGTATCAAGTCTGAAGTGAAACCCCACGGCTCAACCGTGGGCTTGCTTTGGAAACTGGTAGACTAGAGTACTGGA GAGGTAAGCGGAATTCCTGGTGTAGTAGTGAAATGCGTAGATATCAGGAAGAACATCAGTGGCGAAGGCGGCTTACTGGACAGCAACTGACGTTGAGGCTCGAA GGCGTGGGGAGCAAACAGGATTAGATACCCTGGT 181 734 brut 122 510 contigs (67%) .011 Plasmides Prevotella bryantii 137 622 contigs 92% à 454 nt Butyrivibrio fibrisolvens 122 510 contigs 91% à 450 nt .012 Plasmides les constructions comparées V3 Contig V4 Primer F Primer R Zone de contig ? 200nt R1NR2 230nt NNNNNNNNNN Primer F V3 Primer R V4 .013 Plasmides les constructions comparées Contig Primer F Insert Primer R 430 – 463 nt 430 463 nt Contig clean Primer F Insert Primer R 430 – 463 nt sans 430 463 nt sans "N" N R1NR2 R1NR2 NNNNNNNNNN Primer F Primer R 430 nt + 10N R1 brut R2 b t R2 brut 250 nt Primer F Insert Primer R 250 nt 250 t .014 2 façons d’analyser les communautés Reads Assignation taxonomique Clusterisation = regroupement en OTU Mothur (RDP classifier) + Base LTP111 Mothur (RDP classifier) + Base LTP111 + Esprit Tree 1 read read= 1 taxon (bootstrap 85 85- 95 %) Regroupement par chaine de caractères Chaque read est classé dans 1 OTU puis assignation taxonomique des OTU Table d’abondance TOTAL OTU3 OTU n OTU 2 sample 1 0 22 0 … 826 0 5399 sample l 1 0 12 0 … 2320 0 7928 sample 3 0 1 0 … 53 0 3155 sample 3 0 64 0 … 76 28 16616 sample 4 0 5 1 … 5694 0 7791 sample 4 0 748 36 … 52 0 5436 ... sample l 100 … … … … … … ... … … … … 0 2 4 … 5943 1 sample 100 0 380 0 3248 11421 Y ‐ matrix 48 4 … OTU 1 OTU3176 90 000 OTU TOTAL Taxon n Taxon 196 … Taxon 2 Taxon 3 Y‐ matrix Taxon 1 100 ‐ 400 taxons connus ou «unclassified» … Affiliation taxonomique (RDP classifier – LTP111) Affiliation taxonomique (RDP classifier P Prevotella t ll bryantii b tii Boot Contig Contig R1NR2 R1 (V3) R2 (V4) clean 95 94.5 99.2 93.4 91.2 88.4 100 94.4 99.0 90.9 86.0 83.0 Butyrivibrio fibrisolvens Boot. Contig Contig Contig R1NR2 R1 (V3) R2 (V4) clean 95 94.2 99.1 90.4 88.9 80.8 100 88.2 91.2 74.1 72.4 31.0 .016 Clusterisation en OTU (Esprit‐tree) sur contig ( p ) g Prevotella bryantii Butyrivibrio fibrisolvens 137 622 122 510 1 1 Nb total OTU 1397 998 OTU 1 (maj) 93.6 % 93.6 % OTU 2 0.2 % 0.2 % Contig Nb OTU attendu TTo be b continued… ti d ‐ Contig clean ‐ R1NR2 ‐ R1 ‐ R2 .017 Comparaison p 454 vs MiSeq q Comparer les profondeurs L’impact sur l’interprétation biologique Comparaison de communautés digestives de porcs Comparaison de communautés digestives de porcs 454 vs Miseq 15 échantillons 15 é h till 3 lots : propre, sale, t1 (n=5) 454 (USA) Miseq (PLAGE) 61 158 reads 1 211 554 reads Classification: RDP classifier base LTP 111 RDP classifier base LTP 111 2 niveaux taxonomiques : famille (85%) genre (95%) genre (95%) Clusterisation: Esprit tree Esprit‐tree Avec préclusterisation par classification RDP .019 454 (USA) Miseq (PLAGE) Lactobacillaceae Streptococcaceae Clostridiaceae Spirochaetaceae Peptococcaceae Oscillospiraceae Acidaminococcaceae Desulfovibrionaceae Corynebacteriaceae Bifidobacteriaceae Bacteroidaceae S Succinivibrionaceae Enterobacteriaceae Dietziaceae Deferribacteraceae Synergistaceae Anaeroplasmataceae Propionibacteriaceae Chlamydiaceae Hyphomicrobiaceae Ruminococcaceae Lachnospiraceae NoFamily_Unified_Clostridiales Erysipelotrichaceae Coriobacteriaceae Eubacteriaceae Porphyromonadaceae Prevotellaceae Veillonellaceae 0.025 0.0016 0 Classification (RDP classifier – LTP111) niv famille 454 MISEQ Nb seq tot 61158 1211554 Tx d'affiliation 85% 71% Nb taxons 29 taxons 71 taxons 1 28 Prevotellaceae Streptococcaceae Lachnospiraceae Eubacteriaceae Ruminococcaceae NoFamily_Unified_Clostridiales Lactobacillaceae Clostridiaceae Anaeroplasmataceae Micrococcaceae Enterococcaceae Staphylococcaceae Aerococcaceae Planococcaceae Pseudoalteromonadaceae Flavobacteriaceae Pasteurellaceae Bacillaceae Carnobacteriaceae Oxalobacteraceae Pseudomonadaceae Leuconostocaceae Sphingomonadaceae Syntrophomonadaceae Elusimicrobiaceae Alcaligenaceae Rhodobacteraceae Streptomycetaceae Sphingobacteriaceae Fusobacteriaceae Acholeplasmataceae Erythrobacteraceae Xanthomonadaceae Bradyrhizobiaceae Paenibacillaceae S Synergistaceae i Leptotrichiaceae Methylobacteriaceae Christensenellaceae Microbacteriaceae Nocardiopsaceae Moraxellaceae Chlamydiaceae NoFamily_Unified_Burkholderiales Neisseriaceae Mycoplasmataceae Comamonadaceae Legionellaceae Fibrobacteraceae Rikenellaceae Acidaminococcaceae Dietziaceae Actinomycetaceae Deferribacteraceae Sutterellaceae Helicobacteraceae Succinivibrionaceae Desulfovibrionaceae Campylobacteraceae Erysipelotrichaceae Corynebacteriaceae Bifidobacteriaceae Enterobacteriaceae Bacteroidaceae Peptococcaceae Veillonellaceae Oscillospiraceae Spirochaetaceae Porphyromonadaceae C i b t i Coriobacteriaceae Hyphomicrobiaceae Group propre sale t1 0 80 0.80 0.40 0.12 0.025 0.0016 0 43 .020 454 (USA) Miseq (PLAGE) Lactobacillaceae Streptococcaceae Clostridiaceae Spirochaetaceae Peptococcaceae Oscillospiraceae Acidaminococcaceae Desulfovibrionaceae Corynebacteriaceae Bifidobacteriaceae Bacteroidaceae S Succinivibrionaceae Enterobacteriaceae Dietziaceae Deferribacteraceae Synergistaceae Anaeroplasmataceae Propionibacteriaceae Chlamydiaceae Hyphomicrobiaceae Ruminococcaceae Lachnospiraceae NoFamily_Unified_Clostridiales Erysipelotrichaceae Coriobacteriaceae Eubacteriaceae Porphyromonadaceae Prevotellaceae Veillonellaceae 0.025 0.0016 0 0.0 0.2 0.4 0.6 0.8 Corrélation abondance Corrélation abondance relative 454 vs MiSeq niveau famille Erysipelotrichaceae Anaeroplasmataceae Prevotellaceae Streptococcaceae Lachnospiraceae Eubacteriaceae Ruminococcaceae NoFamily_Unified_Clostridiales Lactobacillaceae Clostridiaceae Anaeroplasmataceae Micrococcaceae Enterococcaceae Staphylococcaceae Aerococcaceae Planococcaceae Pseudoalteromonadaceae Flavobacteriaceae Pasteurellaceae Bacillaceae Carnobacteriaceae Oxalobacteraceae Pseudomonadaceae Leuconostocaceae Sphingomonadaceae Syntrophomonadaceae Elusimicrobiaceae Alcaligenaceae Rhodobacteraceae Streptomycetaceae Sphingobacteriaceae Fusobacteriaceae Acholeplasmataceae Erythrobacteraceae Xanthomonadaceae Bradyrhizobiaceae Paenibacillaceae S Synergistaceae i Leptotrichiaceae Methylobacteriaceae Christensenellaceae Microbacteriaceae Nocardiopsaceae Moraxellaceae Chlamydiaceae NoFamily_Unified_Burkholderiales Neisseriaceae Mycoplasmataceae Comamonadaceae Legionellaceae Fibrobacteraceae Rikenellaceae Acidaminococcaceae Dietziaceae Actinomycetaceae Deferribacteraceae Sutterellaceae Helicobacteraceae Succinivibrionaceae Desulfovibrionaceae Campylobacteraceae Erysipelotrichaceae Corynebacteriaceae Bifidobacteriaceae Enterobacteriaceae Bacteroidaceae Peptococcaceae Veillonellaceae Oscillospiraceae Spirochaetaceae Porphyromonadaceae C i b t i Coriobacteriaceae Hyphomicrobiaceae Group propre sale t1 0 80 0.80 0.40 0.12 0.025 0.0016 0 .021 Comparaison des profiles taxonomiques par nMDS pig31 pig06 454 (USA) Miseq (PLAGE) pig55 pig72 pig22 pig76 pig06 pig22 pig01 pig63 pig31 pig78 pig78 pig74 pig01 pig76 pig74 pig72 pig63 pig55 pig72 pig31 pig03 pig22 pig55 pig78 p g pig18 pig45 pig76 pig18 pig45 pig76 pig22 pig55 pig78 pig06 pig38 pig74 454 t1 propre sale pig01 pig24 pig63 0.035 Procrustes errors pig03 pig31 pig72 pig01 pig24 pig63 t1 propre sale 0.020 0.025 0.030 Classification (RDP classifier – LTP111) niv famille 0.010 0.015 Représentation robuste 4 individus ont un positionnement significativement différent 0.005 Procrusttes residual MiSeq pig06 pig38 pig74 2 4 6 8 10 12 14 Index .022 Lactobacillus Turicibacter Bifidobacterium Corynebacterium Mogibacterium Parabacteroides Anaerovibrio Asteroleplasma Acetivibrio Cloacibacillus Anaeroplasma Cellulosilyticum Dietzia Mucispirillum Sharpea Yersinia Chlamydia Succiniclasticum Anaerofustis Escherichia Veillonella Propionibacterium Allisonella Roseburia Phascolarctobacterium Gemmiger Butyricicoccus Bacteroides Barnesiella Butyrivibrio Collinsella Peptococcus Dialister Olsenella Desulfovibrio Slackia Selenomonas Acidaminococcus Succinivibrio Oscillibacter Treponema Sarcina Mitsuokella S Streptococcus Clostridium Prevotella Faecalibacterium Coprococcus Dorea Blautia Eubacterium Ruminococcus Catenibacterium Megasphaera Classification (RDP classifier – LTP111) niv genre 454 MISEQ Nb reads 61 158 1 211 554 Tx d'affiliation 67 % 53 % Nb taxons 54 taxons 125 taxons 0.025 Group propre sale t1 0.0016 0 1 53 72 Prevotella Lactobacillus Streptococcus Clostridium Anaerovibrio Bhargavaea Pseudoalteromonas Howardella Mucispirillum Anaerococcus Mobiluncus Yaniella Acetivibrio Tissierella Sutterella Helicobacter Anaeroplasma Enterococcus Phascolarctobacterium Yersinia Butyricimonas Aerococcus Anaerofustis Actinomyces Barnesiella Odoribacter Flavonifractor Acidaminococcus Klebsiella Pseudoflavonifractor Anaerobiospirillum Mycoplasma Pseudoramibacter Methylobacterium Chlamydia Psychrobacter Leucobacter Anaerostipes Pseudobutyrivibrio Peptoniphilus Bilophila Salinicoccus Eggerthella Nosocomiicoccus Flavobacterium Trueperella Actinobacillus V ill ll Veillonella Sharpea Streptomyces Virgibacillus Finegoldia Sedimentibacter Acetanaerobacterium Bacillus Rikenella Novosphingobium Weissella Nocardiopsis Acetobacterium Oribacterium Fusobacterium Asteroleplasma Legionella Parasutterella Lactococcus Curvibacter Christensenella Uruburuella Paenibacillus Bosea Cloacibacillus Stenotrophomonas Leptotrichia Porphyrobacter Atopostipes Schwartzia Parabacteroides Selenomonas Pseudomonas Subdoligranulum Jeotgalicoccus Facklamia Staphylococcus Paenalcaligenes Elusimicrobium Succiniclasticum Acinetobacter Gallicola Aquabacterium Butyrivibrio Escherichia Dietzia Cellulosilyticum Sarcina Mitsuokella Succinivibrio Dialister Bacteroides Gemmiger Desulfovibrio Campylobacter Fibrobacter Allisonella Megasphaera Alistipes Butyricicoccus Olsenella Slackia Catenibacterium Faecalibacterium Coprococcus Dorea Blautia Eubacterium Ruminococcus Treponema Roseburia Oscillibacter Turicibacter Collinsella Peptococcus p Mogibacterium Corynebacterium Bifidobacterium 0.40 0.12 0.025 0.0016 0 .023 1.0 0.025 Group propre sale t1 0.0016 0 0.0 0 0.2 0.4 0.6 0.8 Lactobacillus Turicibacter Bifidobacterium Corynebacterium Mogibacterium Parabacteroides Anaerovibrio Asteroleplasma A ti ib i Acetivibrio Cloacibacillus Anaeroplasma Cellulosilyticum Dietzia Mucispirillum Sharpea Yersinia Chlamydia Succiniclasticum Anaerofustis Escherichia Veillonella Propionibacterium Allisonella Roseburia Phascolarctobacterium Gemmiger Butyricicoccus Bacteroides Barnesiella Butyrivibrio Collinsella Peptococcus Dialister Olsenella Desulfovibrio Slackia Selenomonas Acidaminococcus Succinivibrio Oscillibacter Treponema Sarcina Mitsuokella Streptococcus Clostridium P Prevotella ll Faecalibacterium Coprococcus Dorea Blautia Eubacterium Ruminococcus Catenibacterium Megasphaera Megasphaera Eubacterium Prevotella Lactobacillus Streptococcus Clostridium Anaerovibrio Bhargavaea Pseudoalteromonas Howardella Mucispirillum Anaerococcus Mobiluncus Yaniella Acetivibrio Tissierella Sutterella Helicobacter Anaeroplasma Enterococcus Phascolarctobacterium Yersinia Butyricimonas Aerococcus Anaerofustis Actinomyces Barnesiella Odoribacter Flavonifractor Acidaminococcus Klebsiella Pseudoflavonifractor Anaerobiospirillum Mycoplasma Pseudoramibacter Methylobacterium Chlamydia Psychrobacter Leucobacter Anaerostipes Pseudobutyrivibrio Peptoniphilus Bilophila Salinicoccus Eggerthella Nosocomiicoccus Flavobacterium Trueperella Actinobacillus Veillonella Sharpea Streptomyces Virgibacillus Finegoldia Sedimentibacter Acetanaerobacterium Bacillus Rikenella Novosphingobium Weissella Nocardiopsis Acetobacterium O ib t i Oribacterium Fusobacterium Asteroleplasma Legionella Parasutterella Lactococcus Curvibacter Christensenella Uruburuella Paenibacillus Bosea Cloacibacillus Stenotrophomonas Leptotrichia Porphyrobacter Atopostipes Schwartzia Parabacteroides Selenomonas Pseudomonas Subdoligranulum Jeotgalicoccus Facklamia Staphylococcus Paenalcaligenes Elusimicrobium Succiniclasticum Acinetobacter Gallicola Aquabacterium Butyrivibrio Escherichia Dietzia Cellulosilyticum Sarcina Mitsuokella Succinivibrio Dialister Bacteroides Gemmiger Desulfovibrio Campylobacter Fibrobacter Allisonella Megasphaera Alistipes Butyricicoccus Olsenella Slackia Catenibacterium Faecalibacterium Coprococcus Dorea Blautia Eubacterium Ruminococcus Treponema Roseburia Oscillibacter Turicibacter Collinsella Peptococcus M ib t i Mogibacterium Corynebacterium Bifidobacterium 0.40 Group propre sale t1 0.12 0.025 0.0016 0 .024 Clusterisation : Esprit Tree : Esprit Tree (0.03) 454 MISEQ Nb seq tot 61 392 1 227 651 Nb OTU Nb OTU 4 346 4 346 75 636 75 636 Singleton 56% 61% .025 Comparaison des profiles taxonomiques par nMDS pig31 pig22 454 (USA) Miseq (PLAGE) pig06 pig31 pig63 pig55 p g pig76 pig72 pig74 pig22 pig06 pig78 pig76 pig55 pig01 pig01 pig78 pig74 pig72 pig63 pig76 pig45 pig18 pig74 pig38 pig06 pig76 pig45 pig18 pig72 pig31 pig03 pig06 pig38 pig74 454 pig22 pig55 pig78 MiSeq pig01 pig24 pig63 t1 propre sale t1 propre sale pig22 pig55 pig78 pig03 pig31 pig72 pig01 pig24 pig63 0.25 Procrustes errors 0.10 0.15 Représentation robuste 4 individus ont un positionnement significativement différent 0.05 Procrustes res sidual 0.20 Clusterisation : Esprit Tree (0.03) 2 4 6 8 Index 10 12 14 .026 Conclusion Miseq (PLAGE) Qualité Q lité d des séquences é satisfaisantes ti f i t Contigage possible, suppression des bases N Profondeur accrue Moindre coût Multiplexage plus important Résultats cohérents d’un d un point de vue composition communauté M i Mais Difficulté de traitement dû à l’augmentation du nb de reads Pipeline à revoir Thanks for your attention a s o you atte t o TANDEM Merci pour votre attention Thanks to each of my team members PECTOUL Laurent Cauquil Valérie Lozano Carole Bannelier Béatrice Gabinaud Thierry Gidenne Muriel Segura Vergnes Jean Philippe Corine Bayourthe Laurence Fortun‐Lamothe Viviane Batailler Viviane Batailler Olivier Zemb Olivier Zemb Christine Julien Francis Enjalbert Géraldine Géraldine Pascal Vargas Anita Annabelle Troegeler Marie Luce Schmidt .028