Merkl | Bioinformatik | Buch | 978-3-527-34949-4 | sack.de

Buch, Deutsch, 752 Seiten, Format (B × H): 177 mm x 250 mm, Gewicht: 1544 g

Merkl

Bioinformatik

Grundlagen, Algorithmen, Anwendungen
Vierte Auflage
ISBN: 978-3-527-34949-4
Verlag: Wiley-VCH GmbH

Grundlagen, Algorithmen, Anwendungen

Buch, Deutsch, 752 Seiten, Format (B × H): 177 mm x 250 mm, Gewicht: 1544 g

ISBN: 978-3-527-34949-4
Verlag: Wiley-VCH GmbH


Der Marktführer bei den Bioinformatiklehrbüchern in neuer Auflage und mit dem neuen Thema Molekulardynamik
 
Bioinformatik ist eine Kerndisziplin in den modernen Biowssenschaften, von der Biotechnologie über die Biochemie und Molekularbiologie bis zur Molekulargenetik und Molekularmedizin. Sie ist eine essenzielle Grundlage für alle "omics"-Technologien, für die Strukturbiologie, die Systembiologie sowie die synthetische Biologie.
 
Bioinformatik. Grundlagen, Algorithmen, Anwendungen bietet eine umfassende Einführung in die wichtigsten Methoden der Bioinformatik. Der Autor erklärt dabei sowohl die mathematischen und biologischen Grundlagen als auch die wichtigsten Software-Tools und deren Anwendungsbereiche. Schwerpunkte sind Methoden zum Sequenzvergleichs, Verfahren zur Charakterisierung von Proteinfamilien, Algorithmen zur Vorhersage von Protein- und RNA-Strukturen, Methoden des maschinellen Lernens und das Proteindesign.
 
Für die 4. Auflage wurde der Text durchgehend aktualisiert und um ein Kapitel zur Molekulardynamik erweitert. Neu aufgenommene Exkurse zu Meilensteinen der Bioinformatik und aktuellen Anwendungsgebieten lockern den Text auf. Auf der ebenfalls komplett überarbeiteten Begleit-Webseite werden interaktive Lernmodule bereitgestellt, einschließlich mehr als 120 Übungsaufgaben, zum Teil mit Lösungen.
Eine perfekte Einführung für alle Studenten der Lebenswissenschaften oder Informatik, die einen Einblick in die gängigen Methoden der Bioinformatik benötigen, sowie ein wertvoller Begleiter für alle, die bereits bioinformatische Werkzeuge nutzen und die zugrundeliegenden Konzepte verstehen möchten.
Merkl Bioinformatik jetzt bestellen!

Autoren/Hrsg.


Weitere Infos & Material


GRUNDLAGEN - BIOLOGIE UND DATENBANKEN
Biologische Grundlagen
Sequenzen und ihre Funktion
Datenbanken
LERNEN, OPTIMIEREN UND ENTSCHEIDEN
Grundbegriffe der Stochastik
Bayessche Entscheidungstheorie und Klassifikatoren
Klassische Cluster- und Klassifikationsverfahren
Neuronale Netze
Genetische Algorithmen
ALGORITHMEN UND MODELLE DER BIOINFORMATIK
Paarweiser Sequenzvergleich
Sequenz-Motive
Scoring-Schemata
FASTA und die BLAST-Suite
Multiple Sequenzalignments und Anwendungen
Grundlagen phylogenetischer Analysen
Markov-Ketten und Hidden-Markov-Modelle
Profil-HMMs
Support-Vektor Maschinen
Molekulardynamik (NEU)
Vorhersage der Sekundärstruktur
Vergleich von Protein-3D-Strukturen
Vorhersage der Protein-3D-Struktur
Analyse integraler Membranproteine
Entschlüsselung von Genomen
Auswertung von Genexpressionsdaten
Analyse von Protein-Protein-Interaktionen
Big Data: Herausforderungen und Möglichkeiten

vorwort V

Teil I Grundlagen – Biologie und Datenbanken 1

1 Biologische Grundlagen 5

1.1 DNA 6

1.2 Genetischer Code und Genomkomposition 8

1.3 Transkription 12

1.4 RNA 13

1.5 Proteine 14

1.6 Peptidbindung 16

1.7 Konformation von Aminosäureseitenketten 16

1.8 Ramachandran-Plot 17

1.9 Hierarchische Beschreibung von Proteinstrukturen 18

1.10 Sekundärstrukturelemente 19

1.11 a-Helix 20

1.12 ß-Faltblätter 20

1.13 Supersekundärstrukturelemente 21

1.14 Proteindomänen 22

1.15 Proteinfamilien 23

1.16 Enzyme 26

1.17 Proteinkomplexe 27

1.18 Evolutionäre Prozesse 28

1.19 Fachbegriffe 30

Literatur 33

2 Sequenzen und ihre Funktion 37

2.1 Definitionen und Operatoren 38

2.2 DNA-Sequenzen 39

2.3 Proteinsequenzen 39

2.4 Vergleich der Sequenzkomposition 41

2.5 Ontologien 45

2.6 Analyse der Anreicherung von GO-Termen 48

2.7 Semantische Ähnlichkeit von GO-Termen 48

2.7.1 Bewertung mit informationstheoretischen Ansätzen 48

2.7.2 Vergleich mit einer graphentheoretischen Methode 50

Literatur 54

3 Datenbanken 57

3.1 Nukleotidsequenzdatenbanken 58

3.2 RNA-Sequenz-Datenbanken 59

3.3 Proteinsequenzdatenbanken 60

3.4 3-D-Struktur-Datenbanken 60

3.5 SMART: Analyse der Domänenarchitektur 62

3.6 STRING: Proteine und ihre Interaktionen 62

3.7 SCOP: Strukturelle Klassifikation von Proteinen 63

3.8 Pfam: Kompilation von Proteinfamilien 66

3.9 COG und eggNOG: Gruppen orthologer Gene 68

3.10 KEGG: Gene, Genome und Krankheiten 68

3.11 NCBI-Datenbanken: Literatur und biologisches Wissen 69

3.12 Weitere Datenbanken 70

Literatur 74

Teil II Lernen, Optimieren und Entscheiden 77

4 Grundbegriffe der Stochastik 81

4.1 Grundbegriffe der beschreibenden Statistik 82

4.2 Zufallsvariable, Wahrscheinlichkeitsmaß 84

4.3 Urnenexperimente und diskrete Verteilungen 86

4.4 Die kolmogoroffschen Axiome 89

4.5 Bedingte Wahrscheinlichkeit, Unabhängigkeit, Satz von Bayes 89

4.6 Markov-Ketten 91

4.7 Erwartungswert, Varianz 91

4.8 Wichtige Wahrscheinlichkeitsverteilungen 92

4.8.1 Diskrete Verteilungen 92

4.8.2 Totalstetige Verteilungen 93

4.9 Schätzer 96

4.10 Grundlagen statistischer Tests 98

4.11 Eine optimale Entscheidungstheorie: die Neyman-Pearson-Methode 100

Literatur 101

5 Bayessche Entscheidungstheorie und Klassifikatoren 103

5.1 Bayessche Entscheidungstheorie 103

5.1.1 Ein Beispiel: Klassifikation der Proteinoberfläche 104

5.1.2 Übergang zu bedingten Wahrscheinlichkeiten 105

5.1.3 Erweitern auf m Eigenschaften 107

5.2 Marginalisieren 109

5.3 Boosting 110

5.4 ROC-Kurven 112

5.4.1 Bewerten von Fehlklassifikationen 112

5.4.2 Aufnehmen einer ROC-Kurve 112

5.5 Testmethoden für kleine Trainingsmengen 115

Literatur 117

6 Klassische Cluster- und Klassifikationsverfahren 119

6.1 Metriken und Clusteranalyse 120

6.2 Das mittlere Fehlerquadrat als Gütemaß 120

6.3 Ein einfaches iteratives Clusterverfahren 121

6.4 k-Means-Clusterverfahren 123

6.5 Hierarchische Clusterverfahren 126

6.6 Affinity propagation 127

6.7 Bewertung der Clusterverfahren 129

6.8 Überlappende Cluster 130

6.9 Nächster-Nachbar-Klassifikation 130

6.10 k-nächste-Nachbarn-Klassifikation 132

Literatur 133

7 Neuronale Netze 135

7.1 Architektur von neuronalen Netzen 136

7.2 Das Perzeptron 136

7.3 Modellieren boolscher Funktionen 138

7.4 Lösbarkeit von Klassifikationsaufgaben 139

7.5 Universelle Approximation 141

7.6 Lernen in neuronalen Netzen 143

7.7 Der Backpropagation-Algorithmus 144

7.8 Codieren der Eingabe 147

7.9 Selbstorganisierende Karten 148

7.10 Tiefe Architekturen 150

7.11 Ein einfaches Neuron, die rectified linear unit 151

7.12 Das Neocognitron als alternatives Modellierparadigma 152

7.13 Faltung mithilfe von CNNs 153

7.14 Längerfristiges Speichern von Eingabedaten 157

7.15 Attention-basierte Netze 161

Literatur 168

8 Genetische Algorithmen 171

8.1 Objekte und Funktionen 173

8.2 Ablauf des Verfahrens 174

8.3 Codieren der Problemstellung 176

8.4 Der Begriff des Schemas 176

8.5 Dynamik der Anzahl von Schemata 177

8.6 Limitationen genetischer Algorithmen 179

8.7 Genetisches Programmieren 180

Literatur 183

Teil III Algorithmen und Modelle der Bioinformatik 185

9 Paarweiser Sequenzvergleich 189

9.1 Dotplots 191

9.1.1 Definition 191

9.1.2 Beispiel 192

9.1.3 Implementierung 193

9.1.4 Abschätzen der Laufzeit 194

9.1.5 Anwendungen 195

9.1.6 Einschränkungen und Ausblick 196

9.2 Entwickeln eines optimalen Alignment-Verfahrens 198

9.2.1 Paarweise und multiple Sequenzalignments 200

9.2.2 Dynamisches Programmieren 200

9.2.3 Distanzen und Metriken 202

9.2.4 Die Minkowski-Metrik 203

9.2.5 Die Hamming-Distanz 203

9.3 Levenshtein-Distanz 204

9.3.1 Berechnungsverfahren 206

9.3.2 Ableiten des Alignments 210

9.4 Bestimmen der Ähnlichkeit von Sequenzen 210

9.4.1 Globales Alignment 210

9.4.2 Lokales Sequenzalignment 211

9.5 Optimales Bewerten von Lücken 212

9.5.1 Eigenschaften affiner Kostenfunktionen 213

9.5.2 Integration in Algorithmen 213

9.6 Einordnung der Algorithmen 215

Literatur 216

10 Sequenzmotive 219

10.1 Signaturen 220

10.2 Die PROSITE-Datenbank 221

10.3 Die BLOCKS-Datenbank 221

10.4 Sequenzprofile 222

10.5 Scores für Promotorsequenzen 224

10.6 Möglichkeiten und Grenzen profilbasierter Klassifikation 224

10.7 Sequenzlogos 225

10.8 Konsensussequenzen 226

10.9 Sequenzen niedriger Komplexität 227

10.10 Der SEG-Algorithmus 228

Literatur 231

11 Scoring-Schemata 233

11.1 Theorie von Scoring-Matrizen 234

11.2 Algorithmenbedingte Anforderungen 237

11.3 Identitätsmatrizen 237

11.4 PAM-Einheit 238

11.5 PAM-Matrizen 238

11.6 Ein moderner PAM-Ersatz: die JTT-Matrix 240

11.7 BLOSUM-Matrizen 241

11.8 Matrixentropie 243

11.9 Scoring-Schemata und Anwendungen 244

11.10 Flexible Erweiterung: Scoring-Funktionen 245

Literatur 247

12 FASTA und die BLAST-Suite 249

12.1 FASTA 250

12.1.1 Programmablauf 250

12.1.2 Statistische Bewertung der Treffer 252

12.2 BLAST 255

12.2.1 Konzepte und Umsetzung 256

12.2.2 Statistik von Alignments 259

12.2.3 Ausgabe der Treffer 264

12.3 Vergleich der Empfindlichkeit von FASTA und BLAST 264

12.4 Ansätze zur Performanzsteigerung 265

12.5 Profilbasierter Sequenzvergleich 266

12.6 PSI-BLAST 267

12.7 Sensitivität verschiedener Sequenzvergleichsmethoden 269

12.8 Vergleich von Profilen und Konsensussequenzen 270

12.9 DELTA-BLAST 271

12.10 Alternative Ansätze 275

Literatur 276

13 Multiple Sequenzalignments und Anwendungen 279

13.1 Berechnen von Scores für multiple Sequenzalignments 281

13.2 Iteratives Berechnen eines Alignments 282

13.3 ClustalW: Ein klassischer Algorithmus 283

13.3.1 Grundlegende Konzepte 283

13.3.2 Algorithmus 283

13.3.3 Ein Beispiel: MSA für Trypsininhibitoren 284

13.4 T-Coffee 286

13.5 M-Coffee und 3D-Coffee 289

13.6 Alternative Ansätze 291

13.7 Alignieren großer Datensätze mit Clustal Omega 292

13.8 Alignieren großer Proteinsequenzdatensätze mit DECIPHER 293

13.9 Charakterisierung von Residuen mithilfe von Alignments 296

13.9.1 Entwickeln der Scoring-Funktion 297

13.9.2 FRpred: Vorhersage funktionell wichtiger Residuen 297

13.9.3 SDPpred: Vergleich homologer Proteine mit unterschiedlicher Spezifität 298

13.10 Alignment von DNA- und RNA-Sequenzen 300

Literatur 301

14 Grundlagen phylogenetischer Analysen 303

14.1 Einteilung phylogenetischer Ansätze 307

14.2 Distanzbasierte Verfahren 307

14.2.1 Ultrametrische Matrizen 308

14.2.2 Additive Matrizen 309

14.3 Linkage-Algorithmen 311

14.4 Der Neighbour-Joining-Algorithmus 313

14.5 Parsimony-Methoden 314

14.6 Maximum-Likelihood-Ansätze 317

14.6.1 Übergangswahrscheinlichkeiten für DNA-Sequenzen 318

14.6.2 Empirische Modelle der Proteinevolution 319

14.6.3 Berechnen der Likelihood eines Baumes 321

14.6.4 Quartett-Puzzle: Heuristik zum Finden einer Topologie 323

14.7 Grundannahmen phylogenetischer Algorithmen 325

14.8 Statistische Bewertung phylogenetischer Bäume 326

14.8.1 Validierung durch Outgroups 327

14.8.2 Bootstrap-Verfahren und A-posteriori-Wahrscheinlichkeiten 327

14.8.3 Alternativen und Ergebnisse 329

Literatur 332

15 Markov-Ketten und Hidden-Markov-Modelle 335

15.1 Ein epigenetisches Signal: CpG-Inseln 335

15.2 Finite Markov-Ketten 336

15.3 Kombination zweier Ketten zu einem Klassifikator 337

15.4 Genvorhersage mithilfe inhomogener Ketten 340

15.5 Hidden-Markov-Modelle 343

15.6 Der Viterbi-Pfad 346

15.7 Ein HMM zur Erkennung von CpG-Inseln 348

15.8 Der Vorwärts- und der Rückwärtsalgorithmus 349

15.9 Schätzen von Parametern 351

15.10 Der Baum-Welch-Algorithmus 352

15.11 Entwurf von HMMs 354

15.12 Verwendung und Grenzen von HMMs 356

15.13 Wichtige Eigenschaften von Markov-Ketten 357

15.14 Markov-Ketten-Monte-Carlo-Verfahren 359

15.14.1 Monte-Carlo-Integration 359

15.14.2 Metropolis-Hastings-Algorithmus 360

15.14.3 Simulated annealing 361

15.14.4 Gibbs-Sampler 362

15.15 Weitere Anwendungen von Markov-Ketten 362

Literatur 366

16 Profil-HMMs 369

16.1 HMM-Struktur zur Beschreibung von Proteinfamilien 370

16.2 Suche nach homologen Sequenzen 373

16.3 Modellbau für Profil-HMMs 376

16.4 Approximieren von Wahrscheinlichkeitsdichten 380

16.5 HHsearch: Vergleich zweier Profil-HMMs 386

16.5.1 Grundlagen des Alignments von zwei Hidden-Markov-Ketten 387

16.5.2 Paarweises Alignment von HMMs 390

16.5.3 Performanz von HHsearch 391

16.5.4 Strukturvorhersage mit HHsearch 393

Literatur 395

17 Support-Vektor-Maschinen 397

17.1 Beschreibung des Klassifikationsproblems 398

17.2 Lineare Klassifikatoren 399

17.3 Klassifizieren mit großer Margin 403

17.4 Kernel-Funktionen und Merkmalsräume 405

17.5 Implizite Abbildung in den Merkmalsraum 407

17.6 Eigenschaften von Kernel-Funktionen 408

17.7 Häufig verwendete Kernel-Funktionen 409

17.8 Aus Merkmalen abgeleitete Kernel-Funktionen 410

17.9 Support-Vektor-Maschinen in der Anwendung 416

17.10 Multiklassen-SVM 419

17.11 Theoretischer Hintergrund 420

Literatur 424

18 Vorhersage der Sekundärstruktur 427

18.1 Vorhersage der Proteinsekundärstruktur 427

18.1.1 Ein früher Ansatz: Chou-Fasman-Verfahren 428

18.1.2 PHD: profilbasierte Vorhersage 429

18.2 Vorhersage der RNA-Sekundärstruktur 436

18.2.1 RNA-Sequenzen und -Strukturen 438

18.2.2 Freie Energie und Strukturen 439

18.2.3 Sekundärstrukturvorhersage durch Energieminimierung 440

18.2.4 Strukturen mit Schleifen 442

18.2.5 MEA-Verfahren zur Vorhersage von Strukturen mit Pseudoknoten 444

18.2.6 Strukturvorhersage mithilfe von multiplen Sequenzalignments 447

Literatur 449

19 Vergleich von Protein-3-D-Strukturen 451

19.1 Grundlagen des Strukturvergleichs 453

19.2 Simulated annealing 455

19.3 DALI: fragmentbasierte Superposition 458

19.3.1 Scores für Substrukturen 459

19.3.2 Alignieren von Substrukturen 459

19.4 Fr-TM-align: Alignieren von Fragmenten 461

19.5 SPalignNS: optimales Kombinieren von Residuenpaaren 462

19.6 FAST: Vergleich der lokalen Geometrie 463

19.7 DeepAlign: Verwenden eines Strukturalphabets 466

19.8 Multiple Superpositionen 471

Literatur 474

20 Vorhersage der Protein-3-D-Struktur, Proteindesign und Moleküldynamik 477

20.1 Threading-Verfahren 482

20.2 3D-1D-Profile: profilbasiertes Threading 484

20.2.1 Bestimmen der lokalen Umgebung 484

20.2.2 Erzeugen eines 3-D-1-D-Profils 486

20.3 Wissensbasierte Kraftfelder 489

20.3.1 Theoretische Grundlagen 490

20.3.2 Ableiten der Potenziale 493

20.4 Rotamerbibliotheken 494

20.5 MODELLER 499

20.6 Bewerten der Modellqualität 504

20.7 Alternative Modellieransätze 504

20.8 ROSETTA/ROBETTA 505

20.8.1 De-novo-Strukturvorhersage mit ROSETTA 506

20.8.2 Verfeinerung der Fragmentinsertion 508

20.8.3 Modellieren strukturell variabler Regionen 508

20.8.4 Proteindesign mithilfe von ROSETTA 510

20.9 Moleküldynamiksimulationen 517

20.9.1 Physikalische Grundlagen von MD-Simulationen 518

20.9.2 Berechnungsverfahren 519

20.9.3 Berechnen der Interaktionen mithilfe von Kraftfeldern 521

20.9.4 Spezielle Hardware beschleunigt die Simulationen 522

Literatur 523

21 Analyse integraler Membranproteine 527

21.1 Architektur integraler Membranproteine 528

21.2 Spezifische Probleme beim Sequenzvergleich 530

21.3 Vorhersage der Topologie von a-helikalen IMPs 530

21.3.1 HMMTOP 531

21.3.2 MEMSAT-SVM 532

21.3.3 Ein Metaansatz: TOPCONS 2 534

21.4 Vorhersage der Struktur von ß-Fässern 535

21.4.1 TMBpro 535

21.4.2 PRED-TMBB 2 537

21.4.3 BOCTOPUS 2 539

21.4.4 Alternative Ansätze und Homologiemodellierung 541

Literatur 541

22 Entschlüsselung von Genomen 545

22.1 Shotgun-Sequenzierung 549

22.2 Erwartete Anzahl von Contigs beim Shotgun-Ansatz 550

22.3 Basecalling und Sequenzqualität 551

22.4 Der klassische Assemblieransatz 553

22.4.1 Phase eins: Bestimmen überlappender Präfix-Suffix-Regionen 554

22.4.2 Phase zwei: Erzeugen von Contigs 556

22.4.3 Phase drei: Generieren der Konsensussequenz 556

22.5 Assemblieren kurzer Fragmente 558

22.6 Assemblieren langer und fehlerbehafteter Reads 561

22.7 Annotation kompletter Genome 565

22.8 Metagenomik 570

22.8.1 Spezielle Anforderungen an die Bioinformatik 571

22.8.2 Minimalanforderungen für die Metagenomannotation 573

Literatur 574

23 Auswertung von Transkriptomdaten 579

23.1 DNA-Chip-Technologie 579

23.1.1 Datenbanken für Transkriptomdaten 581

23.1.2 Grenzen der Technologie 582

23.2 Analyse von DNA-Chip-Signalen 583

23.2.1 Quantifizierung von Expressionswerten 583

23.2.2 Normalisieren und Datenreduktion 584

23.3 Identifizieren differenziell exprimierter Gene 586

23.4 RNA-Sequenzierung 587

23.5 Analyse der RNA-Sequenzen 588

23.6 Einzelzell-RNA-Sequenzierung 591

23.7 Metriken zum Vergleich von Expressionsdaten 591

23.8 Analyse kompletter Expressionsdatensätze 593

23.8.1 Anwenden von Clusterverfahren 593

23.8.2 Validierung und Alternativen 593

23.9 Hauptkomponentenanalyse 594

23.10 Biclusterverfahren 597

23.10.1 ISA: ein performantes Biclusterverfahren 597

23.10.2 Der Signaturalgorithmus 598

23.10.3 Iterative Optimierung 601

23.10.4 QUBIC2: Ein graphenbasiertes Biclusterverfahren 602

23.11 Grenzen und Alternativen bei der Expressionsanalyse 604

23.12 Genexpressions-Profiling 605

23.13 Visualisieren mithilfe von Wärmekarten 606

23.13.1 Der klassische Ansatz 607

23.14 Datenaufbereitung für systembiologische Fragestellungen 607

23.14.1 Bündelung von Datenbankinformation 608

23.14.2 Statistische Analyse der Termverteilung 609

23.14.3 Verwendbarkeit der Verfahren 610

Literatur 612

24 Analyse von Protein-Protein-Interaktionen 615

24.1 Biologische Bedeutung des Interaktoms 615

24.2 Methoden zum Bestimmen des Interaktoms 616

24.3 Vergleich von Codonhäufigkeiten 618

24.4 Analyse des Genominhaltes 619

24.4.1 Genfusion 619

24.4.2 Phyletische Profile 620

24.4.3 Analyse von Genfolgen 622

24.4.4 Performanz sequenzbasierter Methoden 623

24.5 Suche nach korrelierten Mutationen 624

24.5.1 Erzeugen sortierter MSA-Paare 624

24.5.2 Identifizieren korrelierter Mutationen 625

24.6 Vergleich phylogenetischer Bäume 627

24.6.1 Die Mirror-Tree-Methode 627

24.6.2 Korrektur des Hintergrundsignals 629

24.6.3 Ein alternativer Ansatz, der auf einem Nullmodell basiert 630

24.7 Vorhersage des Interaktoms der Hefe 631

24.8 Strukturbasierte Protein-Protein-Interaktionsvorhersagen 634

24.8.1 Vorhersagen basierend auf Strukturinformation 635

24.8.2 PrePPI: Integration zusätzlicher Merkmale 637

24.9 Netzwerkbasierte Protein-Protein-Interaktionsvorhersagen 640

Literatur 642

25 Big Data und Deep Learning: neue Herausforderungen und Möglichkeiten 645

25.1 Klassifikation mit Random Forests 647

25.1.1 Entscheidungsbäume 647

25.1.2 Berechnen der Topologie 649

25.1.3 RF-Algorithmus 652

25.1.4 Theoretische Klassifikationsleistung eines RFs 653

25.1.5 Problemlösungen für konkrete Anwendungen 654

25.1.6 Auswahl informativer Eigenschaften 655

25.1.7 Bioinformatische Anwendungen 657

25.2 Sequenzbasierte Vorhersage der Protein-3-D-Struktur 658

25.2.1 Experimentelle Proteinstrukturaufklärung 659

25.2.2 Berechnen von Co-Variationssignalen 660

25.2.3 PSICOV: Vorhersage räumlich benachbarter Residuenpaare 663

25.2.4 Vorhersage der 3-D-Struktur mithilfe von Kontaktinformation 665

25.2.5 Alternative Nutzung von Kopplungssignalen 665

25.3 Berechnen einer Feinstruktur großer Proteinfamilien 666

25.3.1 MCL: Clustern mithilfe stochastischer Matrizen 667

25.3.2 Cytoscape: Visualisierung von Netzwerkclustern 669

25.4 Positionierung von Nukleosomen 670

25.4.1 Chromatin und Nukleosomen 671

25.4.2 NucleoFinder: ein statistischer Ansatz zur Vorhersage von Nukleosomenpositionen 672

25.5 Auswertung großer Datensätze mit tiefen Lernverfahren 676

25.5.1 DL-basierte Vorhersage der Proteinstruktur 677

25.5.2 AlphaFold2 und RoseTTAFold 680

25.5.3 Erkennen von Translationsinitiationsstellen 683

25.5.4 DeepCpG bestimmt den Methylierungsstatus in einzelnen Zellen 684

25.6 Analyse des menschlichen Genoms mithilfe von ENCODE-Daten 686

25.6.1 Datentypen 687

25.6.2 Genome Browser 689

Literatur 692

26 Zum Schluss 699

26.1 Informatik in schwierigem Umfeld 699

26.2 Ungelöste Probleme und Herausforderungen 701

Literatur 704

Stichwortverzeichnis 705


Rainer Merkl war von 2004 bis zu seiner Emeritierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Nach seiner Promotion in Göttingen im Fach Genetik habilitierte er sich in Regensburg für das Fach Bioinformatik. Rainer Merkl war am Max Planck Institut für Biochemie, Martinsried und der Universität Göttingen tätig. Neben seiner Lehrtätigkeit in Regensburg für Biologen und Biochemiker bildete er an der Fernuniversität Hagen viele Jahre lang Informatiker im Fach Bioinformatik aus.

Rainer Merkl war von 2012 bis zu seiner Pensionierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Er hat biomedizinische Technik und Informatik studiert und war am Max-Planck-Institut für Biochemie in Martinsried und der Universität Göttingen tätig, wo er 1996 im Fach Genetik promoviert wurde. Im Jahre 2005 habilitierte er sich an der Universität Regensburg in Bioinformatik. Neben seiner Lehrtätigkeit für Biologen und Biochemiker bildete er an der Fernuniversität Hagen mehr als zehn Jahre lang Informatiker im Fach Bioinformatik aus.



Ihre Fragen, Wünsche oder Anmerkungen
Vorname*
Nachname*
Ihre E-Mail-Adresse*
Kundennr.
Ihre Nachricht*
Lediglich mit * gekennzeichnete Felder sind Pflichtfelder.
Wenn Sie die im Kontaktformular eingegebenen Daten durch Klick auf den nachfolgenden Button übersenden, erklären Sie sich damit einverstanden, dass wir Ihr Angaben für die Beantwortung Ihrer Anfrage verwenden. Selbstverständlich werden Ihre Daten vertraulich behandelt und nicht an Dritte weitergegeben. Sie können der Verwendung Ihrer Daten jederzeit widersprechen. Das Datenhandling bei Sack Fachmedien erklären wir Ihnen in unserer Datenschutzerklärung.