Bioinformatik erweitert Infrastruktur

Die Bioinformatik erweitert die Infrastruktur für Hochdurchsatz-Datenanalyse, künstliche Intelligenz und maschinelles Lernen um einen neuen GPU-Server.


Eine NVIDIA DGX-1 um genau zu sein.
Ein Server mit 8 x Volta 100 Karten und einer Rechenleistung von ca. 0,96 Petaflops bei FP16 (Half-precision floating-point format):

Yamata no Orochi:
System: NVIDIA DGX-1
OS: Ubuntu
CPU: 2x Intel Xeon E5-2698v4 (20 Core, 2,2GHz)
RAM: 512GB DDR4 LR
Festplatten: 4x 1,92TB SSD 
GPU: 8x NVIDIA Tesla V100 16GB NVLINK

Reportage2 v1

„Warum kauft man denn eine DGX-1?“
Die Antwort ist relativ einfach: Neuronale Netze lassen sich sehr gut parallelisieren.
Das heißt, dass man mit möglichst vielen Kernen ein neuronales Netz immer schneller trainieren kann. Der neue Rechner hat 40960 Kerne, ist also ziemlich schnell.

Dies ermöglicht neue Forschungsprojekte im Bereich der künstlichen Intelligenz sowie die Anwendung in Kursen und Praktika, wie zum Beispiel:

  • Integrative Analyse von Multi-Omics-Daten
  • Auswertung histopathologischer Schnitte mit Hilfe künstlicher Intelligenz
  • Design neuer Arzneistoffe
  • Klassifizierung metagenomischer Daten.



Bild des Benchmark der DGX-1
Quelle: https://www.nvidia.de/data-center/dgx-1/

Die DGX-1 erweitert unsere bestehende Serverinfrastruktur, die in Forschung und Lehre eingesetzt wird und aktuell ein Storage, zwei „normale“ Server und zwei GPU-Server umfasst.

Hier mal ein paar Spezifikationen:

Storage:
System: SuperMicro SuperChassis 826BE1C-R920LPB
OS: FreeNAS
CPU: Intel Xeon E5-2620v3 (6 Core, 2,4GHz)
RAM: 32GB DDR4
Festplatten: 12x 4TB + 2x 120GB SSD

DSC03208 v1

Hydra & Ladon:
System: SuperMicro SuperServer 4048B-TRFT
OS: Debian
CPU: 4x Intel Xeon E7-8867v3 (16 Core, 2,5GHz)
RAM: 2048GB DDR3 ECC LR
Festplatten: 4x 300GB + 3x 800GB SSD

Reportage v1

Medusa:
System: SuperMicro SuperServer 1028GQ-TRT
OS: Ubuntu
CPU: 2x Intel Xeon E5-2637v4 (4 Core, 3,5GHz)
RAM: 128GB DDR4 ECC
Festplatten: 2x 480GB SSD
GPU: 2x NVIDIA Tesla P100 16GB HBM2 PCIe 3.0


Wofür das Storage gut ist, sollte jedem Informatiker einleuchten, aber was machen diese beiden Server mit je 2TB RAM und 128 Threads?

Diese Hardware ermöglicht unseren Bioinformatikstudentinnen und -studenten die Auswertung großer Datensätze aus Biologie und Medizin für die ein normaler PC zu wenig Arbeitsspeicher und Rechenpower hätte.