Das primäre Ziel der Forschung am Institut
ist es, menschliche Krankheiten besser zu verstehen. Der Fokus liegt dabei auf Erkrankungen des zentralen Nervensystems. Um dieses Ziel zu erreichen, müssen große Mengen heterogener biomedizinischer Daten überprüft und miteinander integriert werden. Wir entwickeln dafür unsere eigenen Systeme, die diese Aufgaben soweit wie möglich automatisieren. Auf Grundlage der integrierten Daten können wir mithilfe von statistischen Verfahren und maschinellem Lernen Informationen extrahieren, die für die untersuchten Krankheiten relevant sind. Die gewonnenen Informationen werden dann weiter ausgewertet, um unser Verständnis der Erkrankungen zu verbessern und darüber hinaus Risikofaktoren zu entdecken und möglicherweise Heilungsmöglichkeiten zu finden.
“Wir ertrinken in Informationen, aber das stillt unseren Hunger nach Wissen nicht” - John Naisbitt
Wissensdatenbanken: Neue Technologien ermöglichen es innerhalb weniger Stunden tausende bis zehntausende von quantitative Messungen durchzuführen. Trotz dieses Datenreichtums sind wir noch weit davon entfernt viele komplexe Erkrankungen zu verstehen. Es stellt sich daher die Frage, warum diese großen Datenmengen nicht genug sind, um zu verstehen, welche Vorgänge im menschlichen Körper bei Erkrankungen ablaufen.
Wir sind überzeugt davon, dass große Datenmengen für die Analyse von Erkrankungen notwendig sind. Wir sehen aber auch wesentliche Probleme in der Integration, Vergleichbarkeit und der Neuverwendung von Daten aus verschiedenen Quellen. Wir befassen uns damit diese Probleme zu lösen und intelligente Wissensdatenbanken aufzubauen, die über semantische Annotationen strukturiert und standardisiert Abfragen von Daten erlauben. Wir erstellen Softwaresysteme, die automatisiert große biologische Datenmengen extrahieren, transformieren, normalisieren und analysieren. Das ermöglicht es uns hunderte Krankheiten gleichzeitig zu betrachten und miteinander zu vergleichen. Dabei können Vergleiche auf genomischer, epigenomischer, transkriptomischer und proteomischer Ebene gezogen werden. Ebenso können Alter, Geschlecht und Medikationsstatus berücksichtigt werden.
“Es erscheint wahrscheinlich, dass, sobald die Maschinen angefangen haben zu denken, es nicht lange dauern wird, bis sie unsere schwachen Denkkräfte überflügeln," - Alan Turing
Maschinelles Lernen (Machine Learning): Um Erkenntnisse aus unserer Wissensdatenbank zu extrahieren, nutzen wir Methoden der statistischen Inferenz und des maschinellen Lernens. Dabei kommen sowohl einfache Verfahren des maschinellen Lernens zum Einsatz, als auch Deep-Learning Methoden. Diese Methoden werden benutzt, um einerseits Krankheiten aus Daten zu klassifizieren und vorherzusagen und andererseits um zu verstehen, wie menschliche Krankheiten entstehen und welche Mechanismen dabei im Detail eine Rolle spielen. Insbesondere im letzten Fall nutzen wir "Convolutional Neural Networks" und "Recurrent Neural Networks", um Faktoren zu extrahieren und Modelle zu generieren, die diese Faktoren berücksichtigen. Diese Modelle können später genutzt werden, um Krankheiten modellhaft wiederzugeben und Therapien zu simulieren. Durch unsere Forschung können andere medizinische Forscher und pharmazeutische Entwickler ein besseres Verständnis von Erkrankungen und Heilungsansätzen bekommen.