Out of the Black Box

Was Künstliche Intelligenz über Proteine verrät

16. Mai 2019, 13:00 Uhr | Berlin Institute of Health (BIH)
»Schau mir in die Augen Protein«
© Designed by Freepik*

Forscher haben ein Neuronales Netzwerk entwickelt, das vorhersagen kann, welche Funktion ein Protein im Körper erfüllt. Die Erkenntnisse könnten für die Entwicklung von zielgerichteten Medikamenten hilfreich sein.

Alexa, Siri und Google Assistant sind als maschinelle Begleiter längst in den Alltag eingezogen. Und auch aus der Wissenschaft sind die Algorithmen, nicht mehr wegzudenken. Die großen Datenmengen, die in der biowissenschaftlichen Forschung auftreten, können mit ihrer Hilfe effizient auf wiederkehrende Muster untersucht werden. So können bestimmte Programme zum Beispiel erkennen, welche wiederkehrenden Strukturen in großen Eiweißmolekülen auftreten und daraus Rückschlüsse ziehen, welche Aufgaben diese in Zellen übernehmen, ob sie etwa als Genschalter, molekularer Motor oder als Signalmolekül aktiv sind. Die Vorhersagen, die solche Algorithmen auf Basis von Proteinsequenzen, also der perlenkettenartigen Abfolge von Proteinbausteinen, treffen, sind mittlerweile erstaunlich genau.

Ein entscheidender Nachteil bisheriger Verfahren ist allerdings, dass für Nutzer in keiner Weise nachvollziehbar ist, warum der Algorithmus bestimmten Proteinsequenzen eine bestimmte Funktion zuordnet. Das präzise Computerwissen über Proteine ist nicht direkt abrufbar, obwohl dieses Wissen für die Forschung als auch die Entwicklung von Wirkstoffen von großem Wert wäre.

Ein studentisches Team um Roland Eils und Irina Lehmann vom Berlin Institute of Health (BIH) und der Charité–Universitätsmedizin Berlin und ihrem Kollegen Dominik Niopek vom Institut für Pharmazie und Molekulare Biotechnologie (IPMB) an der Universität Heidelberg hat es sich zum Ziel gesetzt, dem Computer dieses Wissen zu entlocken. Es arbeitet bereits seit 2017 an diesem Thema und entwickelte den Algorithmus »DeeProtein«, ein umfangreiches, intelligentes Neuronales Netzwerk, das die Funktion von Proteinen vorhersagen kann, basierend auf der Abfolge der einzelnen Proteinbausteine, der Aminosäuren. Wie die meisten lernenden Algorithmen ist auch DeeProtein eine »Black Box«, wie es arbeitet, bleibt sowohl den Entwicklern als auch den Anwendern verborgen. Doch mit einem Trick gelang es nun, dem Netzwerk dieses Geheimnis zu entlocken.

Intoleranten Proteinen auf der Spur

Zunächst entwickelte das Team eine Möglichkeit, dem Programm während der Arbeit quasi über die Schulter zu schauen: »Bei der Sensitivitätsanalyse verdecken wir nacheinander jede einzelne Position in der Eiweißsequenz und lassen DeeProtein aus dieser lückenhaften Information die Funktion des Eiweißes berechnen bzw. vorhersagen«, erläutert Julius Upmeier zu Belzen vom IPMB. Im Anschluss geben er und die anderen Wissenschaftler DeeProtein die vollständige Sequenzinformation und vergleichen die beiden Vorhersagen. »So berechnen wir für jede einzelne Position in der Proteinsequenz, wie wichtig diese für die korrekte Vorhersage der Funktion ist. Das heißt, wir geben jeder Position beziehungsweise Aminosäure innerhalb der Proteinkette einen Sensitivitätswert für die Proteinfunktion«.

Dieses neue Analyseverfahren nutzten die Wissenschaftler anschließend dazu, diejenigen Bereiche in Proteinen zu identifizieren, die für ihre Funktion entscheidend sind. Das funktionierte für Signalproteine, die während der Krebsentstehung eine Rolle spielen, ebenso wie für die CRISPR-Cas9 Genschere, die bereits vielfach in präklinischen und klinischen Studien getestet wird. »Mit der Sensitivitätsanalyse können wir Bereiche in Proteinen identifizieren, die Veränderungen besser oder weniger gut tolerieren. Das ist ein wichtiger erster Schritt, wenn wir Proteine gezielt verändern möchten, um ihnen neue Funktionen zu übertragen oder unerwünschte Eigenschaften auszuschalten«, sagt Dominik Niopek.

»Mit dieser Arbeit zeigen wir, dass nicht nur die Vorhersagen von neuronalen Netzwerken hilfreich sein können, sondern dass wir nun auch erstmals ihr implizites Wissen praktisch nutzen können«, so Elis. Dieser Ansatz ist für viele Fragestellungen in Molekularbiologie und Medizin relevant. »Wenn wir zum Beispiel zielgerichtete Medikamente oder Gentherapien entwickeln möchten, müssen wir genau wissen, an welcher Stelle wir ansetzen können. Dabei kann uns nun DeeProtein unterstützen.«

Originalpublikation:

Upmeier zu Belzen et al. (2019): Leveraging implicit knowledge in neural networks for functional dissection and engineering of proteins. Nature Machine Intelligence.
DOI: 10.1038/s42256-019-0049-9

 

(me)

*Designed by Freepik


Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu elektroniknet