Protein-Ligand Inverse Screening and its Application in Biotechnology and Pharmacology
,
Inverses Protein-Ligand Screening und dessen Anwendung in Pharmakologie und Biotechnologie
Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky
Erscheinungsjahr:
2014
Medientyp:
Text
Schlagworte:
Targetvorhersage
Targetvalidierung
inverses Screening
inverses Docking
Target prediction
target validation
inverse screening
inverse docking
004 Informatik
35.06 Computeranwendungen
54.64 Datenbanken
54.80 Angewandte Informatik
58.30 Biotechnologie
Computational chemistry
Screening
Arzneimitteldesign
Biotechnologie
Datensatz
Proteine
Ligand
ddc:004
Computational chemistry
Screening
Arzneimitteldesign
Biotechnologie
Datensatz
Proteine
Ligand
Beschreibung:
The thesis at hand presents the development of a new computational target prediction method. Small molecules are rarely only binding to a single protein, but can interact with numerous proteins, their targets. Ignorance of molecule-protein interactions can lead to various problems, wherein the most dangerous probably are side-effects evoked by drugs binding to so-far unknown off-targets. Resolving these problems is the aim of target prediction methods, which try to find all target proteins for small molecules. The iRAISE method developed in this thesis faces the special requirements of structure-based inverse screening which in comparison to normal screening (one protein, many ligands) predicts targets for one small molecule from large protein libraries. In order to account for the large amounts of protein structural data, iRAISE introduces a database representation for efficient and consistent handling and storing of protein data. Further, protein active sites and small molecules are in the first screening step abstracted by a descriptor representation. The chosen descriptor contains features encoding the interaction pattern and the shape of the active site/molecule. Thus, by matching complementary descriptors, the need for sequential protein-ligand matching on atomic level is avoided. Inter-target ranking has been improved compared to standard protein-ligand scoring functions, which mostly contain a bias towards certain protein structures. A multi-step Scoring Cascade considers the reference ligand as well as the coverage of the ligand and pocket, and thus allows the scoring of structurally diverse pockets. Moreover, a Gaussian-based scoring assesses the significance of a score. Along with the new target prediction method, an evaluation strategy with new data sets has been developed. The evaluation of binding mode prediction, target ranking and running time shows promising results for iRAISE. Further, structure-based computational methods were successfully applied in a biotechnological case study of the development of a synthetic multi-enzyme pathway, highlighting the application potentials of these methods in areas besides drug design where their use is already established.
Die vorliegende Arbeit präsentiert die Entwicklung einer neuen, computergestützen Methode zur Zielproteinvorhersage. Kleine organische Moleküle binden nur selten an ein einziges Protein, sondern interagieren mit einer Reihe von verschiedenen Proteinen, sogenannten Zielproteinen oder Targets. Dies kann zu verschiedenen Problemen führen, wobei vermutlich die verheerendsten die Nebenwirkungen von Medikamenten sind, welche durch Bindung von Wirkstoffen an Off-Targets entstehen. Aus diesem Grund versuchen Target-Vorhersagemethoden alle Zielproteine für kleine Moleküle zu identifizieren. Die in dieser Arbeit entwickelte Methode iRAISE behandelt die speziellen Anforderungen an strukturbasiertes inverses Screening, bei welchem im Gegensatz zum normalen virtuellen Screening (ein Protein, viele Moleküle) potentielle Targets für ein Molekül in großen Mengen von Proteinen gesucht werden. Die großen Datenmengen von zehntausenden von Proteinstrukturen werden in iRAISE in einer neu entwickelten Datenbank effizient und konsistent gespeichert. Außerdem werden sowohl Protein- als auch Ligandstrukturen im ersten Screening-Schritt durch einen Deskriptor abstrahiert. Der gewählte Deskriptor repräsentiert sowohl das Interaktionsmuster als auch die Form von Protein und Ligand. Indem die Deskriptoren auf Komplementarität getestet werden, erübrigt es sich, jeden Ligand sequenziell gegen jedes Protein auf atomarer Basis zu testen. Des Weiteren wurde das Ranking von Targets durch innovative Maßnahmen verbessert, um einen Bias bezüglich bestimmter Proteinstrukturen zu beheben, der häufig bei Bewertungsfunktionen für ’normales’ Protein-Ligand Docking besteht. Die sogenannte Scoring Cascade besteht aus mehreren Bewertungsstufen, welche neben der Berücksichtigung des Referenzliganden die Abdeckung des Liganden und des aktiven Zentrums betrachtet. Dies ermöglicht die Bewertung von strukturell diverser Taschen ohne Bias. Zusätzlich wurde eine Gauß-basierte Bewertung eingeführt, welche die Beurteilung der statistischen Signifikanz eines Scores erlaubt. Zusammen mit der inversen Screening-Methode wurden eine neue Evaluierungsstrategie mit Evaluierungsdatensätzen entwickelt. Insgesamt erzielt iRAISE auf Basis von Bindemodusvorhersagen, Target-Ranking und Laufzeit vielversprechende Ergebnisse. Darüber hinaus wurden im Rahmen dieser Arbeit strukturbasierte, computergestützte Methoden in einem biotechnologischen Projekt erfolgreich eingesetzt, in welchem ein synthetischer Multienzym-Stoffwechselpfad entwickelt wurde. Dies hebt die Potentiale der Methode in einem weiteren Anwendungsfeld neben dem Feld der Wirkstoffentwicklung, in welchem die Nutzung dieser Methoden schon etabliert ist, hervor.