Anwendungen von Maschinelles Lernen in der Biologie

Blog. Tauchen Sie ein in die AI-Welt

Künstliche Intelligenz schafft Fortschritt

KI-Algorithmen vereinfachen Ihre Vorgänge in der Bioinformatik und lösen Probleme dort, wo Sie nicht weiterkommen.

Krzysztof Udycz

Krzysztof Udycz
Ai Engineer
11. Januar 2021

Wann und warum hat das alles begonnen?

Ende der 1980er Jahre begann das internationale Forschungsprojekt mit dem Namen Human Genome Project (HGP). Das Hauptziel des HGP bestand darin, eine vollständige Sequenz des menschlichen Genoms zu erhalten und alle menschlichen Gene sowohl in physischer als auch in funktioneller Hinsicht zu identifizieren. Im Jahr 2003 wurde nach mehrjähriger Arbeit der Erfolg des Projekts und die Fertigstellung der allerersten Sequenzierung des menschlichen Genoms bekannt gegeben. Das Humangenomprojekt hat in vielen Bereichen Vorteile gebracht, z.B. hat es zur raschen Entwicklung der Genomforschung und damit zur Generierung von immer mehr biologischen Informationen beigetragen.

Bioinformatik als Sprungbrett für eine rasche Entwicklung

Ohne eine ordnungsgemäße Analyse enthalten die Daten selbst keine Informationen, und daher ist es unmöglich, auf ihrer Grundlage Thesen und Schlussfolgerungen zu formulieren. Eine manuelle Auswertung solcher Datenmengen ist in der Praxis nicht möglich, weshalb wir von einem Wissenschaftsgebiet unterstützt werden, das Biologie und Informatik vereint – der Bioinformatik.

Bioinformatik: Was ist das genau?

AI and Bilogy

Das National Center for Biotechnology Information (NCBI) definiert Bioinformatik als das interdisziplinäre Wissenschaftsgebiet, in dem Biologie, Informationstechnologie und Informatik miteinander verschmelzen, um neue biologische Entdeckungen und Einsichten zu ermöglichen und auch dazu beizutragen, eine globale Perspektive zu schaffen, aus der die Prinzipien der Biologie identifiziert werden können.

Das Hauptziel der Bioinformatik besteht darin, das Verständnis biologischer Prozesse auf molekularer Ebene zu verbessern

Um es einfach auszudrücken: Das Hauptziel der Bioinformatik besteht darin, das Verständnis biologischer Prozesse auf molekularer Ebene zu verbessern, indem Algorithmen und Werkzeuge entwickelt werden und diese Algorithmen und Werkzeuge dann angewandt werden, um biologisches Wissen zu generieren und zu interpretieren.

Wie kann Ihnen Künstliche Intelligenz in der Bioinformatik helfen?

Anwendungsbeispiele

bioinformatik

Biologische Daten sind sehr heterogen und komplex, z.B. können vier verschiedene Ebenen von Proteinen definiert werden. Jede dieser Ebenen lässt sich vereinfacht zu einer Primärstruktur, d.h. einer Aminosäuresequenz, zusammenfassen. Die Interaktionen, die die Proteinstruktur bilden und aufrechterhalten, finden sowohl innerhalb jeder Ebene als auch zwischen ihnen statt. Wir können uns nur vorstellen, wie komplex die Struktur des Proteinmoleküls ist!

An diesem Punkt kommt uns die künstliche Intelligenz zu Hilfe. Sie hat die Fähigkeit, sich bestimmte Muster und Informationen zu merken, und verwendet dann die erlernten Muster für neue Daten – aus diesem Grund ist sie ein ideales Werkzeug, das die Bioinformatik unterstützt. Das maschinelle Lernen ist auch bei der Analyse riesiger Datensätze sehr hilfreich und erlaubt menschliche Fehler zu reduzieren oder sogar ganz zu eliminieren.

Das maschinelle Lernen wurde in vielen verschiedenen biologischen Bereichen angewandt, wie z.B. Genomik, Proteomik, Phylogenetik, Systembiologie, Text Mining, Microarray-Datenanalyse und anderen Bereichen, die Primerdesign, Bildanalyse (Computer Vision) und experimentelles Datenmanagement umfassen.

Abbildung 1. Anwendungen von künstlicher Intelligenz in verschiedenen Bereichen der Biologie.
Anwendung von KI in Bilogie-Bereiche

Quelle: Varma, D & Devarapalli, Dharmaiah & Tech, M. (2012). Comparitive Analysis Of Classification Algorithm In Multiple Categories Of Bioinformatics. International Journal of Engineering and Technical Research. 1. 2012.

Modelle des maschinellen Lernens können zur Lösung vieler bioinformatischer Probleme eingesetzt werden, z.B:

  • Bestimmung der Ähnlichkeit von Sequenzen – Vergleich von DNA-, RNA-, Proteinsequenzen
  • Bestimmung der phylogenetischen Ähnlichkeit (Verwandtschaft) zwischen Sequenzen – Phylogenetische Baumkonstruktion
  • Muster-/Motiv-Identifikation – Identifikation von Genen, Introns, Alpha-Helix
  • Microarray-Datenanalyse – Bestimmung der Genexpressionsebene
  • Molekulare Modellierung und Docking – Herausfinden, wie zwei oder mehr molekulare Strukturen zusammenpassen
  • Merkmalsauswahl – Biologische Daten sind hochgradig dimensional und nicht alle davon tragen Informationen, daher ist es notwendig, die für Berechnungen verwendete Datenmenge zu begrenzen; verwendet in der COVID-19-Evolution-Analyse
  • Bestimmung der räumlichen Strukturen des Proteins
  • Gen-basiertes Clustering -Unterteilung in Gruppen, die für eng verwandte Proteine kodieren

Die Bilderkennung (Computer Vision), eine der Techniken der künstlichen Intelligenz, wird auch in der Bioinformatik eingesetzt. Sie wird eingesetzt in:

  • Segmentierung – z.B. Venen- und Knochensegmentierung
  • Quantifizierung – z.B. Anzahl mitotischer Zellen bei Brustkrebs
  • Lokalisation – z.B. Bestimmung der Lokalisation der fokalen kortikalen Dysplasie (FCD) im Gehirn
  • Computergestützte Diagnose
  • Gestenerkennung – z.B. Schätzung der Handhaltung zur Erkennung und Überwachung von Bewegungsstörungen, wie z.B. der Parkinson-Krankheit

Die zunehmende Datenmenge macht es notwendig, nach immer neueren Techniken für die effiziente Analyse und Interpretation einer riesigen Menge komplexer biologischer Daten zu suchen.  An diesem Punkt kommt uns Maschinelle Lernen zu Hilfe.

Es bewältigt die Auswertung von Versuchsergebnissen mit Leichtigkeit und ist auch gegen häufige menschliche Fehler resistent!

Ein zusätzlicher Vorteil der künstlichen Intelligenz ist die Tatsache, dass sie neben der Biologie in vielen Bereichen unseres Lebens eingesetzt wird, wie zum Beispiel in der Rechts- und Finanzwissenschaft, in der Technik oder im Sicherheitsbereich.

Wir helfen Ihnen tiefer in das Thema einzusteigen und erste
Proof of Concepts zu erstellen.

Vereinbaren Sie einen Termin