Kompetenzen und souveräne Infrastruktur: Wie mit Data Science erfolgreiche KI entsteht

Künstliche Intelligenz (KI) ist die nächste Stufe der Digitalisierung und verspricht großen Nutzen für Wirtschaft und Gesellschaft. Grundlage für erfolgreiche KI-Anwendungen sind Daten. Um die Potenziale von Künstlicher Intelligenz auszuschöpfen, braucht es ein umfassendes Datenmanagement, das die vorliegenden Daten überhaupt erst zugänglich macht. Ein aktuelles Whitepaper der Plattform Lernende Systeme zeigt die Bedeutung des interdisziplinären Forschungszweigs Data Science als Schlüsseldisziplin für Wissenschaft sowie Wirtschaft und benennt Handlungsoptionen. Die Experten regen an, Kenntnisse des Datenmanagements auch in informatikfernen Studiengängen und in der Schule zu vermitteln und empfehlen eine unabhängige Dateninfrastruktur.

Whitepaper zum Download

Ob medizinische Assistenzsysteme, autonome Fahrzeuge oder die vorausschauende Wartung von Industrieanlagen – sie alle werten in kurzer Zeit Daten aus, die heute in unglaublichen Mengen zur Verfügung stehen. Data Science-Methoden machen all diese KI-Anwendungen erst möglich. Sie gelten außerdem als Wegbereiter für die wissenschaftlichen Erkenntnisse in vielen datenintensiven Forschungsfeldern wie der Klimaforschung, der Astronomie oder der Chemie.

„Wenn Daten der Rohstoff des digitalen Zeitalters sind, dann ist Data Science das Werkzeug, mit dem sich dieser Schatz heben lässt “, sagt Co-Autor Daniel Keim, Professor für Datenanalyse und Visualisierung der Universität Konstanz und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme. „Große Datenmengen allein reichen nicht aus, um KI-Anwendungen zu entwickeln. Zuvor müssen die Daten für das Training von lernenden Algorithmen erst vorbereitet, ihre Validität geprüft und die Daten zugänglich gemacht werden. Dafür brauchen wir ein umfassendes Datenmanagement inklusive fortgeschrittener Möglichkeiten zur Visualisierung der Daten. Das wird in der Diskussion um Künstliche Intelligenz leider oft zu wenig beachtet.“

Insbesondere das Erschließen der Daten und die Sicherstellung der Datenqualität sei häufig ein aufwändiger Prozess, heißt es im Whitepaper. So werde für KI-Projekte der Aufwand für die Datenerfassung und -aufbereitung auf bis zu 80 Prozent geschätzt. Die Ergebnisse und Empfehlungen von KI-Systemen können nur so gut sein wie die ihnen zugrunde liegenden Daten. Fehlerhafte Werte müssen zum Beispiel erkannt und entfernt, Daten annotiert und – um sie nachvollziehbar zu machen – durch Metadaten beschrieben werden. Neben Aspekten wie Vollständigkeit oder Widerspruchsfreiheit sollte auch bereits bei der Datenauswahl auf mögliche Verzerrungen geachtet werden, um etwa Diskriminierung zu vermeiden. Eine Software zur Bewertung von Job-Kandidatinnen und -kandidaten darf nicht nur mit den Daten erfolgreicher Bewerber der Vergangenheit trainiert werden. Wenn diese überwiegend männlich waren, wird das KI-System in seinen Empfehlungen auch in Zukunft weibliche Kandidatinnen schlechter stellen.

Expertise und Data Literacy

Data Scientists benötigen daher nicht nur Fähigkeiten im Datenmanagement, des Maschinellen Lernens, der Statistik und der Visualisierung, sondern auch Kenntnisse zu Ethik und Recht, um mit den Daten verantwortungsvoll umzugehen. „Dies zeigt schon, dass es sich nicht mehr allein um klassische Softwareentwicklung handelt. Vielmehr sind dies Anforderungen, die einen interdisziplinären Zugang erfordern: Anwendungsexpertinnen und -experten benötigen zunehmend sogenannte Data Literacy-Expertise und Data Science-Fachleute müssen auch die Anwendungsdomänen verstehen. Hier wird sich sicher ein großer Bedarf an Weiterbildungsangeboten entwickeln“, sagt Co-Autor Kai-Uwe Sattler, Professor für Datenbanken und Informationssysteme an der TU Ilmenau und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme.

Der Beruf des Data Scientists gelte als einer der wichtigsten Berufe, heißt es in dem Whitepaper. Zudem würden Data Science-Kompetenzen heute schon in vielen anderen Berufsbildern gefordert. So empfehlen die Autoren, der Data Science in Informatikstudiengängen mehr Raum zu geben. Um das Verständnis von Data Science-Prozessen und -Technologien zu fördern, sollten aber auch andere Studiengänge und Schulen Data Literacy-Kompetenzen vermitteln. Über die Forschung hinaus sei dies die Grundlage, um Talente auszubilden, die schließlich KI-Wissen in die Unternehmen tragen und dort den Transfer in die Anwendung unterstützen könnten, so die Autoren. An welchen Hochschulen Interessierte Studiengänge rund um KI und Data Science finden, zeigt die KI-Landkarte der Plattform Lernende Systeme.

Neben der Aus- und Weiterbildung ist nach Ansicht der Autoren eine unabhängige Infrastruktur mit ausreichend Speicher- bzw. Rechenkapazität notwendig, um das Potenzial der Daten für Wirtschaft und Gesellschaft abschöpfen zu können. Man dürfe sich nicht zu einer unreflektierten Übernahme von scheinbar erfolgreichen Modellen der Internet-Konzerne verführen lassen. Um die Prozesse des Datenmanagements eigenständig gestalten zu können, sei ein Ausbau von europäischen Datenräumen und -infrastrukturen notwendig, raten die Autoren.

Über das Whitepaper

Das Whitepaper „Von Daten zu KI. Intelligentes Datenmanagement als Basis für Data Science und den Einsatz Lernender Systeme“ wurde von Expertinnen und Experten der Arbeitsgruppe Technologische Wegbereiter und Data Science der Plattform Lernende Systeme erarbeitet. Es steht hier zum kostenfreien Download zur Verfügung.

Weitere Informationen:

Linda Treugut / Birgit Obermeier
Presse- und Öffentlichkeitsarbeit
Lernende Systeme – Die Plattform für Künstliche Intelligenz
T.: +49 89/52 03 09-54 /-51
M.: +49 172/144 58-47/-39
presse@plattform-lernende-systeme.de

Zurück