Künstliche Intelligenz und Big Data: Wer entscheidet, welche Daten zählen?
09.11.2021
Am 16. November spricht LMU-Statistikerin Frauke Kreuter bei den KI Lectures darüber, wie riesige Datenmengen für KI-Anwendungen genutzt werden.
09.11.2021
Am 16. November spricht LMU-Statistikerin Frauke Kreuter bei den KI Lectures darüber, wie riesige Datenmengen für KI-Anwendungen genutzt werden.
2020 wurden weltweit rund 64 Trillionen Gigabytes an Daten generiert und weiterverarbeitet. Der Informationsgehalt: unvorstellbar. Kein Wunder also, dass das Geschäft mit Big Data zu einer Milliarden-Industrie geworden ist. Daten sind die Grundlage für KI-Anwendungen und der Schlüssel zu Technologien, die den Alltag revolutionieren – von GPS-Navigation bis hin zur Automatisierung von Verwaltungs- und Unternehmensprozessen.
In ihrer KI Lecture skizziert Frauke Kreuter aktuelle Entwicklungen bei der Nutzung von KI und Big Data in der Wirtschafts- und Sozialforschung. Sie erläutert, welche Fallstricke es bei der Anwendung gibt und wie die Wissenschaft Fragen rund um Ethik und Privatsphäre in den Griff bekommen kann, ohne auf Reproduzierbarkeit und Nachnutzung von Daten verzichten zu müssen.
Prof. Dr. Frauke Kreuter: „Wer entscheidet, was zählt? KI und Big Data: Anwendungen in wirtschafts- und sozialwissenschaftlicher Forschung“
Dienstag, 16. November 2021, von 18:15 – 19:45 Uhr
Zur Anmeldung
Weitere Informationen über die „KI Lectures“ finden Sie hier.
Kontakt: ringvorlesung-lmu@lmu.de
Welche Anwendungsbereiche für Künstliche Intelligenz sehen Sie in Ihrem Feld?
Frauke Kreuter: Künstliche Intelligenz findet bereits in der Verwaltung bei vielen Prozessen Anwendung. Die Bundesagentur für Arbeit zum Beispiel setzt sie ein, um Diplome, Lebensläufe und andere Dokumente zu prüfen. In Österreich gab es bereits eine Initiative, bei der Algorithmen auf Basis historischer Daten Aufschluss darüber geben sollten, welche Arbeitssuchenden die besten Chancen haben, wieder in den Arbeitsmarkt eingegliedert zu werden.
Wie bewerten Sie diese Entwicklung: Sollten individuelle Schicksale in die Hände von Algorithmen gelegt werden?
Frauke Kreuter: An dieser Stelle sollten wir uns eher fragen, ob der Status quo tatsächlich besser ist. Menschen machen Fehler und lassen sich von Soft Skills ihres Gegenübers oder eigenen Vorurteilen beeinflussen. Es gibt interessante Forschung dazu, wie Entscheidungen getroffen werden. Dabei spielen unterschiedliche Faktoren eine Rolle: Ob die Entscheidung morgens oder abends getroffen wird, wie viele Entscheidungen davor schon getroffen werden mussten. All das führt zu unterschiedlichen Ergebnissen und manchmal auch zu Diskriminierung. Die Hoffnung ist zunächst, dass man durch die Automatisierung von Verfahren menschliche Fehler ausmerzen kann und das wiederum zu mehr Chancengleichheit führt.
Die Realität ist: Daten sind eine wertvolle Ressource und wir sind an einem Punkt, an dem ganze administrative Systeme daraus aufgebaut werden. Die Frage ist nun: Wie macht man sie besser?Frauke Kreuter
Man muss aber auch sagen: KI-Systeme sind in dieser Hinsicht noch nicht perfekt. Historische Daten, mit denen sie trainiert werden, enthalten oftmals veraltete Muster, die nicht mehr zu einer modernen, sich verändernden Welt passen. Wenn ein Algorithmus zum Beispiel lernt, dass seit Jahrzehnten bestimmte Positionen von weißen Männern mittleren Alters ausgefüllt werden, wird er diesen Positionen etwa bei der Bewerberauswahl auch weiter weiße Männer zuordnen wollen. Solche Probleme sind allerdings lösbar. Algorithmen können dahingehend trainiert werden, dass sie jüngere Daten stärker gewichten, oder man kann ihnen vereinzelt eine Zufallskomponente hinzufügen.
KI-Anwendungen nähren sich von Daten. Je mehr, desto besser. Müssen wir unsere Einstellung zum Datenschutz ändern, damit sich KI weiterentwickeln kann?
Frauke Kreuter: Unvollständige Datensätze sind eine große Gefahr für KI-Prozesse. So wie die DSGVO derzeit gestrickt ist, liegt die Entscheidung in den meisten Fällen bei Einzelpersonen, wie sie mit ihren Daten umgehen wollen. Bereits das kann aber zu Ungleichgewichten in der Datenlage führen. Abhängig von ihrem technischen Verständnis sind bestimmte Personengruppen eher geneigt oder abgeneigt, ihre Daten zu teilen. Algorithmen werden auf diese Art vorrangig für Personen optimiert, die an der Entstehung des Datenstroms teilhaben.
In diesem Zuge sollten wir in Deutschland unsere Grundeinstellung zu Daten überdenken. Einerseits braucht es an allen Stellen, wo Daten produziert werden, ein Bewusstsein dafür, dass sie von guter Qualität und verlässlich sein müssen. Auf der anderen Seite braucht es seitens der Gesetzgebung ein Bewusstsein dafür, dass Daten verwendet und geteilt werden können – dass keine kommerziellen Monopole einiger Technologieunternehmen mehr bestehen. Die Realität ist: Daten sind eine wertvolle Ressource und wir sind an einem Punkt, an dem ganze administrative Systeme daraus aufgebaut werden. Die Frage ist nun: Wie macht man sie besser?
Prof. Dr. Frauke Kreuter ist Inhaberin des Lehrstuhls für Statistik und Data Science in den Sozial- und Humanwissenschaften und Co-Direktorin der Data Science Center an der University of Maryland und der Universität Mannheim.