Aus dem Kurs: Data Science – Grundlagen

Künstliche Intelligenz

Wenn Menschen heute an Data Science denken, kommt ihnen unweigerlich Künstliche Intelligenz in den Sinn, oft in Gestalt humanoider Roboter, die tief in Gedanken versunken sind. Bevor ich Data Science und KI vergleiche und einander gegenüberstelle, will ich etwas über die Natur von Kategorien und Definitionen sagen. Erstens: Kategorien sind Konstrukte, das heißt, sie sind etwas, das man unterstellt, etwas, das im Kopf erschaffen wurde und nicht wirklich existiert. Das ist wie bei der Frage: Wann ist etwas Comedy, wann ist es Performancekunst und wann ist es Schauspiel? Es gibt keine klare Trennung zwischen diesen Dingen. Es gibt nur gedankliche Kategorien, wie jede Kategorie oder Definition, einschließlich der von Data Science und KI. Zweitens dienen Kategorien funktionalen Zwecken. Alles, womit man einen Brief öffnet, ist ein Brieföffner. Ich für meinen Teil nehme dazu ein Messer. Ich kenne aber eine Familie, die Eiscreme ausschließlich mit Messern portioniert. Der Einsatzzweck bestimmt das Werkzeug. Der Einsatzzweck ist gleich dem Werkzeug. Es wird durch die Anwendung definiert, genau wie Kategorien. Auch variiert die Nutzung von Kategorien nach dem Bedarf. Bücher können Sie nach der Library of Congress Classification oder dem Dewey-Dezimalsystem ins Regal räumen. Ich kenne Leute, die sie nach Größe oder Farbe ordnen oder als Dekoration nutzen. Alle diese Optionen funktionieren, weil sie verschiedenen Zwecken dienen. Wenn wir also versuchen, Kategorien zu bilden und zu definieren, ob eine Aktivität KI ist oder Data Science, dann gelten ebenfalls alle diese Prinzipien. Ein gutes Beispiel ist die Frage, ob Tomaten Früchte oder Gemüse sind. Jeder weiß, dass Tomaten eigentlich Früchte sind, aber niemand würde Tomaten in einen Obstsalat mischen. Tomaten liegen neben Möhren und Sellerie auf dem Salatteller. Die Antwort auf diese paradoxe Stellung zwischen Frucht und Gemüse ist einfach. Frucht ist ein botanischer Begriff und Gemüse ist ein Begriff aus der Küche. Das sind keine parallelen oder auch nur koordinierten Systeme von Kategorien und das stiftet Verwirrung. Das ist ein bisschen wie der Witz über die Kneipe, in der sowohl Country als auch Western läuft. Die Kategorien sind oft weder logisch noch schließen sie sich aus, und ebenso ist es mit KI und Data Science. Und was genau ist Künstliche Intelligenz? Dazu existieren viele verschiedene Aussagen und keine davon gilt als die einzig Wahre. Manche finde ich nützlich, andere finde ich weniger nützlich. Ein Witz sagt, mit KI ist alles gemeint, was Computer nicht tun können. Natürlich lernen Computer neue Dinge, aber sobald ein Computer weiß, wie etwas getan wird, sagen die Leute, das ist keine Intelligenz, nur eine Maschine, die etwas macht. Diese Definition, die auf das abhebt, was Computer eben nicht können, ist eine Art bewegliches Ziel. KI wird auch anhand von Arbeiten beschrieben, die normalerweise Menschen tun. Wie etwa einen Anruf tätigen und einen Termin machen. Oder eine E-Mail zurücksenden oder Text kategorisieren. Traditionell haben Menschen das getan, aber wenn eine Maschine es kann, wenn ein Programm es kann, ist das wahrscheinlich ein gutes Beispiel für Künstliche Intelligenz. Die wohl einfachste und beste Definition lautet: Künstliche Intelligenz sind Programme, die von Daten lernen. Sie geben Daten ein, das Programm erstellt ein Modell und passt dieses Modell mit der Zeit an. Ein gängiges Beispiel ist so etwas wie das Kategorisieren von Fotos. Zeigt das Bild ein Pferd, ein Auto, einen Ballon, eine Person? Programme lernen das, indem sie zuerst viele, viele, viele Fotos erfassen, die von Menschen markiert wurden, sei es als Katze oder Hund oder irgendetwas anderes. Der Algorithmus abstrahiert die Elemente des Bildes, die am besten auf eine Katze oder einen Hund passen, und lernt dann selbstständig. Das wird auch zur Übersetzung von einer Sprache wie Englisch in eine andere wie Deutsch genutzt. KI-Anwendungen haben enorme Fortschritte in der Fähigkeit von Computern, das automatisch zu tun, ermöglicht. Das gilt auch für Spiele wie Go. Es war eine große Sache, als ein Computer vor nicht allzu langer Zeit den Weltmeister in Go schlug. Man hielt das für ein Spiel, das Intuition erfordert und sich nicht erklären lässt. Faszinierend daran ist, dass sich der Computer selbst beibrachte, Go zu spielen. Wir werden in einem anderen Video noch darüber sprechen, wenn wir die Ableitung von Regeln erklären. Alle drei sind gute Beispiele für Künstliche Intelligenz, einfach durch die Art der Dinge, die ein Computer tun kann. Daher ist dies wohl die beste Definition von KI. Sie deckt zwar auch einfache Regressionsmodelle ab, die gar nicht viel Rechenleistung benötigen, bezieht sich aber normalerweise auf zwei Ansätze. KI meint meistens Algorithmen für Maschinelles Lernen, vor allem neuronale Netze für Deep Learning. Von diesen werde ich an anderer Stelle noch sprechen. Hier will ich jedoch eine weitere wichtige Unterscheidung in Bezug auf KI erwähnen. Und zwar den Unterschied zwischen sogenannter starker oder allgemeiner KI, also der Idee, man könne eine Kopie des menschlichen Gehirns bauen, die jede Denkaufgabe löst. Das geschieht in Science-Fiction. Eine Maschine, die wie ein Mensch in Verpackung wirkt. Das war das ursprüngliche Ziel von Künstlicher Intelligenz in den 1950er-Jahren, aber es erwies sich als schwierig. Stattdessen gibt es heute die sogenannte schwache oder enge oder spezifische KI. Das sind Algorithmen, die darauf abzielen, eine konkrete, wohldefinierte Aufgabe zu lösen. Wie: Zeigt dieses Foto eine Katze oder einen Hund? Das ist es, worin die enormen Fortschritte von KI in den letzten Jahren liegen. Dies vorausgeschickt, wie verhält sich Künstliche Intelligenz zu Data Science und worin unterscheiden sie sich? Das ist wie mit der schwierigen Frage: Frucht oder Gemüse? Künstliche Intelligenz sind Algorithmen, die aus Daten lernen. Grob gesagt, unser Konzept von KI und das Feld des Maschinellen Lernens haben also sehr viel gemeinsam. Data Science sind die Skills und Techniken, die für den Umgang mit schwierigen Daten benötigt werden. Sie sehen, dass sich beide nicht ausschließen. Sie überschneiden sich stark und KI braucht fast immer die Fähigkeiten von Data Science. Moderne KI ist ohne Data Science unmöglich. Doch ein riesiger Teil von Data Science hat mit Künstlicher Intelligenz nichts zu tun. Darüber werde ich später in diesem Kurs noch etwas sagen. In einem Diagramm würde ich es so beschreiben: Wenn das Data Science ist, ist dies Maschinelles Lernen, ML. Beide überschneiden sich stark und dann hat Maschinelles Lernen einen spezifischen Ansatz, der »neuronale Netze« heißt. Diese sind erstaunlich produktiv und KI bezieht sich auf diese diffuse, kaum definierte Kategorie im Schnittfeld mit neuronalen Netzen und Maschinellem Lernen. Und es löst einige der Mehrdeutigkeiten und einige Schwierigkeiten, diese abzugrenzen, weshalb es keine konsistente Definition gibt und so viel darüber gestritten wird, was das eine ist und was das andere. Künstliche Intelligenz nimmt in jüngerer Zeit enormen Einfluss auf das Feld der Data Science, auch wenn Data Science daneben noch viele andere Dinge tut. Dieser Kurs behandelt konkret Data Science, aber Sie werden sehen, wie viel dieser Inhalte genauso gut auf Maschinelles Lernen, neuronale Netze und Künstliche Intelligenz anwendbar ist.

Inhalt