Grundlagen des maschinellen Lernens#

In diesem Kapitel werden wir die Grundlagen des klassischen maschinellen Lernens einführen. Wir werden überwachtes und unüberwachtes maschinelles Lernen vorstellen und einen einfachen Datensatz verarbeiten. Da die Anzahl der in diesem Bereich verwendeten Algorithmen überwältigend ist, stellen wir nur zwei klassische Methoden vor: Den Random Forest Classifier (überwacht) und k-Means Clustering (unüberwacht). Mit dem Wissen, das bei der Verwendung dieser beiden erworben wird, kann man auch andere Implementierungen nutzen, da diese Algorithmen zumindest aus Benutzersicht alle ähnlich funktionieren.

Um einen breiteren Überblick über verfügbare Algorithmen und Methoden zu erhalten, wird der Leser auf die scikit-learn Dokumentation und den YouTube-Kanal von Digital Sreeni verwiesen.

In diesem Kapitel verwendete Python-Bibliotheken#

Wir werden scikit-learn verwenden, das wie folgt installiert werden kann:

mamba install scikit-learn