Hi,
da ich mich intensiver mit Clustering und Klassifikationsverfahren beschäftigen möchte
hätte ich folgende Frage:
Cluster-Methode wie z.B. K-means, welche zu den unüberwachten Lernverfahren zählen,
teilen eine Datenmenge in K Cluster auf.
In jedem Cluster befinden sich nun Daten welche einander ähnlich sind.
Jetzt kann ich den Daten in den jeweiligen Clustern dieselbe Klasse zuweisen,
z.B. bei K=2, erhält Cluster 1 die Klasse 1 und Cluster 2 die Klasse -1 zugewiesen.
Ist das ein möglicher üblicher Ablauf um Trainingsdaten für ein überwachtes Lernverfahren
zu erhalten z.B. für Support Vector Machine?
Danke im voraus.