Funktioniert k mit kategorialen Daten?

Inhaltsverzeichnis:

Funktioniert k mit kategorialen Daten?
Funktioniert k mit kategorialen Daten?

Video: Funktioniert k mit kategorialen Daten?

Video: Funktioniert k mit kategorialen Daten?
Video: Regression mit kategorialen Variablen (Dummy-Variablen) in SPSS - Daten analysieren in SPSS (108) 2024, Dezember
Anonim

Der k-Means-Algorithmus ist nicht auf kategoriale Daten anwendbar, da kategoriale Variablen diskret sind und keinen natürlichen Ursprung haben. Daher ist die Berechnung der euklidischen Entfernung für einen Raum nicht sinnvoll.

Können wir Clustering für kategoriale Daten verwenden?

Die kategorialen Daten wurden in numerische umgewandelt, indem Rangwerte zugewiesen wurden. Es ist eine Tatsache, dass ein kategorialer Datensatz als numerische Datensätze geclustert werden kann. Es wird beobachtet, dass die Implementierung dieser Logik, k-Mittelwert, die gleiche Leistung erbringt, wie sie in numerischen Datensätzen verwendet wird.

Kann der Mittelwert für kategoriale Variablen verwendet werden?

Es gibt keine Möglichkeit aus diesen Daten einen Mittelwert zu finden, weil es keine "durchschnittliche" Augenfarbe gibt. Sie können die Proportionen finden, aber nicht den Mittelwert. Hoffe das hilft!

Was sollte verwendet werden, wenn die Daten kategorisch sind?

Kategoriale Daten werden mit Modus und Medianverteilungen analysiert, wobei nominale Daten mit Modus analysiert werden, während ordinale Daten beide verwenden. In einigen Fällen können ordinale Daten auch mithilfe von univariaten Statistiken, bivariaten Statistiken, Regressionsanwendungen, linearen Trends und Klassifizierungsmethoden analysiert werden.

Was ist Clustering mit kategorialen Attributen?

Kategoriales Daten-Clustering bezieht sich auf den Fall, in dem die Datenobjekte über kategoriale Attribute definiert sind … Das heißt, es gibt keine einzelne Ordnung oder inhärente Abstandsfunktion für die kategorialen Werte, und es gibt keine semantisch sinnvolle Zuordnung von kategorialen zu numerischen Werten.

Empfohlen: