Der Two-Step-Clusteralgorithmus in SPSS: Methodenbeschreibung und Vergleich mit der k-Means Clusteranalyse

von: Josef Seibold

GRIN Verlag , 2009

ISBN: 9783640366934 , 71 Seiten

Format: PDF, OL

Kopierschutz: frei

Windows PC,Mac OSX für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 29,99 EUR

  • Modeling Financial Time Series with S-PLUS®
    Symmetric Functionals on Random Matrices and Random Matchings Problems
    Probability: A Graduate Course
    Value Distribution Theory Related to Number Theory
    COMPSTAT 2006 - Proceedings in Computational Statistics - 17th Symposium Held in Rome, Italy, 2006
    Soft Methods for Integrated Uncertainty Modelling
  • The Statistical Analysis of Recurrent Events
    Multivariate and Mixture Distribution Rasch Models - Extensions and Applications
    Reminiscences of a Statistician - The Company I Kept
    Interactive and Dynamic Graphics for Data Analysis - With R and GGobi

     

     

     

     

     

 

Mehr zum Inhalt

Der Two-Step-Clusteralgorithmus in SPSS: Methodenbeschreibung und Vergleich mit der k-Means Clusteranalyse


 

Studienarbeit aus dem Jahr 2008 im Fachbereich Mathematik - Statistik, Note: 1,7, Universität Passau (Wissenschaftliche Fakultät), Sprache: Deutsch, Abstract: Die Clusteranalyse ist ein multivariates statistisches Verfahren zur Klassenbildung. Das Ziel der Clusteranalyse besteht darin, möglichst homogene Gruppen aus einer Menge von Objekten zu klassifizieren, wobei sich die Gruppen möglichst heterogen voneinander unterscheiden sollen. [...] Bei der Auswahl des Clusteralgorithmus unterscheidet man zwischen den Hierarchischen Clusterverfahren und den Partitionierenden Clusterverfahren. Dabei werden die Hierarchische Clustermethoden in agglomerative und divisive Clusterverfahren unterteilt. Die agglomerativen hierarchischen Clusterverfahren beginnen mit der feinsten Partition [...]. Bei divisiven hierarchischen Clusterverfahren wird mit der gröbsten Partition gestartet [...]. Die partitionierenden Clusterverfahren beginnen mit einer fest vorgegebenen Anfangspartition, die im Bezug auf ein bestimmtes Gütekriterium, wie z.B. das Varianzkriterium, sukzessive verbessert wird. [...] Die partitionierenden Clusterverfahren unterscheiden sich in optimierende Austauschverfahren und Minimal-Distanz-Verfahren. [...] Der Two-Step-Clusteralgorithmus ist ein zweistufiges Clusterverfahren zur Klassenbildung. In der ersten Stufe des Verfahrens wird zunächst eine grobe und vereinfachte Clusterung aller Objekte vorgenommen, die dann in der zweiten Stufe mit einer rechenaufwändigeren hierarchischen Clusteranalyse zu präziseren Clustern verdichtet wird. [...] Dabei unterscheidet sich der Two-Step-Clusteralgorithmus in SPSS im Vergleich zu den anderen Clusterverfahren insbesondere im Algorithmus, nach dem die Clusterbildung vorgenommen wird. [...] Das Verfahren des Two-Step-Clusteralgorithmus basiert auf dem so genannten BIRCH-Algorithmus, der vorwiegend für die Clusterung sehr umfangreicher Datensätze angewendet wird. Im Folgenden wird ganz kurz der Ablauf des BIRCH-Algorithmus dargestellt. [...]