جستجو با PCA-هدایتشده برای K-means
جستجو با PCA-هدایتشده برای K-means
دسته بندی | مقالات ترجمه شده isi |
فرمت فایل | docx |
حجم فایل | 1.357 مگا بایت |
تعداد صفحات | 5 |
Pattern Recognition Letters 54 (2015) 50–55
PCA-guided search for K-means
K-means is undoubtedly the most widely used partitional clustering algorithm. Unfortunately due to the non-convexity of the model for mulations expectation maximization (EM) type algorithms converge to different local optima with different initializations. Recent discoveries have identified that the global solution of K means cluster centroids lies in the principal component analysis (PCA) subspace. Based on this insight we propose PCA-guided effective search for K-means. Because the PCA subspace is much smaller than the original space searching in the PCA subspace is both more effective and efficient. Extensive experiments on four real world datasets and systematic comparison with previous algorithms demonstrate that our proposed method outperforms the restasit makes the K-means more effective.
Keywords:K-means Principal component analysis Cluster centroid initialization Clustering
جستجو با PCA-هدایتشده برای K-means
چکیده
بیتردید K-means پرکاربردترین الگوریتم خوشهبندی جزئی است. متاسفانه به دلیل نامحدب بودن[1] فرمولبندی مدل، الگوریتمهای نوع بیشینهسازی امید ریاضی[2] (EM) با مقادیر اولیهی مختلف به بهینههای محلی متفاوتی همگرا میشوند. در کشفیات جدید مشخص شده است که پاسخ [بهینهی] کلی برای مراکز خوشههای K-means در زیرفضای تحلیل مولفههای اصلی (PCA) قرار دارد. ما با این دید، روش جستجوی موثری را با هدایت PCA برای K-means پیشنهاد میکنیم. از آنجا که زیرفضای PCA بسیار کوچکتر از فضای اصلی است، جستجو در این زیرفضا هم موثر[3] و هم کارآمد[4] است. آزمایشهای گسترده که بر روی چهار مجموعه دادهی واقعی انجام شده است و مقایسه نظاممند با الگوریتمهای قبلی نشان میدهد که روش پیشنهادی ما عملکرد بهتری نسبت به سایرین دارد و K-means را موثرتر میسازد.
کلمات کلیدی:
میانگین-k
تحلیل مولفهی اصلی
مقداردهی اولیهی مرکز خوشه
خوشهبندی
قوانین ارسال دیدگاه در سایت