K均值聚類算法的MATLAB實(shí)現(xiàn) - 全文

　　K-means算法是最簡單的一種聚類算法。算法的目的是使各個樣本與所在類均值的誤差平方和達(dá)到最小（這也是評價K-means算法最后聚類效果的評價標(biāo)準(zhǔn)）

　　K-means聚類算法的一般步驟：

　　初始化。輸入基因表達(dá)矩陣作為對象集X，輸入指定聚類類數(shù)N，并在X中隨機(jī)選取N個對象作為初始聚類中心。設(shè)定迭代中止條件，比如最大循環(huán)次數(shù)或者聚類中心收斂誤差容限。

　　進(jìn)行迭代。根據(jù)相似度準(zhǔn)則將數(shù)據(jù)對象分配到最接近的聚類中心，從而形成一類。初始化隸屬度矩陣。

　　更新聚類中心。然后以每一類的平均向量作為新的聚類中心，重新分配數(shù)據(jù)對象。

　　反復(fù)執(zhí)行第二步和第三步直至滿足中止條件。

　　K-均值聚類法的概述

　　之前在參加數(shù)學(xué)建模的過程中用到過這種聚類方法，但是當(dāng)時只是簡單知道了在matlab中如何調(diào)用工具箱進(jìn)行聚類，并不是特別清楚它的原理。最近因?yàn)樵趯W(xué)模式識別，又重新接觸了這種聚類算法，所以便仔細(xì)地研究了一下它的原理。弄懂了之后就自己手工用matlab編程實(shí)現(xiàn)了，最后的結(jié)果還不錯，嘿嘿~~~

　　簡單來說，K-均值聚類就是在給定了一組樣本（x1， x2，。。.xn）（xi， i = 1， 2，。。。 n均是向量）之后，假設(shè)要將其聚為 m（《n）類，可以按照如下的步驟實(shí)現(xiàn)：

　　Step 1：從（x1， x2，。。.xn）中隨機(jī)選擇 m 個向量（y1，y2，。。.ym）作為初始的聚類中心（可以隨意指定，不在n個向量中選擇也可以）;

　　Step 2：計算（x1， x2，。。.xn）到這 m 個聚類中心的距離（嚴(yán)格來說為 2階范數(shù)）;

　　Step 3：對于每一個 xi（i = 1，2，。。.n）比較其到（y1，y2，。。.ym）距離，找出其中的最小值，若到 yj 的距離最小，則將 xi 歸為第j類;

　　Step 4： m 類分好之后，計算每一類的均值向量作為每一類新的聚類中心;

　　Step 5：比較新的聚類中心與老的聚類中心之間的距離，若大于設(shè)定的閾值，則跳到 Step2; 否則輸出分類結(jié)果和聚類中心，算法結(jié)束。

　　單介紹下kmeans算法流程：

　　假設(shè)要把樣本集分為c個類別，算法描述如下：

　　（1）適當(dāng)選擇c個類的初始中心；

　　（2）在第k次迭代中，對任意一個樣本，求其到c各中心的距離，將該樣本歸到距離最短的中心所在的類；

　　（3）利用均值等方法更新該類的中心值；

　　（4）對于所有的c個聚類中心，如果利用（2）（3）的迭代法更新后，值保持不變，則迭代結(jié)束，否則繼續(xù)迭代。

　　該算法的最大優(yōu)勢在于簡潔和快速。算法的關(guān)鍵在于初始中心的選擇和距離公式。

　　matlab實(shí)現(xiàn)：

　　function ［ class count］=k_means（data，k）;

　　%clear

　　%load testdata.mat

　　%k=2;

　　sum=size（data，1）;

　　for i=1:k

　　centroid（i，：）=data（floor（sum/k）*（i-1）+1，：）;

　　end

　　tic

　　ck=0;

　　while 1

　　temp=zeros（1，2）;;

　　count=zeros（1，k）;

　　ck=ck+1

　　for i=1:sum

　　for j=1:k

　　dist（j）=norm（data（i，：）-centroid（j，：））;

　　end

　　［a min_dist］=min（dist）;

　　count（min_dist）=count（min_dist）+1;

　　class（min_dist，count（min_dist））=i;

　　end

　　%重新計算類中心

　　for i=1:k

　　for j=1:count（i）

　　temp=temp+data（class（i，j），：）;

　　end

　　temp_centroid（i，：）=temp/（count（i））;

　　temp（1，：）=0;

　　% temp_centroid（i，：）=re_calculate（class（i，：），count（i），tdata）;

　　end

　　%計算新的類中心和原類中心距離centr_dist;

　　for i=1:k

　　centr_dist（i）=norm（temp_centroid（i，：）-centroid（i，：））;

　　end

　　if max（centr_dist）《=0

　　break;

　　else

　　for i=1:k

　　centroid（i，：）=temp_centroid（i，：）;

　　%重新進(jìn)行前倆不

　　end

　　toc

　　數(shù)據(jù)點(diǎn)是鼠標(biāo)插進(jìn)去的，通過界面可以很清晰的看到分類過程，功能截圖如下：

　　 K均值聚類算法的MATLAB實(shí)現(xiàn)

　　下面來看看K-means是如何工作的：

　　 K均值聚類算法的MATLAB實(shí)現(xiàn)

　　圖中圓形為聚類中心，方塊為待聚類數(shù)據(jù)，步驟如下：

　　（a）選取聚類中心，可以任意選取，也可以通過直方圖進(jìn)行選取。我們選擇三個聚類中心，并將數(shù)據(jù)樣本聚到離它最近的中心；

　　（b）數(shù)據(jù)中心移動到它所在類別的中心；

　　（c）數(shù)據(jù)點(diǎn)根據(jù)最鄰近規(guī)則重新聚到聚類中心；

　　（d）再次更新聚類中心；不斷重復(fù)上述過程直到評價標(biāo)準(zhǔn)不再變化

　　評價標(biāo)準(zhǔn)：

　　 clip_image016[6]

　　假設(shè)有M個數(shù)據(jù)源，C個聚類中心。μc為聚類中心。該公式的意思也就是將每個類中的數(shù)據(jù)與每個聚類中心做差的平方和，J最小，意味著分割的效果最好。

　　K-means面臨的問題以及解決辦法：

　　1.它不能保證找到定位聚類中心的最佳方案，但是它能保證能收斂到某個解決方案（不會無限迭代）。

　　解決方法：多運(yùn)行幾次K-means，每次初始聚類中心點(diǎn)不同，最后選擇方差最小的結(jié)果。

　　2.它無法指出使用多少個類別。在同一個數(shù)據(jù)集中，例如上圖例，選擇不同初始類別數(shù)獲得的最終結(jié)果是不同的。

　　解決方法：首先設(shè)類別數(shù)為1，然后逐步提高類別數(shù)，在每一個類別數(shù)都用上述方法，一般情況下，總方差會很快下降，直到到達(dá)一個拐點(diǎn)；這意味著再增加一個聚類中心不會顯著減少方差，保存此時的聚類數(shù)。

　　MATLAB函數(shù)Kmeans

　　使用方法：

　　Idx=Kmeans（X，K）

　　［Idx，C］=Kmeans（X，K）

　　［Idx，C，sumD］=Kmeans（X，K）

　　［Idx，C，sumD，D］=Kmeans（X，K）

　　［…］=Kmeans（…，’Param1’，Val1，’Param2’，Val2，…）

　　各輸入輸出參數(shù)介紹：

　　X： N*P的數(shù)據(jù)矩陣，N為數(shù)據(jù)個數(shù)，P為單個數(shù)據(jù)維度

　　K：表示將X劃分為幾類，為整數(shù)

　　Idx： N*1的向量，存儲的是每個點(diǎn)的聚類標(biāo)號

　　C： K*P的矩陣，存儲的是K個聚類質(zhì)心位置

　　sumD： 1*K的和向量，存儲的是類間所有點(diǎn)與該類質(zhì)心點(diǎn)距離之和

　　D： N*K的矩陣，存儲的是每個點(diǎn)與所有質(zhì)心的距離

　　［…］=Kmeans（…，‘Param1’，Val1，‘Param2’，Val2，…）

　　這其中的參數(shù)Param1、Param2等，主要可以設(shè)置為如下：

　　1. ‘Distance’（距離測度）

　　‘sqEuclidean’ 歐式距離（默認(rèn)時，采用此距離方式）

　　‘cityblock’ 絕度誤差和，又稱：L1

　　‘cosine’ 針對向量

　　‘correlation’ 針對有時序關(guān)系的值

　　‘Hamming’ 只針對二進(jìn)制數(shù)據(jù)

　　2. ‘Start’（初始質(zhì)心位置選擇方法）

　　‘sample’ 從X中隨機(jī)選取K個質(zhì)心點(diǎn)

　　‘uniform’ 根據(jù)X的分布范圍均勻的隨機(jī)生成K個質(zhì)心

　　‘cluster’ 初始聚類階段隨機(jī)選擇10%的X的子樣本（此方法初始使用’sample’方法）

　　matrix 提供一K*P的矩陣，作為初始質(zhì)心位置集合

　　3. ‘Replicates’（聚類重復(fù)次數(shù)）整數(shù)

　　使用案例：

　　data=

　　5.0 3.5 1.3 0.3 -1

　　5.5 2.6 4.4 1.2 0

　　6.7 3.1 5.6 2.4 1

　　5.0 3.3 1.4 0.2 -1

　　5.9 3.0 5.1 1.8 1

　　5.8 2.6 4.0 1.2 0

　　［Idx，C，sumD，D］=Kmeans（data，3，‘dist’，‘sqEuclidean’，‘rep’，4）

　　運(yùn)行結(jié)果：

　　Idx =

　　C =

　　5.0000 3.4000 1.3500 0.2500 -1.0000

　　5.6500 2.6000 4.2000 1.2000 0

　　6.3000 3.0500 5.3500 2.1000 1.0000

　　sumD =

　　0.0300

　　0.1250

　　0.6300

　　D =

　　0.0150 11.4525 25.5350

　　12.0950 0.0625 3.5550

　　29.6650 5.7525 0.3150

　　0.0150 10.7525 24.9650

　　21.4350 2.3925 0.3150

　　10.2050 0.0625 4.0850

閱讀全文

上一頁 1 2 3全文

本文導(dǎo)航

matlab(227703) matlab(227703)
均值聚類(6740) 均值聚類(6740)

如何在 Python 中安裝和使用頂級聚類算法

有許多聚類算法可供選擇，對于所有情況，沒有單一的最佳聚類算法。相反，最好探索一系列聚類算法以及每種算法的不同配置。在本教程中，你將發(fā)現(xiàn)如何在 python 中安裝和使用頂級聚類算法。

2023-05-22 09:13:55

171

10種頂流聚類算法Python實(shí)現(xiàn)（附完整代碼）

分享一篇關(guān)于聚類的文章：10種聚類算法和Python代碼。

2023-01-07 09:33:38

566

K-means聚類算法指南

在聚類技術(shù)領(lǐng)域中，K-means可能是最常見和經(jīng)常使用的技術(shù)之一。K-means使用迭代細(xì)化方法，基于用戶定義的集群數(shù)量（由變量K表示）和數(shù)據(jù)集來產(chǎn)生其最終聚類。例如，如果將K設(shè)置為3，則數(shù)據(jù)集將分組為3個群集，如果將K設(shè)置為4，則將數(shù)據(jù)分組為4個群集，依此類推。

2022-10-28 14:25:21

499

基于距離的聚類算法K-means的設(shè)計實(shí)現(xiàn)

K-means 算法是典型的基于距離的聚類算法，采用距離作為相似性的評價指標(biāo)，兩個對象的距離越近，其相似度就越大。而簇是由距離靠近的對象組成的，因此算法目的是得到緊湊并且獨(dú)立的簇。

2022-07-18 09:19:13

1438

K-MEANS聚類算法概述及工作原理

K-means 是一種聚類算法，且對于數(shù)據(jù)科學(xué)家而言，是簡單且熱門的無監(jiān)督式機(jī)器學(xué)習(xí)(ML)算法之一。

2022-06-06 11:53:55

2540

FCM聚類算法用于醫(yī)學(xué)圖像分割matlab源程序

FCM聚類算法以及改進(jìn)模糊聚類算法用于醫(yī)學(xué)圖像分割的matlab源程序

2018-05-11 23:30:42

基于模糊C均值聚類的軟件多缺陷定位方法

2021-06-02 14:38:41

基于密度的改進(jìn)K-均值聚類組合方法

為構(gòu)建行駛工況，消除K均值算法對初始聚類中心的敏感性及噪聲點(diǎn)的干擾，提岀一種改進(jìn)主成分分析和基于密度的改進(jìn)k-均值聚類組合方法。結(jié)合距離優(yōu)化法和密度法，構(gòu)建一種數(shù)據(jù)集密度度量方法。選取距離較大、密度

2021-05-31 11:16:08

基于最優(yōu)傳輸距離和聚類的WSN分簇算法

簇控制在最優(yōu)傳輸距離內(nèi)，實(shí)現(xiàn)簇內(nèi)節(jié)點(diǎn)的能耗均衡。通過目標(biāo)函數(shù)對K- means聚類簇進(jìn)行優(yōu)化，保證簇內(nèi)節(jié)點(diǎn)數(shù)目的均勻分布，并在考慮剩余能量和地理位置的基礎(chǔ)上完成節(jié)點(diǎn)數(shù)據(jù)傳輸。實(shí)驗(yàn)結(jié)果表明，該算法在均衡網(wǎng)絡(luò)能耗的同時，可有效延長網(wǎng)絡(luò)生命

2021-05-26 14:50:17

使用新的距離度量方式的增量式聚類算法

針對含有噪聲的高維數(shù)據(jù)的聚類問題，提岀一種使用新的距離度量方式的増量式聚類算法 ANFCM（cp）。由于傳統(tǒng)的模糊C均值聚類算法對初始化聚類中心比較敏感，所提岀的聚類算法將單程FCM的増量機(jī)制（稱為

2021-05-12 15:20:51

基于混合蛙跳算法的K-mediods聚類算法

為了降低K- mediods聚類算法的誤差并提高并行優(yōu)化的性能，將混合蛙跳算法運(yùn)用于聚類和并行優(yōu)化過程。在Kmediods聚類過程中，將K- mediods與聚類簇思想相結(jié)合，對各個聚類簇進(jìn)行混合

2021-05-08 16:17:18

一種基于密度的改進(jìn)k-均值聚類組合方法

為構(gòu)建行駛工況，消除K-均值算法對初始聚類中心的敏感性及噪聲點(diǎn)的干擾，提岀一種改進(jìn)主成分分析和基于密度的改進(jìn)K-均值聚類組合方法。結(jié)合距離優(yōu)化法和密度法，構(gòu)建一種數(shù)據(jù)集密度度量方法。選取距離較大

2021-04-16 15:36:00

一種自適應(yīng)的關(guān)聯(lián)融合聚類算法

除邊界點(diǎn)和噪聲點(diǎn)對聚類結(jié)果的影響。引入關(guān)聯(lián)度矩陣，通過計算類簇間的關(guān)聯(lián)程度和融合度量，選取最優(yōu)關(guān)聯(lián)簇進(jìn)行融合得到最終聚類結(jié)果。實(shí)驗(yàn)結(jié)果表明，該算法無需人工設(shè)置聚類參數(shù)，并且與基于密度的空間聚類算法和K均值聚類算法

2021-04-01 16:16:49

針對高維稀疏數(shù)據(jù)的可重疊子空間K-Means聚類算法

子空間并定義合理的約東函數(shù)指導(dǎo)聚類過程，從而實(shí)現(xiàn)類簇的可重疊性與離群點(diǎn)的控制。在此基礎(chǔ)上定義合理的目標(biāo)函數(shù)對傳統(tǒng)K- Means算法進(jìn)行修正，利用熵權(quán)約東分別計算每個類簇中各維度的權(quán)重，使用權(quán)重值標(biāo)識不同類簇中維度的相對重要性，

2021-03-25 14:07:10

一種改進(jìn)的聚類聯(lián)合相似度推薦算法

度推薦算法。采用改進(jìn)的蜂群算法來優(yōu)化K- means++聚類的中心點(diǎn)，使聚類中心在整個數(shù)據(jù)內(nèi)達(dá)到最優(yōu)，并對聚類結(jié)果進(jìn)行集成，使得聚類得到進(jìn)一步優(yōu)化。根據(jù)聚類結(jié)果，在同一類中采用改進(jìn)的用戶相似度算法來優(yōu)化傳統(tǒng)相似度算法，

2021-03-18 11:17:11

如何在python中安裝和使用頂級聚類算法?

聚類或聚類分析是無監(jiān)督學(xué)習(xí)問題。它通常被用作數(shù)據(jù)分析技術(shù)，用于發(fā)現(xiàn)數(shù)據(jù)中的有趣模式，例如基于其行為的客戶群。有許多聚類算法可供選擇，對于所有情況，沒有單一的最佳聚類算法。相反，最好探索一系列聚類算法

2021-03-12 18:23:43

1828

100天搞定機(jī)器學(xué)習(xí)：day54 聚類系列：層次聚類原理及案例

幾張GIF理解K-均值聚類原理k均值聚類數(shù)學(xué)推導(dǎo)與python實(shí)現(xiàn)前文說了k均值聚類，他是基于中心的聚類方法，通過迭代將樣本分到k個類中，使...

2020-12-10 21:56:09

216

常見的幾種聚類算法

這一最著名的聚類算法主要基于數(shù)據(jù)點(diǎn)之間的均值和與聚類中心的聚類迭代而成。它主要的優(yōu)點(diǎn)是十分的高效，由于只需要計算數(shù)據(jù)點(diǎn)與劇類中心的距離，其計算復(fù)雜度只有O（n）。

2020-04-15 15:23:29

14904

正確選擇聚類算法的建議

聚類算法十分容易上手，但是選擇恰當(dāng)?shù)?b style="color: red">聚類算法并不是一件容易的事。

2020-03-15 17:10:00

1663

如何使用K-Means聚類算法改進(jìn)的特征加權(quán)算法詳細(xì)資料概述

聚類分析是將研究對象分為相對同質(zhì)的群組的統(tǒng)計分析技術(shù)，聚類分析的核心就是發(fā)現(xiàn)有用的對象簇。K-means聚類算法由于具有出色的速度和良好的可擴(kuò)展性，一直備受廣大學(xué)者的關(guān)注。然而，傳統(tǒng)的K

2018-12-20 10:28:29

如何使用差分隱私保護(hù)進(jìn)行譜聚類算法

中，干擾樣本個體之間的權(quán)重值，實(shí)現(xiàn)樣本個體間的信息隱藏以達(dá)到隱私保護(hù)的目的。通過UCI數(shù)據(jù)集上的仿真實(shí)驗(yàn)，表明該算法能夠在一定的信息損失度范圍內(nèi)實(shí)現(xiàn)有效的數(shù)據(jù)聚類，也可以對聚類數(shù)據(jù)進(jìn)行保護(hù)。

2018-12-14 10:54:26

如何使用多維網(wǎng)格空間進(jìn)行改進(jìn)K-means聚類算法資料概述

K-means算法是被廣泛使用的一種聚類算法，傳統(tǒng)的-means算法中初始聚類中心的選擇具有隨機(jī)性，易使算法陷入局部最優(yōu)，聚類結(jié)果不穩(wěn)定。針對此問題，引入多維網(wǎng)格空間的思想，首先將樣本集映射到一個

2018-12-13 17:56:55

如何使用概率模型進(jìn)行非均勻數(shù)據(jù)聚類算法的設(shè)計介紹

針對傳統(tǒng)K-means型算法的“均勻效應(yīng)”問題，提出一種基于概率模型的聚類算法。首先，提出一個描述非均勻數(shù)據(jù)簇的高斯混合分布模型，該模型允許數(shù)據(jù)集中同時包含密度和大小存在差異的簇；其次，推導(dǎo)了非均勻

2018-12-13 10:57:59

使用模擬退火與貪心策略的平衡聚類算法的介紹

）2個步驟，以提高平衡聚類算法的聚類效果與時間性能。首先基于模擬退火在數(shù)據(jù)集中快速定位出K個合適的數(shù)據(jù)點(diǎn)作為平衡聚類初始點(diǎn)，然后每個中心點(diǎn)分階段貪婪地將距離其最近的數(shù)據(jù)點(diǎn)加入簇中直至達(dá)到簇規(guī)模上限。在6個UCI真實(shí)數(shù)據(jù)集與2個公開圖

2018-11-28 09:53:06

Python無監(jiān)督學(xué)習(xí)的幾種聚類算法包括K-Means聚類,分層聚類等詳細(xì)概述

無監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)技術(shù)中的一類，用于發(fā)現(xiàn)數(shù)據(jù)中的模式。本文介紹用Python進(jìn)行無監(jiān)督學(xué)習(xí)的幾種聚類算法，包括K-Means聚類、分層聚類、t-SNE聚類、DBSCAN聚類等。

2018-05-27 09:59:13

29359

淺談Matlab中的聚類分析 Matlab聚類程序的設(shè)計

Matlab 提供系列函數(shù)用于聚類分析，歸納起來具體方法有如下：方法一：直接聚類，利用 clusterdata 函數(shù)對樣本數(shù)據(jù)進(jìn)行一次聚類，其缺點(diǎn)為可供用戶選擇的面較窄，不能更改距離的計算方法，該方法的使用者無需了解聚類的原理和過程，但是聚類效果受限制。

2018-05-18 15:04:00

6775

基于密度DBSCAN的聚類算法

本文開始介紹了聚類算法概念，其次闡述了聚類算法的分類，最后詳細(xì)介紹了聚類算法中密度DBSCAN的相關(guān)概況。

2018-04-26 10:56:41

21028

k means聚類算法實(shí)例

與分類不同，分類是示例式學(xué)習(xí)，要求分類前明確各個類別，并斷言每個元素映射到一個類別，而聚類是觀察式學(xué)習(xí)，在聚類前可以不知道類別甚至不給定類別數(shù)量，是無監(jiān)督學(xué)習(xí)的一種。目前聚類廣泛應(yīng)用于統(tǒng)計學(xué)、生物學(xué)、數(shù)據(jù)庫技術(shù)和市場營銷等領(lǐng)域，相應(yīng)的算法也非常的多。

2018-02-12 16:42:35

14535

聚類集成的網(wǎng)絡(luò)流量分類方法

的規(guī)范化互信息（NMI）；然后基于NMI的值來選擇用于聚類集成的K均值基聚類器的K值序列；最后采用二次互信息（ QMI）的一致函數(shù)生成一致聚類結(jié)果，并使用一種半監(jiān)督方法對聚類簇進(jìn)行標(biāo)注。通過實(shí)驗(yàn)比較了聚類集成方法與單個聚類算法

2018-02-09 10:35:56

基于最優(yōu)投影的半監(jiān)督聚類算法

針對譜聚類算法在解決高維、大數(shù)據(jù)量的聚類問題時出現(xiàn)的效率不高和準(zhǔn)確率明顯下降的問題進(jìn)行了研究，并在此研究基礎(chǔ)上結(jié)合最優(yōu)投影理論和Nystrom抽樣提出了基于最優(yōu)投影的半監(jiān)督譜聚類算法

2018-01-14 11:54:58

基于距離最大化和缺失數(shù)據(jù)聚類的填充算法

通過對基于K-means聚類的缺失值填充算法的改進(jìn)，文中提出了基于距離最大化和缺失數(shù)據(jù)聚類的填充算法。首先，針對原填充算法需要提前輸入聚類個數(shù)這一缺點(diǎn)，設(shè)計了改進(jìn)的K-means聚類算法：使用數(shù)據(jù)間

2018-01-09 10:56:56

基于可能性二均值聚類的二分類支持向量機(jī)

提出基于可能性二均值聚類（Possibilistic Two Means， P2M）的二分類支持向量機(jī)（Support Vector Machine，SVM）。該算法先用P2M對未知類別的二分類數(shù)據(jù)

2018-01-09 10:45:01

基于SVM和模糊K均值算法的部位外觀模型

基于SVM和模糊K均值算法的部位外觀模型。部位外觀模型由兩個分類器構(gòu)成，線性SVM分類器用于判斷部位定位狀態(tài)是否屬于人體部位，相似度分類器由部位定位狀態(tài)與利用模糊K均值算法確定的部位聚類中心的歸一化歐氏距離來構(gòu)造，用于計算

2018-01-08 15:13:40

基于近鄰傳播的遷移聚類算法

在目標(biāo)域可利用數(shù)據(jù)匱乏的場景下，傳統(tǒng)聚類算法的性能往往會下降，在該場景下，通過抽取源域中的有用知識用于指導(dǎo)目標(biāo)域?qū)W習(xí)以得到更為合適的類別信息和聚類性能，是一種有效的學(xué)習(xí)策略．借此提出一種基于近鄰傳播

2018-01-07 09:34:44

基于相似度的聚類算法

基于相似度的聚類算法，該算法結(jié)合區(qū)間值模糊軟集的特性，著重對給出評價對象的具有相似知識水平的專家進(jìn)行聚類，同時討論了算法的計算復(fù)雜度。最后通過實(shí)例說明該算法能有效地處理專家聚類問題。

2018-01-05 16:15:27

中點(diǎn)密度函數(shù)的模糊聚類算法

針對傳統(tǒng)模糊C一均值（ FCM）聚類算法初始聚類中心不確定，且需要人為預(yù)先設(shè)定聚類類別數(shù)，從而導(dǎo)致結(jié)果不準(zhǔn)確的問題，提出了一種基于中點(diǎn)密度函數(shù)的模糊聚類算法。首先，結(jié)合逐步回歸思想作為初始聚類中心

2017-12-26 15:54:20

大數(shù)據(jù)處理的優(yōu)化抽樣聚類K-means算法

針對大數(shù)據(jù)環(huán)境下K-means聚類算法聚類精度不足和收斂速度慢的問題，提出一種基于優(yōu)化抽樣聚類的K-means算法（OSCK）。首先，該算法從海量數(shù)據(jù)中概率抽樣多個樣本；其次，基于最佳聚類中心的歐氏

2017-12-22 15:47:18

距離不等式的K-medoids聚類算法

研究加速K-medoids聚類算法，首先以PAM（partitiomng around medoids）、TPAM（triangular inequality elimination

2017-12-22 15:35:47

基于密度差分的自動聚類算法

聚類作為無監(jiān)督學(xué)習(xí)技術(shù)，已在實(shí)際中得到了廣泛的應(yīng)用，但是對于帶有噪聲的數(shù)據(jù)集，一些主流算法仍然存在著噪聲去除不徹底和聚類結(jié)果不準(zhǔn)確等問題．本文提出了一種基于密度差分的自動聚類算法（CDD

2017-12-18 11:16:57

基于改進(jìn)核模糊C均值類間極大化聚類MKFCM算法

傳統(tǒng)的核聚類僅考慮了類內(nèi)元素的關(guān)系而忽略了類間的關(guān)系，對邊界模糊或邊界存在噪聲點(diǎn)的數(shù)據(jù)集進(jìn)行聚類分析時，會造成邊界點(diǎn)的誤分問題。為解決上述問題，在核模糊C均值（ KFCM）聚類算法的基礎(chǔ)上提出了一種

2017-12-15 10:52:53

基于布谷鳥搜索的K-means聚類算法

針對原始K-means聚類算法受初始聚類中心影響過大以及容易陷入局部最優(yōu)的不足，提出一種基于改進(jìn)布谷鳥搜索（cs）的K-means聚類算法（ACS-K-means）。其中，自適應(yīng)CS（ ACS）算法

2017-12-13 17:24:06

一種新的基于流行距離的譜聚類算法

方法進(jìn)行改進(jìn)，將傳統(tǒng)譜聚類算法（NJW-SC）中的基于歐氏距離的相似性測度換為基于流行距離的相似性測度，在此基礎(chǔ)上對樣本對象集進(jìn)行聚類。之后將新提出來的算法同K-Means算法、傳統(tǒng)譜聚類算法、模糊C均值聚類算法在人工數(shù)據(jù)集

2017-12-07 14:53:03

基于像素聚類進(jìn)行圖像分割的算法

的算法。首先，通過各向異性擴(kuò)散處理圖像；然后，使用一維K-均值對像素進(jìn)行聚類；最后，根據(jù)聚類結(jié)果和先驗(yàn)知識將像素值修改為最佳類中心像素值。理論分析表明該算法可以使圖像的峰值信噪比（ PSNR）達(dá)到最大值。實(shí)驗(yàn)結(jié)果表明：所

2017-12-06 16:44:11

基于時空模式的軌跡數(shù)據(jù)聚類算法

針對軌跡聚類算法在相似性度量中多以空間特征為度量標(biāo)準(zhǔn)，缺少對時間特征的度量，提出了一種基于時空模式的軌跡數(shù)據(jù)聚類算法。該算法以劃分再聚類框架為基礎(chǔ)，首先利用曲線邊緣檢測方法提取軌跡特征點(diǎn)；然后根據(jù)

2017-12-05 14:07:58

基于Spark的動態(tài)聚類算法研究

D-Stream作出并行化改進(jìn)，用通用的大數(shù)據(jù)處理框架Spark設(shè)計了一個基于分布式架構(gòu)運(yùn)行的動態(tài)數(shù)據(jù)聚類算法PDStream。實(shí)驗(yàn)結(jié)果表明，該算法具有更高的效率和良好的擴(kuò)展性，能夠實(shí)現(xiàn)分布式架構(gòu)下的流數(shù)據(jù)動態(tài)聚類。

2017-12-04 09:22:51

基于人群疏散仿真的折半聚類算法

運(yùn)用社會力模型（ SFM）模擬人群疏散之前，需要先對人群進(jìn)行聚類分組；然而，五中心聚類（k-medoids）和統(tǒng)計信息網(wǎng)格聚類（ STING）這兩大傳統(tǒng)聚類算法，在聚類效率和準(zhǔn)確率上都不能滿足要求

2017-12-03 10:53:04

模糊C均值聚類算法(原理+Matlab代碼)

盡可能歸于一類，而把不相似的樣本劃分到不同的類中。硬聚類把每個待識別的對象嚴(yán)格的劃分某類中，具有非此即彼的性質(zhì)，而模糊聚類建立了樣本對類別的不確定描述，更能客觀的反應(yīng)客觀世界，從而成為聚類分析的主流。

2017-12-01 14:26:02

48589

基于改進(jìn)人工蜂群的聚類算法

模糊C均值聚類算法在數(shù)據(jù)挖掘領(lǐng)域有著廣泛的使用背景，而對初始點(diǎn)的敏感和較差的搜索能力，限制了算法的進(jìn)一步推廣應(yīng)用。人工蜂群算法具有對初始點(diǎn)不敏感、適應(yīng)能力強(qiáng)和搜索能力強(qiáng)等優(yōu)點(diǎn)，并且針對人工蜂群算法

2017-11-29 17:22:21

基于C均值聚類和圖轉(zhuǎn)導(dǎo)的半監(jiān)督分類算法

針對傳統(tǒng)圖轉(zhuǎn)導(dǎo)（ GT）算法計算量大并且準(zhǔn)確率不高的問題，提出一個基于C均值聚類和圖轉(zhuǎn)導(dǎo)的半監(jiān)督分類算法。首先，采用模糊C均值（FCM）聚類算法先對未標(biāo)記樣本預(yù)選取，縮小圖轉(zhuǎn)導(dǎo)算法構(gòu)圖數(shù)據(jù)集的范圍

2017-11-28 16:36:12

一種改進(jìn)的人工蜂群算法與KECM迭代結(jié)合的聚類算法

針對核模糊C均值（ KFCM）算法對初始聚類中心敏感、易陷入局部最優(yōu)的問題，利用人工蜂群（ABC）算法的構(gòu)架簡單、全局收斂速度快的優(yōu)勢，提出了一種改進(jìn)的人工蜂群算法（ IABC）與KFCM迭代相結(jié)合

2017-11-28 16:14:04

基于密度的K-means算法在聚類數(shù)目中應(yīng)用

針對傳統(tǒng)的K-means算法無法預(yù)先明確聚類數(shù)目，對初始聚類中心選取敏感且易受離群孤點(diǎn)影響導(dǎo)致聚類結(jié)果穩(wěn)定性和準(zhǔn)確性欠佳的問題，提出一種改進(jìn)的基于密度的K-means算法。該算法首先基于軌跡數(shù)據(jù)分布

2017-11-25 11:35:38

一種以遺傳模擬退火算法的數(shù)據(jù)流聚類

針對套用傳統(tǒng)的聚類方法對數(shù)據(jù)流的聚類是行不通的這一問題，提出一種以遺傳模擬退火算法為基礎(chǔ)的模糊C均值聚類算法（SACA_FCM）對數(shù)據(jù)流進(jìn)行聚類。SACAFCM算法有效地避免了傳統(tǒng)的模糊C均值聚類

2017-11-22 11:51:13

基于網(wǎng)格的快速搜尋密度峰值的聚類算法優(yōu)化研究

CFSFDP是基于密度的新型聚類算法，可聚類非球形數(shù)據(jù)集，具有聚類速度快、實(shí)現(xiàn)簡單等優(yōu)點(diǎn)。然而該算法在指定全局密度閾值d時未考慮數(shù)據(jù)空間分布特性，導(dǎo)致聚類質(zhì)量下降，且無法對多密度峰值的數(shù)據(jù)集準(zhǔn)確聚類

2017-11-21 15:08:57

基于離散量改進(jìn)k-means初始聚類中心選擇的算法

傳統(tǒng)kmeans算法由于初始聚類中心的選擇是隨機(jī)的，因此會使聚類結(jié)果不穩(wěn)定。針對這個問題，提出一種基于離散量改進(jìn)k-means初始聚類中心選擇的算法。算法首先將所有對象作為一個大類，然后不斷從對象

2017-11-20 10:03:23

一種改進(jìn)的BIRCH算法聚類方法

為解決傳統(tǒng)BIRCH算法對數(shù)據(jù)對象輸入順序敏感、聚類結(jié)果不穩(wěn)定的問題，提出了一種改進(jìn)的BIRCH算法。該算法將雷達(dá)信號偵察數(shù)據(jù)的脈沖載頻、脈沖重復(fù)間隔和脈沖寬度分別進(jìn)行聚類，根據(jù)工程應(yīng)用中各參數(shù)

2017-11-10 15:52:18

基于C均值聚類的定位算法

為了提高WSN節(jié)點(diǎn)定位精度，針對測距誤差對定位結(jié)果的影響，提出基于模糊C均值聚類的定位算法。算法首先利用多邊定位算法得到若干個定位結(jié)果，利用模糊C均值聚類算法對定位結(jié)果進(jìn)行聚類分析，然后，根據(jù)聚類

2017-11-09 17:47:13

一種聚類個數(shù)自適應(yīng)的聚類方法（簡稱SKKM）

在數(shù)據(jù)挖掘算法中，K均值聚類算法是一種比較常見的無監(jiān)督學(xué)習(xí)方法，簇間數(shù)據(jù)對象越相異，簇內(nèi)數(shù)據(jù)對象越相似，說明該聚類效果越好。然而，簇個數(shù)的選取通常是由有經(jīng)驗(yàn)的用戶預(yù)先進(jìn)行設(shè)定的參數(shù)。本文提出了一種

2017-11-03 16:13:05

基于MCL與Chameleon的混合聚類算法

馬爾科夫聚類算法（ Markov Cluster Algorithm，MCL）是一種快速且可擴(kuò)展的無監(jiān)督圖聚類算法，Chameleon是一種新的層次聚類算法。但MCL由于過擬合會產(chǎn)生很多小聚類

2017-10-31 18:58:21

云存儲中大數(shù)據(jù)優(yōu)化粒子群聚類算法（基于模糊C均值聚類）

。提出一種基于優(yōu)化粒子群算法的云存儲中大數(shù)據(jù)優(yōu)化聚類算法，進(jìn)行了云存儲大數(shù)據(jù)聚類的原理分析，在傳統(tǒng)的模糊C均值聚類的基礎(chǔ)上，采用粒子群聚類算法進(jìn)行大數(shù)據(jù)聚類算法改進(jìn)設(shè)計，把數(shù)據(jù)的分割轉(zhuǎn)化為對空間的分割，得到

2017-10-28 12:46:53

常用聚類算法有哪些？六大類聚類算法詳細(xì)介紹

聚類分析計算方法主要有如下幾種：劃分法、層次法、密度算法、圖論聚類法、網(wǎng)格算法和模型算法。劃分法（partitioning methods），給定一個有N個元組或者紀(jì)錄的數(shù)據(jù)集，分裂法將構(gòu)造K個分組，每一個分組就代表一個聚類，K《N。

2017-10-25 19:18:34

165890

基于主元分析與模糊C均值聚類算法的丙烯睛反應(yīng)器

鑒于主元分析法的降維特性和模糊C均值聚類算法良好的分類性能，本文在丙烯睛反應(yīng)器操作參數(shù)的優(yōu)化中，結(jié)合這兩種方法，將主元分析處理后的數(shù)據(jù)作為新的樣本輸入，利用模糊C均值聚類算法進(jìn)行優(yōu)化操作。

2017-09-08 15:48:03

基于加速k均值的譜聚類圖像分割算法改進(jìn)_李昌興

2017-03-19 19:25:56

基于改進(jìn)K_means聚類的欠定盲分離算法_柴文標(biāo)

2017-03-17 10:31:39

基于PCA的HK聚類算法研究何瑩

基于PCA的H_K聚類算法研究_何瑩

2017-03-17 08:00:00

基于SVD的Kmeans聚類協(xié)同過濾算法王偉

基于SVD的K_means聚類協(xié)同過濾算法_王偉

2017-03-17 08:00:00

基于改進(jìn)K均值聚類的機(jī)械故障智能檢測_費(fèi)賢舉

2017-02-08 01:57:37

特征加權(quán)和優(yōu)化劃分的模糊C均值聚類算法

特征加權(quán)和優(yōu)化劃分的模糊C均值聚類算法_肖林云

2017-01-07 21:39:44

混合細(xì)菌覓食和粒子群的k_means聚類算法

混合細(xì)菌覓食和粒子群的k_means聚類算法_閆婷

2017-01-07 19:00:39

基于聚類中心優(yōu)化的k_means最佳聚類數(shù)確定方法

基于聚類中心優(yōu)化的k_means最佳聚類數(shù)確定方法_賈瑞玉

2017-01-07 18:56:13

基于AutoEncoder的增量式聚類算法

基于AutoEncoder的增量式聚類算法_原旭

2017-01-03 17:41:32

基于最小生成樹的層次K_means聚類算法

基于最小生成樹的層次K_means聚類算法_賈瑞玉

2017-01-03 15:24:45

基于粒子群模糊C均值聚類的快速圖像分割

模糊C-均值聚類算法是一種無監(jiān)督圖像分割技術(shù)，但存在著初始隸屬度矩陣隨機(jī)選取的影響，可能收斂到局部最優(yōu)解的缺點(diǎn)。提出了一種粒子群優(yōu)化與模糊C-均值聚類相結(jié)合的圖像分割算

2012-10-16 16:07:06

K-means+聚類算法研究綜述

介紹了K-means 聚類算法的目標(biāo)函數(shù)、算法流程，并列舉了一個實(shí)例，指出了數(shù)據(jù)子集的數(shù)目K、初始聚類中心選取、相似性度量和距離矩陣為K-means聚類算法的3個基本參數(shù)。總結(jié)了K-means聚

2012-05-07 14:09:14

基于模糊C均值的數(shù)據(jù)流入侵檢測算法

針對數(shù)據(jù)在性態(tài)和類屬方面存在不確定性的特點(diǎn)，提出一種基于模糊C 均值聚類的數(shù)據(jù)流入侵檢測算法，該算法首先利用增量聚類得到網(wǎng)絡(luò)數(shù)據(jù)的概要信息和類數(shù)，然后利用模糊C均值聚

2012-03-20 10:29:21

聚類算法及聚類融合算法研究

聚類算法及聚類融合算法研究首先對聚類算法的特點(diǎn)進(jìn)行了分析，然后對聚類融合算法進(jìn)行了挖掘。最后得出聚類融合算法比聚類算法更能得到很好的聚合效果。

2011-08-10 15:08:02

基于無線傳感器網(wǎng)絡(luò)的K均值算法研究

傳統(tǒng)無線傳感網(wǎng)一般由大量密集的傳感器節(jié)點(diǎn)構(gòu)成，存在節(jié)點(diǎn)計算能力、能源和帶寬都非常有限的缺點(diǎn)，為了有效節(jié)能、延長網(wǎng)絡(luò)壽命，介紹了基于聚類的K均值算法。該算法通過生成的

2011-04-12 18:16:54

近似骨架導(dǎo)向的歸約聚類算法

該文針對聚類問題上缺乏骨架研究成果的現(xiàn)狀，分析了聚類問題的近似骨架特征，設(shè)計并實(shí)現(xiàn)了近似骨架導(dǎo)向的歸約聚類算法。該算法的基本思想是：首先利用現(xiàn)有的啟發(fā)式聚類算

2010-02-10 11:48:09

一種改進(jìn)的粒子群和K均值混合聚類算法

該文針對K 均值聚類算法存在的缺點(diǎn)，提出一種改進(jìn)的粒子群優(yōu)化(PSO)和K 均值混合聚類算法。該算法在運(yùn)行過程中通過引入小概率隨機(jī)變異操作增強(qiáng)種群的多樣性，提高了混合聚類

2010-02-09 14:21:26

優(yōu)化初始值的K均值中文文本聚類

文本聚類是中文文本挖掘中的一種重要分析方法。K 均值聚類算法是目前最為常用的文本聚類算法之一。但此算法在處理高維、稀疏數(shù)據(jù)集等問題時存在一些不足，且對初始聚類

2010-01-15 14:24:46

基于約簡-優(yōu)化原理的動態(tài)聚類算法研究

本文通過對常用動態(tài)聚類方法的分析，提出了基于“約簡-優(yōu)化”原理的兩階段動態(tài)聚類算法的框架，此方法克服了動態(tài)聚類搜索空間過大的問題，提高了聚類的精度和效率。

2010-01-09 11:31:14

基于改進(jìn)FCM聚類的BT-SVM多類分類算法

針對二叉樹支持向量機(jī)在多類分類問題上存在的不足，利用粒子群算法對模糊C 均值聚類算法進(jìn)行了改進(jìn)，在此基礎(chǔ)上，結(jié)合二叉樹支持向量機(jī)，構(gòu)建了偏二叉樹多類分類算法。

2009-12-18 16:36:16

聚類算法研究

聚類算法研究:對近年來聚類算法的研究現(xiàn)狀與新進(jìn)展進(jìn)行歸納總結(jié).一方面對近年來提出的較有代表性的聚類算法,從算法思想、關(guān)鍵技術(shù)和優(yōu)缺點(diǎn)等方面進(jìn)行分析概括;另一方面選擇

2009-10-31 08:57:24

基于關(guān)聯(lián)規(guī)則與聚類算法的查詢擴(kuò)展算法

基于關(guān)聯(lián)規(guī)則與聚類算法的查詢擴(kuò)展算法:針對信息檢索中查詢關(guān)鍵詞與文檔用詞不匹配的問題，提出一種基于關(guān)聯(lián)規(guī)則與聚類算法的查詢擴(kuò)展算法。該算法在第1 階段對初始查

2009-10-17 23:00:33

基于自適應(yīng)模糊C-均值的增量式聚類算法

針對模糊C-均值(FCM)算法不能很好地處理更新數(shù)據(jù)的缺點(diǎn)，提出基于FCM 的自適應(yīng)增量式聚類算法AIFCM。該算法結(jié)合密度和集合的思想，給出一種自動確定聚類初始中心的方法，能在

2009-10-04 14:09:09

Web文檔聚類中k-means算法的改進(jìn)

Web文檔聚類中k-means算法的改進(jìn) 介紹了Web文檔聚類中普遍使用的、基于分割的k-means算法,分析了k-means算法所使用的向量空間模型和基于距離的相似性度量的局限性,從而

2009-09-19 09:17:03

913

已全部加載完成

搜索歷史

K均值聚類算法的MATLAB實(shí)現(xiàn) - 全文

K-means聚類算法的一般步驟：

K-均值聚類法的概述

單介紹下kmeans算法流程：

matlab實(shí)現(xiàn)：

下面來看看K-means是如何工作的：

K-means面臨的問題以及解決辦法：

MATLAB函數(shù)Kmeans

本文導(dǎo)航

評論

　　K-means聚類算法的一般步驟：

　　K-均值聚類法的概述

　　單介紹下kmeans算法流程：

　　matlab實(shí)現(xiàn)：

　　下面來看看K-means是如何工作的：

　　K-means面臨的問題以及解決辦法：

　　MATLAB函數(shù)Kmeans