国产中文字幕第一页|精品国产亚洲一区二区三区在线|亚洲欧美中文日韩欧美|三a四a视频在线观看

    1. 
      
    2. 當(dāng)前位置: 首頁>> 輿情簡評 >>正文

      機(jī)器學(xué)習(xí)算法-k均值聚類

      2020-02-26 10:44 作者:蟻坊軟件研究院 瀏覽次數(shù):7190 標(biāo)簽: 深度學(xué)習(xí)算法
      "速讀全網(wǎng)"輿情,了解傳播路徑,把握發(fā)展態(tài)勢——點(diǎn)擊試用鷹眼速讀網(wǎng)全網(wǎng)輿情監(jiān)測分析系統(tǒng)

      k均值聚類算法,是一種無監(jiān)督算法,該算法的主要作用是將相似的樣本自動歸到一個(gè)類別中。所謂的無監(jiān)督算法,就是輸入樣本沒有對應(yīng)的輸出或標(biāo)簽,而聚類試圖將數(shù)據(jù)集中的樣本劃分為若干個(gè)通常是不相交的子集,每個(gè)子集稱為一個(gè)簇。k均值聚類簡單易懂而且非常有效,但是確定合理的k值和k個(gè)初始類簇中心點(diǎn)對于聚類效果的好壞有很大的影響。

      0 k均值聚類算法的主要學(xué)習(xí)內(nèi)容

      1)基本原理

      2)k的選擇及初始質(zhì)心

      3)k均值的優(yōu)缺點(diǎn)

      1  k均值聚類的基本原理

      1.1  k均值聚類算法描述

      k均值聚類算法中的一種,其中k表示類別數(shù),是一種通過均值對數(shù)據(jù)點(diǎn)進(jìn)行聚類的算法。適用于大樣本,但需要事先指定分為k個(gè)類。

      原理:從n個(gè)數(shù)據(jù)對象任意選擇k個(gè)對象作為初始聚類中心,對剩余的其他對象,則根據(jù)它們與k個(gè)聚類中心的相似度(距離),分別將它們分配給與其最相似的(聚類中心所代表的)聚類;再計(jì)算每個(gè)所獲的新的聚類中心(該聚類中所有對象的均值);不斷重復(fù)這一過程,知道標(biāo)準(zhǔn)測度函數(shù)開始收斂為止。

      k均值聚類的特點(diǎn):各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。

      1.2 k均值算法步驟

      2 k值和初始質(zhì)心的選取

      2.1 k值的選取

      對于一個(gè)給定沒有分類的數(shù)據(jù)集,最后具體應(yīng)該分為多少類,這確實(shí)時(shí)一個(gè)讓人頭痛的問題。要使k均值最后分類結(jié)果最好,也就是要使k均值最小化,是要最小化所有的數(shù)據(jù)點(diǎn)與其所關(guān)聯(lián)的聚類中心點(diǎn)之間的距離之和,因此,我們可以設(shè)計(jì)k均值的代價(jià)函數(shù)為:

      而k值在這里取到了重要作用。據(jù)統(tǒng)計(jì)發(fā)現(xiàn)k值的增加,其數(shù)據(jù)的代價(jià)損失是不斷變小,如圖,我們發(fā)現(xiàn)在k=3時(shí),代價(jià)函數(shù)隨著k值變化的幅度顯著降低,在k>3之后所帶來的作用也沒有特別明顯,所以我們可以選擇k=3作為我們的聚類數(shù)目。

      但實(shí)際應(yīng)用中,k值的變換規(guī)律都不是和上圖一樣存在突變點(diǎn),即拐點(diǎn)。那么這時(shí),k值的選擇主要還是根據(jù)經(jīng)驗(yàn)以及利用k均值聚類的目的來決定。

      2.2聚類中心的初始化

      一般,在實(shí)際應(yīng)用中,我們都是采取隨機(jī)產(chǎn)生k個(gè)點(diǎn)作為初始的聚類中心,其原因是,簡單快捷。

      但k個(gè)初始化的質(zhì)心的位置選擇對最后的聚類結(jié)果和運(yùn)行時(shí)間都有很大的影響,因此需要選擇合適的k個(gè)質(zhì)心。如果僅僅是完全隨機(jī)的選擇,有可能導(dǎo)致算法收斂很慢。k-means++算法就是對k均值隨機(jī)初始化質(zhì)心方法的優(yōu)化。

      k-means++算法對于初始化質(zhì)心的優(yōu)化策略也很簡單,如下:

      k均值聚類算法舉例說明:

      以下是一組用戶的年齡數(shù)據(jù)

      我們將K值定義為2對用戶進(jìn)行聚類,并隨機(jī)選擇16和22作為兩個(gè)類別的初始質(zhì)心。

      計(jì)算距離并劃分?jǐn)?shù)據(jù)

      我們以圖的形式展示聚類的過程,在這組年齡數(shù)據(jù)中,我們選擇16和22作為兩個(gè)類別的初始質(zhì)心,并通過計(jì)算所有用戶的年齡值與初始質(zhì)心的距離對用戶進(jìn)行第一次分類。

      通過計(jì)算每個(gè)用戶年齡分別與兩個(gè)初始質(zhì)心的距離,這里我們以黑色實(shí)心圓點(diǎn)表示兩者距離較大,如表2.2.3,第一個(gè)數(shù)據(jù)15,到初始初始質(zhì)心點(diǎn)16的距離為1,到第二個(gè)初始質(zhì)心22的距離為7,相比之下,15與16的距離更近,近的距離以空心圓點(diǎn)標(biāo)記。因此15這個(gè)年齡被劃分到質(zhì)心點(diǎn)為16的一組中,如果年齡數(shù)據(jù)點(diǎn)到兩個(gè)初始質(zhì)心的距離相等時(shí),可任意劃分到這兩組中,例如,數(shù)據(jù)19到16和22的距離都為3,在這里,我們將它劃分到了22中。

      上表,我們按歐式距離最小,即相似程度最高對數(shù)據(jù)分為組后,分別計(jì)算分組中數(shù)據(jù)的均值,得分別為15.33和36.25,并以這兩個(gè)均值作為新的質(zhì)心。用新的質(zhì)心代替原有的初始質(zhì)心,迭代計(jì)算每個(gè)年齡數(shù)據(jù)點(diǎn)到新質(zhì)心的距離,直到新的質(zhì)心和上一次的質(zhì)心相同為止。

      表2.2.4,以年齡數(shù)據(jù)點(diǎn)到新質(zhì)心的距離值完成分組后,計(jì)算兩組的均值,為18.56和45.9,年齡數(shù)據(jù)點(diǎn)22到18.56的距離為3.44,到45.9的距離為23.9。因此年齡數(shù)據(jù)點(diǎn)22分配到質(zhì)心為18.56的分組中。

      這兩個(gè)均值與上一次的質(zhì)心結(jié)果不一樣,故又用新得到的均值代替原來的質(zhì)心。在新的質(zhì)心下,計(jì)算數(shù)據(jù)點(diǎn)到新質(zhì)心的距離,并對比數(shù)據(jù)點(diǎn)到兩個(gè)新質(zhì)心的距離,選擇較小的距離值來確定數(shù)據(jù)點(diǎn)的分組。

      表2.2.5,計(jì)算出的新的均值為19.50和47.89,與原來的均值不同,故將新均值代替原有均值作為現(xiàn)在的質(zhì)心。

      算法停止條件

      開始計(jì)算的第一步,我們就說迭代計(jì)算每個(gè)數(shù)據(jù)到新質(zhì)心的距離,直到新質(zhì)心和原質(zhì)心相同,算法就結(jié)束。使用上一步分組得到的均值19.5和47.89作為新質(zhì)心,并計(jì)算年齡數(shù)據(jù)點(diǎn)到新質(zhì)心的距離,以下計(jì)算結(jié)果。

      使用質(zhì)心為19.50和47.89進(jìn)行數(shù)據(jù)分組,并計(jì)算每組的均值作為新的質(zhì)心,從表2.2.6可知,這里的均值和原質(zhì)心相等,也就是說新質(zhì)心與原質(zhì)心相同,都是19.50和47.89。這時(shí)算法停止計(jì)算,年齡數(shù)據(jù)點(diǎn)被劃分為兩類,對應(yīng)取值區(qū)間為15-28和35-65.這就是k均值聚類的一個(gè)全過程。

      3 k均值聚類的總結(jié)

      3.1 k均值聚類的優(yōu)點(diǎn)

      1)原理簡單,容易實(shí)現(xiàn)

      2)可解釋性較強(qiáng)

      3)聚類效果較優(yōu)

      3.2 k均值聚類的缺點(diǎn):

      1)K值很難確定

      2)對噪音和異常點(diǎn)敏感

      3)需樣本存在均值(限定數(shù)據(jù)種類)

      4)采用迭代方法,得到的結(jié)果很有可能是局部最優(yōu)

      5)對于非凸數(shù)據(jù)集或類別規(guī)模差異太大的數(shù)據(jù)效果不好

      4 k均值聚類的應(yīng)用場景

      1)股票k線聚類

      2)商業(yè)銀行客戶分類

      3)葡萄酒分級

      4)高新技術(shù)信用評級

      參考文獻(xiàn)

      [1] https://www.cnblogs.com/zhzhang/p/5437778.html

      [2] https://blog.csdn.net/stayfoolish_fan/article/details/51888717

      [3] https://blog.51cto.com/janwool/2058124

      [4] https://blog.csdn.net/qq_42828404/article/details/81906809

      [5] https://blog.csdn.net/Dhane/article/details/86661208

      [6] https://www.cnblogs.com/bourneli/p/3645049.html


      (部分文字、圖片來自網(wǎng)絡(luò),如涉及侵權(quán),請及時(shí)與我們聯(lián)系,我們會在第一時(shí)間刪除或處理侵權(quán)內(nèi)容。電話:4006770986    負(fù)責(zé)人:張明)

      熱門文章 換一換
      文章推薦換一換
      輿情監(jiān)測關(guān)注問題換一換
      輿情監(jiān)測公司排名 輿情分析 輿情管理 輿情監(jiān)測系統(tǒng) 全網(wǎng)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測 輿論 輿情監(jiān)測平臺 互聯(lián)網(wǎng)輿情監(jiān)測 輿情監(jiān)控系統(tǒng) 輿情監(jiān)測服務(wù)平臺 熱點(diǎn)輿情 網(wǎng)絡(luò)輿情分析報(bào)告 輿論聚焦 中山大學(xué)張鵬 超強(qiáng)臺風(fēng)山竹 個(gè)人所得稅起征點(diǎn) 微博傳播分析 網(wǎng)紅直播 手機(jī)輿情監(jiān)測 做好輿情監(jiān)控 輿情監(jiān)測報(bào)價(jià) 網(wǎng)絡(luò)熱點(diǎn)事件 輿情搜索 輿情預(yù)警系統(tǒng) 近期輿情 輿情報(bào)告 輿情 免費(fèi)輿情軟件 輿情監(jiān)測方案 輿情監(jiān)測解決方案 輿情是什么意思 網(wǎng)絡(luò)輿情監(jiān)測 輿情案例分析 專業(yè)輿情監(jiān)測 媒體輿情監(jiān)測 藥品安全事件 長春長生疫苗事件 潔潔良 樂清女孩 新浪微輿情 網(wǎng)絡(luò)輿情分析報(bào)告 2019網(wǎng)絡(luò)輿情事件 山東壽光水災(zāi) 社會輿情 輿情監(jiān)測哪家好 輿情監(jiān)測方法 輿情監(jiān)測報(bào)價(jià) 新浪輿情 手機(jī)輿情監(jiān)測 近期輿情 網(wǎng)紅直播 輿情事件 免費(fèi)輿情監(jiān)測軟件 社會輿情 網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測報(bào)告 輿情監(jiān)測軟件 網(wǎng)絡(luò)輿情監(jiān)測公司 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測分析 輿情監(jiān)控前幾大公司 網(wǎng)絡(luò)輿情監(jiān)控軟件 網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng) 輿情監(jiān)控是什么意思 免費(fèi)輿情監(jiān)控 互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng) 網(wǎng)絡(luò)輿情分析 輿情 政務(wù)輿情 什么是輿情 新華網(wǎng)輿情在線 輿情監(jiān)控系統(tǒng) 互聯(lián)網(wǎng)輿情分析 社區(qū)輿情信息 網(wǎng)絡(luò)輿情信息 網(wǎng)絡(luò)輿情分析系統(tǒng) 網(wǎng)絡(luò)輿情管理 人民輿情監(jiān)控 軍犬網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng) 輿情監(jiān)控 涉警輿情 鷹擊 鷹眼輿情
      標(biāo)簽云 換一換
      2025年輿情報(bào)告 文旅輿情 熱點(diǎn)監(jiān)測 輿情報(bào)告 輿情分析 輿情研判 輿情研究 信息挖掘 輿情信息收集 醫(yī)院輿情 醫(yī)療輿情 網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測軟件 輿情服務(wù) 輿情服務(wù)商 輿情監(jiān)測 輿情監(jiān)測系統(tǒng) 輿情監(jiān)測工具 屬地輿情監(jiān)測 全網(wǎng)輿情監(jiān)測 地方輿情 社會事件輿情分析 行業(yè)輿情 互聯(lián)網(wǎng)輿情分析 消費(fèi)輿情 輿情周報(bào) 新聞輿情 民生輿情 社會輿論熱點(diǎn) 輿情監(jiān)測軟件排名 網(wǎng)絡(luò)輿情 校園輿情 短視頻 輿情傳播 輿情熱點(diǎn)事件 旅游輿情 景區(qū)輿情 網(wǎng)絡(luò)安全 蟻坊軟件 輿情事件 輿情匯總 教育輿情 市場監(jiān)管 金融輿情 金融監(jiān)督管理局 財(cái)經(jīng)金融輿情監(jiān)測 輿情輿論匯總 學(xué)校輿情 涉警輿情 社會輿情 網(wǎng)絡(luò)熱點(diǎn)事件 近期輿情 突發(fā)公共事件 公安輿情監(jiān)測分析 公安類輿情 娛樂輿情 AI輿情監(jiān)測服務(wù)平臺 大數(shù)據(jù)服務(wù)平臺 輿情系統(tǒng) AI輿情監(jiān)測服務(wù) 輿情監(jiān)測解決方案 月度輿情分析 AI輿情服務(wù) 人工智能 輿論監(jiān)測 2024年報(bào)告 網(wǎng)絡(luò)輿情監(jiān)測 蟻坊 假期輿情 交通輿情 在線監(jiān)測軟件 輿情監(jiān)測預(yù)警 輿情監(jiān)測平臺 高校輿情 輿情分析研判 新媒體輿情 數(shù)據(jù)監(jiān)測 輿情查詢 輿情數(shù)據(jù)分析 輿情治理 網(wǎng)絡(luò)輿情治理 網(wǎng)絡(luò)綜合治理 網(wǎng)絡(luò)信息生態(tài)治理 輿情應(yīng)對 應(yīng)急輿情 輿情風(fēng)險(xiǎn)監(jiān)測 災(zāi)害輿情 應(yīng)急管理 輿論態(tài)勢 輿情信息分析 輿情回應(yīng) 輿情風(fēng)險(xiǎn) 公共事件輿情 輿情監(jiān)測方法 互聯(lián)網(wǎng)輿情監(jiān)測平臺 視頻輿情監(jiān)測 輿情平臺 輿情預(yù)警 輿情態(tài)勢 農(nóng)業(yè)輿情 農(nóng)村輿情 老年人保護(hù)輿情 輿論風(fēng)險(xiǎn)防范 輿論監(jiān)測軟件 網(wǎng)絡(luò)輿論監(jiān)測 婦女兒童輿情 網(wǎng)紅直播 中國食品藥品安全輿情事件案例 政務(wù)輿情 大數(shù)據(jù)輿情 網(wǎng)上輿情 安全生產(chǎn) 食品輿情 輿情搜索 疫情輿情 涉穩(wěn)輿情 航空輿情 開源情報(bào)工具 輿情監(jiān)測報(bào)價(jià) 網(wǎng)絡(luò)傳播規(guī)律 傳播路徑分析 政府輿情 涉法輿情 檢察輿情 網(wǎng)絡(luò)輿情分析系統(tǒng) 抗擊疫情 疫情輿情分析 輿情管理 社交媒體輿情 謠言傳播 輿情監(jiān)測方案 網(wǎng)絡(luò)社會熱點(diǎn)輿情分析系統(tǒng) 免費(fèi)輿情監(jiān)測軟件 免費(fèi)大數(shù)據(jù)平臺有哪些 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng)哪家好 互聯(lián)網(wǎng)輿情監(jiān)測 2023年輿情分析報(bào)告 電力輿情 高考輿情 互聯(lián)網(wǎng)輿情 政府輿情監(jiān)測 輿情監(jiān)測服務(wù)商 鐵路輿情 轄區(qū)輿情監(jiān)測 如何網(wǎng)絡(luò)輿情 能源輿情 企業(yè)輿情 政策輿情 危機(jī)公關(guān) 輿情告警 智慧城市 輿情案例 數(shù)據(jù)分析軟件有哪些 網(wǎng)信辦信息匯總 輿情監(jiān)測哪家好 網(wǎng)絡(luò)輿情網(wǎng) 鄉(xiāng)鎮(zhèn)輿情 稅務(wù)輿情 輿情處置 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng) 生態(tài)環(huán)境輿情 負(fù)面輿情 消防救援輿情 輿情案例分析 地震輿情 明星輿情 新媒體輿情監(jiān)測 自媒體輿情監(jiān)測 輿情監(jiān)控前幾大公司 社交新全媒體監(jiān)測系統(tǒng)工具平臺公司 法治輿情 司法輿情 法院輿情 網(wǎng)紅輿情 23年輿情報(bào)告 網(wǎng)絡(luò)意識形態(tài) 在線輿情監(jiān)測 涉毒輿情 科技輿情 鷹眼速讀網(wǎng) 鷹擊早發(fā)現(xiàn) 監(jiān)獄輿情輿論 大數(shù)據(jù)分析工具 大數(shù)據(jù)輿情監(jiān)測 做好輿情監(jiān)控 政府輿情監(jiān)測系統(tǒng) 大數(shù)據(jù)輿情分析 媒體輿情 媒體輿論 網(wǎng)絡(luò)在線教學(xué)輿情 煙草輿情輿論 會議輿情 輿情預(yù)警系統(tǒng) 媒體監(jiān)測 環(huán)境輿情 輿情專報(bào) 次生輿情 輿情分析服務(wù) 輿論反應(yīng) 信息戰(zhàn) 輿論戰(zhàn) 輿論趨勢 新聞輿論陣地管理 自媒體傳播 自媒體亂象 女權(quán)輿論 性別矛盾 民族宗教輿情 宗教輿情 銀行輿情 互聯(lián)網(wǎng)輿情治理 2022年輿情報(bào)告 未成年人輿情 輿情引導(dǎo) 輿情日報(bào) 兩會輿情 審計(jì)局 輿論失焦 政法輿情 網(wǎng)絡(luò)實(shí)名制 輿情監(jiān)督 奧運(yùn)會 疫情搜索大數(shù)據(jù) 輿論知識點(diǎn) 新聞傳播理論 新疆棉花 社會情緒指數(shù) 正面輿情 網(wǎng)絡(luò)暴力 社會性死亡 辟謠 涉犬輿情 事件過程 鷹眼輿情 鷹擊 清博大數(shù)據(jù)輿情 輿情格式 疫情輿情分析報(bào)告 抗疫英雄事跡輿情 虛假新聞 什么是輿情 2020年輿情報(bào)告 2020年輿情 深度學(xué)習(xí)算法 機(jī)器學(xué)習(xí) 輿論分析 輿情公關(guān) 虐童事件 反轉(zhuǎn)新聞 網(wǎng)紅 微輿情 微博傳播分析 手機(jī)輿情監(jiān)測 新浪輿情 新華輿情 2019網(wǎng)絡(luò)熱詞 網(wǎng)絡(luò)流行語 百度輿情監(jiān)測 企業(yè)危機(jī)管理 315 網(wǎng)絡(luò)輿情危機(jī) 網(wǎng)絡(luò)輿情監(jiān)測公司 互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng) 輿情是什么意思 德云社 網(wǎng)絡(luò)輿論分析 大數(shù)據(jù)輿情監(jiān)測案例 網(wǎng)絡(luò)熱詞 微博數(shù)據(jù)分析 輿情監(jiān)測公司 2019輿情熱點(diǎn) 犯罪輿情 股票輿情 消防輿情 微信輿情監(jiān)測 民航輿情 人物輿情 公益輿情 感動中國 影視輿情 輿論監(jiān)督 2019輿情 2018輿情事件盤點(diǎn) 2018輿情報(bào)告 免費(fèi)輿情監(jiān)測系統(tǒng) 霧霾輿情 港澳臺輿情 涉軍輿情 拆遷輿情 輿情反轉(zhuǎn) 反腐輿情 海外輿情 信息惠民 體育輿情 強(qiáng)拆輿情 輿情指數(shù) 環(huán)保輿情