国产中文字幕第一页|精品国产亚洲一区二区三区在线|亚洲欧美中文日韩欧美|三a四a视频在线观看

    1. 
      
    2. 當前位置: 首頁>> 輿情簡評 >>正文

      機器學習算法實踐-k近鄰算法

      2020-03-02 14:36 作者:蟻坊軟件研究院 瀏覽次數(shù):5687 標簽: 深度學習算法
      "速讀全網(wǎng)"輿情,了解傳播路徑,把握發(fā)展態(tài)勢——點擊試用鷹眼速讀網(wǎng)全網(wǎng)輿情監(jiān)測分析系統(tǒng)

      K近鄰法(KNN)是一種基本的分類方法,它的輸入為實例的特征向量,對應于特征空間中的點,輸出為實例的類別,可以取多類。實際上是利用訓練數(shù)據(jù)集對特征向量空間進行劃分,并作為其分類的模型。

      0 k近鄰算法的主要學習內(nèi)容

      1)k近鄰算法

      2)k值的選擇

      3)距離度量

      4)分類決策規(guī)則

      1 k近鄰算法

      k=1時,這個算法稱為最近鄰算法,對于輸入的實例點(特征向量)x,最近鄰法將訓練數(shù)據(jù)集中與x最近鄰點的類作為x的類。k近鄰法沒有顯式的學習過程。

      2 k近鄰模型

      2.1 距離度量[1]

      特征空間中兩個實例點的距離是兩個實例點相似程度的反映,k近鄰模型的特征空間一般是n維實數(shù)向量空間Rn,使用的距離是歐式距離,但也可以是其他距離。如更一般的Lp距離

      例[1]:

      2.2 k值的選擇

      k值的選擇會對k近鄰法的結(jié)果產(chǎn)生重大影響。

      如果選擇較小的k值,就相當于用較少的實例在進行預測,“學習”的近似誤差會減小,因為只有與輸入實例距離較近的訓練實例才會對預測結(jié)果起作用,不足在于“學習”的估計誤差會增大,會對近鄰的實例點非常敏感,如果近鄰的實例點恰巧是噪聲,分類預測就會出錯,而且k值較小就意味著整體模型會比較復雜,容易發(fā)生過擬合。

      如果選擇較大的k值,就相當于用較多的訓練實例來進行預測,雖減少了學習的估計誤差,但學習的近似誤差會增大,與輸入實例較遠的不相似的實例也會對預測起作用,使預測發(fā)生錯誤,這時的整體模型變得簡單。

      如果k=N,那么無論輸入實例是什么,都將簡單地預測它屬于在訓練實例中最多的類,這時,模型過于簡單,完全忽略訓練實例中的大量有用信息,是不可取的。

      在應用中,k值一般取一個比較小的數(shù)值,通常采用交叉驗證法來選取最優(yōu)的k值。經(jīng)驗規(guī)則:k一般低于訓練樣本數(shù)的平方根[2]。

      2.3 分類決策規(guī)則[1]

      k近鄰算法的分類決策規(guī)則往往是多數(shù)表決(少數(shù)服從多數(shù)),即由輸入實例的k個近鄰的訓練實例中多數(shù)類決定輸入實例的類。

      表示方法:

      3 k近鄰法的實現(xiàn)

      3.1 kd樹

      實現(xiàn)k近鄰算法時,我們主要考慮的問題是如何對訓練集進行k近鄰搜索,這點在特征空間的維數(shù)高,訓練數(shù)據(jù)容量大時尤其必要。為提高k近鄰搜索的效率,可以考慮使用特殊的結(jié)構(gòu)存儲訓練數(shù)據(jù),以減少計算距離次數(shù)。kd樹就有這一作用,kd樹是一個二叉樹。

      例:

      3.2 搜索kd樹

      如圖:

      kd樹適用于訓練實例數(shù)大于空間維數(shù)時的k近鄰搜索,當空間維數(shù)接近訓練實例數(shù)時,它的效率會迅速下降,幾乎接近線性掃描。

      例:

      給定一個如圖的kd樹,根結(jié)點為A,其子結(jié)點為B,C等,樹上共存儲7個實例點;另一個輸入目標實例點S,求S的最近鄰。

      解:

      首先在kd樹中找到包含點S的葉結(jié)點D,以點D作為近似最近鄰,真正最近鄰一定在以點S為中心通過點D的圓的內(nèi)部,然后返回結(jié)點D的父結(jié)點B,在結(jié)點B的另一個子結(jié)點F的區(qū)域內(nèi)搜索最近鄰,結(jié)果F的區(qū)域與圓不相交,不可能有最近鄰點,繼續(xù)返回上一級父結(jié)點A,在結(jié)點A的另一個結(jié)點C的區(qū)域內(nèi)搜索最近鄰,結(jié)點C的區(qū)域與圓相交,該區(qū)域在園內(nèi)的實例點有點E,點E比點D更近,成為新的最近鄰近似。最后得到點E是點S的最近鄰。

      4 k近鄰法的總結(jié)

      4.1 k近鄰法的優(yōu)點

      1.簡單,易于理解,易于實現(xiàn),無參數(shù)估計,無需訓練

      2.對異常值不敏感

      3.適合對稀有事件進行分類

      4.適合樣本容量比較大的分類問題

      5.適合多分類問題研究,效果有時比支持向量機要好

      4.2 k近鄰法的缺點

      1.懶惰算法,對測試樣本分類時的計算量大,內(nèi)存開銷大,評分慢。

      2.可解釋性不強,無法給出如決策樹那樣的規(guī)則

      3.對于小樣本的分類問題,會產(chǎn)生誤分。

      5 k近鄰法的應用

      1.KNN約會配對

      2.K近鄰房價評估

      3.蛋白質(zhì)功能檢測中的應用

      4.網(wǎng)頁分類

      參考文獻

      [1] 李航,《統(tǒng)計學習方法》

      [2] 常用數(shù)據(jù)挖掘算法總結(jié)及python實現(xiàn)

      [3] https://blog.csdn.net/hhy518518/article/details/52840152

      [4] https://blog.csdn.net/qq_15258623/article/details/80286230

      [5]https://www.docin.com/p-1285931544.html


      (部分文字、圖片來自網(wǎng)絡(luò),如涉及侵權(quán),請及時與我們聯(lián)系,我們會在第一時間刪除或處理侵權(quán)內(nèi)容。電話:4006770986    負責人:張明)

      熱門文章 換一換
      文章推薦換一換
      輿情監(jiān)測關(guān)注問題換一換
      輿情監(jiān)測公司排名 輿情分析 輿情管理 輿情監(jiān)測系統(tǒng) 全網(wǎng)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測 輿論 輿情監(jiān)測平臺 互聯(lián)網(wǎng)輿情監(jiān)測 輿情監(jiān)控系統(tǒng) 輿情監(jiān)測服務(wù)平臺 熱點輿情 網(wǎng)絡(luò)輿情分析報告 輿論聚焦 中山大學張鵬 超強臺風山竹 個人所得稅起征點 微博傳播分析 網(wǎng)紅直播 手機輿情監(jiān)測 做好輿情監(jiān)控 輿情監(jiān)測報價 網(wǎng)絡(luò)熱點事件 輿情搜索 輿情預警系統(tǒng) 近期輿情 輿情報告 輿情 免費輿情軟件 輿情監(jiān)測方案 輿情監(jiān)測解決方案 輿情是什么意思 網(wǎng)絡(luò)輿情監(jiān)測 輿情案例分析 專業(yè)輿情監(jiān)測 媒體輿情監(jiān)測 藥品安全事件 長春長生疫苗事件 潔潔良 樂清女孩 新浪微輿情 網(wǎng)絡(luò)輿情分析報告 2019網(wǎng)絡(luò)輿情事件 山東壽光水災 社會輿情 輿情監(jiān)測哪家好 輿情監(jiān)測方法 輿情監(jiān)測報價 新浪輿情 手機輿情監(jiān)測 近期輿情 網(wǎng)紅直播 輿情事件 免費輿情監(jiān)測軟件 社會輿情 網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測報告 輿情監(jiān)測軟件 網(wǎng)絡(luò)輿情監(jiān)測公司 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測分析 輿情監(jiān)控前幾大公司 網(wǎng)絡(luò)輿情監(jiān)控軟件 網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng) 輿情監(jiān)控是什么意思 免費輿情監(jiān)控 互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng) 網(wǎng)絡(luò)輿情分析 輿情 政務(wù)輿情 什么是輿情 新華網(wǎng)輿情在線 輿情監(jiān)控系統(tǒng) 互聯(lián)網(wǎng)輿情分析 社區(qū)輿情信息 網(wǎng)絡(luò)輿情信息 網(wǎng)絡(luò)輿情分析系統(tǒng) 網(wǎng)絡(luò)輿情管理 人民輿情監(jiān)控 軍犬網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng) 輿情監(jiān)控 涉警輿情 鷹擊 鷹眼輿情
      標簽云 換一換
      2025年輿情報告 文旅輿情 熱點監(jiān)測 輿情報告 輿情分析 輿情研判 輿情研究 信息挖掘 輿情信息收集 醫(yī)院輿情 醫(yī)療輿情 網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng) 輿情監(jiān)測軟件 輿情服務(wù) 輿情服務(wù)商 輿情監(jiān)測 輿情監(jiān)測系統(tǒng) 輿情監(jiān)測工具 屬地輿情監(jiān)測 全網(wǎng)輿情監(jiān)測 地方輿情 社會事件輿情分析 行業(yè)輿情 互聯(lián)網(wǎng)輿情分析 消費輿情 輿情周報 新聞輿情 民生輿情 社會輿論熱點 輿情監(jiān)測軟件排名 網(wǎng)絡(luò)輿情 校園輿情 短視頻 輿情傳播 輿情熱點事件 旅游輿情 景區(qū)輿情 網(wǎng)絡(luò)安全 蟻坊軟件 輿情事件 輿情匯總 教育輿情 市場監(jiān)管 金融輿情 金融監(jiān)督管理局 財經(jīng)金融輿情監(jiān)測 輿情輿論匯總 學校輿情 涉警輿情 社會輿情 網(wǎng)絡(luò)熱點事件 近期輿情 突發(fā)公共事件 公安輿情監(jiān)測分析 公安類輿情 娛樂輿情 AI輿情監(jiān)測服務(wù)平臺 大數(shù)據(jù)服務(wù)平臺 輿情系統(tǒng) AI輿情監(jiān)測服務(wù) 輿情監(jiān)測解決方案 月度輿情分析 AI輿情服務(wù) 人工智能 輿論監(jiān)測 2024年報告 網(wǎng)絡(luò)輿情監(jiān)測 蟻坊 假期輿情 交通輿情 在線監(jiān)測軟件 輿情監(jiān)測預警 輿情監(jiān)測平臺 高校輿情 輿情分析研判 新媒體輿情 數(shù)據(jù)監(jiān)測 輿情查詢 輿情數(shù)據(jù)分析 輿情治理 網(wǎng)絡(luò)輿情治理 網(wǎng)絡(luò)綜合治理 網(wǎng)絡(luò)信息生態(tài)治理 輿情應對 應急輿情 輿情風險監(jiān)測 災害輿情 應急管理 輿論態(tài)勢 輿情信息分析 輿情回應 輿情風險 公共事件輿情 輿情監(jiān)測方法 互聯(lián)網(wǎng)輿情監(jiān)測平臺 視頻輿情監(jiān)測 輿情平臺 輿情預警 輿情態(tài)勢 農(nóng)業(yè)輿情 農(nóng)村輿情 老年人保護輿情 輿論風險防范 輿論監(jiān)測軟件 網(wǎng)絡(luò)輿論監(jiān)測 婦女兒童輿情 網(wǎng)紅直播 中國食品藥品安全輿情事件案例 政務(wù)輿情 大數(shù)據(jù)輿情 網(wǎng)上輿情 安全生產(chǎn) 食品輿情 輿情搜索 疫情輿情 涉穩(wěn)輿情 航空輿情 開源情報工具 輿情監(jiān)測報價 網(wǎng)絡(luò)傳播規(guī)律 傳播路徑分析 政府輿情 涉法輿情 檢察輿情 網(wǎng)絡(luò)輿情分析系統(tǒng) 抗擊疫情 疫情輿情分析 輿情管理 社交媒體輿情 謠言傳播 輿情監(jiān)測方案 網(wǎng)絡(luò)社會熱點輿情分析系統(tǒng) 免費輿情監(jiān)測軟件 免費大數(shù)據(jù)平臺有哪些 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng)哪家好 互聯(lián)網(wǎng)輿情監(jiān)測 2023年輿情分析報告 電力輿情 高考輿情 互聯(lián)網(wǎng)輿情 政府輿情監(jiān)測 輿情監(jiān)測服務(wù)商 鐵路輿情 轄區(qū)輿情監(jiān)測 如何網(wǎng)絡(luò)輿情 能源輿情 企業(yè)輿情 政策輿情 危機公關(guān) 輿情告警 智慧城市 輿情案例 數(shù)據(jù)分析軟件有哪些 網(wǎng)信辦信息匯總 輿情監(jiān)測哪家好 網(wǎng)絡(luò)輿情網(wǎng) 鄉(xiāng)鎮(zhèn)輿情 稅務(wù)輿情 輿情處置 互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng) 生態(tài)環(huán)境輿情 負面輿情 消防救援輿情 輿情案例分析 地震輿情 明星輿情 新媒體輿情監(jiān)測 自媒體輿情監(jiān)測 輿情監(jiān)控前幾大公司 社交新全媒體監(jiān)測系統(tǒng)工具平臺公司 法治輿情 司法輿情 法院輿情 網(wǎng)紅輿情 23年輿情報告 網(wǎng)絡(luò)意識形態(tài) 在線輿情監(jiān)測 涉毒輿情 科技輿情 鷹眼速讀網(wǎng) 鷹擊早發(fā)現(xiàn) 監(jiān)獄輿情輿論 大數(shù)據(jù)分析工具 大數(shù)據(jù)輿情監(jiān)測 做好輿情監(jiān)控 政府輿情監(jiān)測系統(tǒng) 大數(shù)據(jù)輿情分析 媒體輿情 媒體輿論 網(wǎng)絡(luò)在線教學輿情 煙草輿情輿論 會議輿情 輿情預警系統(tǒng) 媒體監(jiān)測 環(huán)境輿情 輿情專報 次生輿情 輿情分析服務(wù) 輿論反應 信息戰(zhàn) 輿論戰(zhàn) 輿論趨勢 新聞輿論陣地管理 自媒體傳播 自媒體亂象 女權(quán)輿論 性別矛盾 民族宗教輿情 宗教輿情 銀行輿情 互聯(lián)網(wǎng)輿情治理 2022年輿情報告 未成年人輿情 輿情引導 輿情日報 兩會輿情 審計局 輿論失焦 政法輿情 網(wǎng)絡(luò)實名制 輿情監(jiān)督 奧運會 疫情搜索大數(shù)據(jù) 輿論知識點 新聞傳播理論 新疆棉花 社會情緒指數(shù) 正面輿情 網(wǎng)絡(luò)暴力 社會性死亡 辟謠 涉犬輿情 事件過程 鷹眼輿情 鷹擊 清博大數(shù)據(jù)輿情 輿情格式 疫情輿情分析報告 抗疫英雄事跡輿情 虛假新聞 什么是輿情 2020年輿情報告 2020年輿情 深度學習算法 機器學習 輿論分析 輿情公關(guān) 虐童事件 反轉(zhuǎn)新聞 網(wǎng)紅 微輿情 微博傳播分析 手機輿情監(jiān)測 新浪輿情 新華輿情 2019網(wǎng)絡(luò)熱詞 網(wǎng)絡(luò)流行語 百度輿情監(jiān)測 企業(yè)危機管理 315 網(wǎng)絡(luò)輿情危機 網(wǎng)絡(luò)輿情監(jiān)測公司 互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng) 輿情是什么意思 德云社 網(wǎng)絡(luò)輿論分析 大數(shù)據(jù)輿情監(jiān)測案例 網(wǎng)絡(luò)熱詞 微博數(shù)據(jù)分析 輿情監(jiān)測公司 2019輿情熱點 犯罪輿情 股票輿情 消防輿情 微信輿情監(jiān)測 民航輿情 人物輿情 公益輿情 感動中國 影視輿情 輿論監(jiān)督 2019輿情 2018輿情事件盤點 2018輿情報告 免費輿情監(jiān)測系統(tǒng) 霧霾輿情 港澳臺輿情 涉軍輿情 拆遷輿情 輿情反轉(zhuǎn) 反腐輿情 海外輿情 信息惠民 體育輿情 強拆輿情 輿情指數(shù) 環(huán)保輿情