歡迎關(guān)注天山情報(bào)。我們是一個(gè)專注于商業(yè)智能BI、人工智能AI和大數(shù)據(jù)分析與挖掘的垂直社區(qū)。學(xué)習(xí)、問答、求職一站搞定!
對(duì)商業(yè)智能BI、大數(shù)據(jù)分析與挖掘、機(jī)器學(xué)習(xí)、python、R等數(shù)據(jù)領(lǐng)域感興趣的同學(xué)加微信:tsaiedu,注明消息來源,邀請(qǐng)你加入數(shù)據(jù)愛好者交流群,都在這里。
618狂歡,天山學(xué)院全程6.18折!投資知識(shí),賦予自己力量,蝴蝶很快就會(huì)改變!https://www.hellobi.com/618
本文來自天山無線城專欄作家:okajun相關(guān)文章鏈接:“單變量(多元)線性回歸分析的Excel實(shí)現(xiàn)”“單變量(多元)線性回歸分析的R語言實(shí)現(xiàn)”
我寫《一元線性回歸分析的Excel實(shí)現(xiàn)》的時(shí)候說過,我也會(huì)寫《一元線性回歸分析的R語言實(shí)現(xiàn)》及其Python實(shí)現(xiàn)。其實(shí)這個(gè)文檔早就準(zhǔn)備好了,只是一直沒有模型的測(cè)試方法,所以一直拖著。今天先分享一下我知道的。希望大家能給我很多指導(dǎo)和建議。
在這種情況下,仍然使用女性數(shù)據(jù)集和薪資數(shù)據(jù)集。下載請(qǐng)參考之前的博文。
1.線性回歸
1.1使用sklearn,所有樣本數(shù)據(jù)
首先導(dǎo)入要使用的庫(kù)和模塊
先做數(shù)據(jù)探索,做散點(diǎn)圖
我們可以看到體重和身高之間存在明顯的線性正相關(guān)關(guān)系。讓我們建立一個(gè)線性模型。
要查看模型結(jié)果:
得到一元線性方程:體重=-87.52+3.45身高
看預(yù)測(cè)值(直線)與真實(shí)值(散點(diǎn))
線性方程為weight =-87.77+3.46 h8,與1.1中的模型結(jié)果略有不同,因?yàn)槲覀冎挥?0%的數(shù)據(jù)建模。
使用測(cè)試集驗(yàn)證模型效果:
繪制以查看模型擬合效果:
輸出如下:
形象
由此可見,最好的模式是引入三個(gè)變量,‘年齡’、‘公司_年齡’和‘學(xué)歷’。
重新建模:
可以看出,新方程通過了F檢驗(yàn),系數(shù)都通過了T檢驗(yàn)。
回歸方程為工資=-4.463 e+04+2303.8365 age+1952.7198 company _ age+8052.9691 *學(xué)歷
如果想用嶺回歸,可以查看sklearn官網(wǎng)鐘靈回歸的介紹。
補(bǔ)充:Python中如何進(jìn)行正態(tài)分布檢驗(yàn)、齊次方差檢驗(yàn)、共線性檢驗(yàn),我還沒有找到好的方法。如果有人知道,歡迎不吝賜教,謝謝~
1.《一元線性回歸模型 一元(多元)線性回歸分析之Python語言實(shí)現(xiàn)》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請(qǐng)聯(lián)系頁腳下方聯(lián)系方式。
2.《一元線性回歸模型 一元(多元)線性回歸分析之Python語言實(shí)現(xiàn)》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來源地址,http://f99ss.com/shehui/964358.html