Hello,你好,今天,今天,我們?nèi)绾未罅孔ト【W(wǎng)頁(yè)上的數(shù)據(jù),如何抓住汽車投訴量,如何大量抓取網(wǎng)頁(yè)上的數(shù)據(jù),這也是一個(gè)粉絲問(wèn)的問(wèn)題。他要買輛車,想看看各家企業(yè)的高收量怎么樣。(威廉莎士比亞,哈姆雷特,車,車,車,車,車)不要多說(shuō)話,我們自己動(dòng)手吧。如果你進(jìn)來(lái)后知道各企業(yè)的投訴量和投訴的車型排名,直接拉到最后就可以了。
一、網(wǎng)頁(yè)分析
我們以捕捉車質(zhì)網(wǎng)的汽車投訴為例,說(shuō)明了如何大量收集數(shù)據(jù),如下圖所示。下圖分別是從第一頁(yè)到第三頁(yè)的網(wǎng)站。我們可以看到這三頁(yè)的網(wǎng)址。只有123(以紅色顯示)才知道對(duì)應(yīng)的頁(yè)碼不同。剩下的都一樣。
二、數(shù)據(jù)捕獲
然后打開(kāi)excel,單擊“數(shù)據(jù)功能”組在網(wǎng)站上查找。單擊“高級(jí)選項(xiàng)”,然后在輸入框中單獨(dú)放置表示頁(yè)碼的數(shù)字。您可以按一下「加入零件」來(lái)加入輸入方塊。設(shè)置完成后,直接單擊“確定”
這樣我們就進(jìn)入導(dǎo)航器的界面,在這個(gè)網(wǎng)頁(yè)上,power query都抓住了兩個(gè)內(nèi)容,我們可以具體看到我們需要的數(shù)據(jù)。其中table0是我們要抓取的數(shù)據(jù)。直接選擇table0選項(xiàng)并單擊“轉(zhuǎn)換數(shù)據(jù)”即可。然后我們進(jìn)入powerquery的編輯界面。
然后單擊高級(jí)編輯器,在let前面輸入(x as number) as table=,在URL中將“1”更改為(x),直接單擊即可
在這種情況下,將以前的操作封裝到函數(shù)中。輸入相應(yīng)的號(hào)碼,然后單擊“調(diào)用”轉(zhuǎn)到該頁(yè)碼的數(shù)據(jù)。
然后單擊左側(cè)的空白區(qū)域,右鍵單擊以選擇新建查詢,瀏覽到其他源,然后選擇空白查詢。然后在編輯欄上輸入={1.通過(guò)輸入100}單擊回車,可以得到從1到100的序列。然后單擊“表”將查詢轉(zhuǎn)換為表,然后單擊“確定”
然后選擇添加列,找到用戶定義的函數(shù),從功能查詢中選擇表0,單擊“確定”,power query開(kāi)始捕獲數(shù)據(jù)。其中,捕獲100頁(yè)網(wǎng)頁(yè)數(shù)據(jù)的過(guò)程可能會(huì)很長(zhǎng)。這里大約需要三分鐘。捕獲完成后,您將在每個(gè)序列后獲得一個(gè)表。單擊左箭頭、右箭頭、右箭頭和反向箭頭可以擴(kuò)展數(shù)據(jù)。移除原始列名前面的復(fù)選標(biāo)記,然后單擊“確定”刪除添加的序列。這樣就可以了。從頭關(guān)閉并上載可以將數(shù)據(jù)加載到Excel中。因?yàn)閿?shù)據(jù)很多,所以這個(gè)過(guò)程也需要更長(zhǎng)的時(shí)間,這里大約需要一分鐘。(大衛(wèi)亞設(shè),Northern Exposure)。
三、統(tǒng)計(jì)分析
數(shù)據(jù)加載到Excel中后,可以通過(guò)透視表快速分析數(shù)據(jù)。下圖基于從車質(zhì)網(wǎng)投訴記錄中收集的3000個(gè)數(shù)據(jù),通過(guò)透視表獲得投訴品牌和投訴車科的排名。這里3000個(gè)數(shù)據(jù)是近一個(gè)月的投訴量。
這就是我們大量收集100頁(yè)網(wǎng)頁(yè)數(shù)據(jù)的方法,以及確定各企業(yè)投訴排名的方法。整個(gè)過(guò)程大約需要7分鐘,大部分時(shí)間花費(fèi)在數(shù)據(jù)收集和加載上。(大衛(wèi)亞設(shè))。
怎么樣?你學(xué)了嗎?快點(diǎn)開(kāi)始吧。
我是??巳麪枴@^續(xù)分享更多的excel技術(shù)。
1.《【excel怎么跑數(shù)據(jù)】抓取了100頁(yè)的網(wǎng)頁(yè)數(shù)據(jù),還在復(fù)制粘貼嗎?使用Excel只需要7分鐘》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無(wú)關(guān),侵刪請(qǐng)聯(lián)系頁(yè)腳下方聯(lián)系方式。
2.《【excel怎么跑數(shù)據(jù)】抓取了100頁(yè)的網(wǎng)頁(yè)數(shù)據(jù),還在復(fù)制粘貼嗎?使用Excel只需要7分鐘》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來(lái)源地址,http://f99ss.com/keji/2482168.html