在Power BI Desktop中制作數(shù)據(jù)地圖時,由于BING地圖中的中文數(shù)據(jù)不那么準(zhǔn)確,如果只使用漢字的地名進(jìn)行地圖繪制,往往會出現(xiàn)莫名其妙的情況,明顯是國內(nèi)地址,會出國。所以最準(zhǔn)確的方法是通過經(jīng)緯度定位。
現(xiàn)在網(wǎng)絡(luò)上各種數(shù)據(jù)。搜索后,有很多網(wǎng)站提供經(jīng)緯度查詢。我們的地圖不需要很高的經(jīng)緯度精度。我們找到了一個可以查詢?nèi)珖魇∈锌h經(jīng)緯度的網(wǎng)站:
找到上海,隨便在哪個區(qū)查:果然
檢查網(wǎng)頁上的連接地址,非常簡單,應(yīng)該直接爬取:
這種結(jié)構(gòu)的網(wǎng)頁通常是通過子頁面的連接來搜索內(nèi)容,而不是現(xiàn)成的數(shù)據(jù)表。一頁只有三個有用的數(shù)據(jù):地名、經(jīng)度和緯度。所以我們需要在文本中打開它,然后過濾出我們需要的內(nèi)容,然后進(jìn)行排序。
但是,我們不能一個接一個地手工添加這么多子頁面。當(dāng)從任何頁面進(jìn)入時,都有來自其他區(qū)域的連接,所以我們可以通過這個連接自動添加它們。
第一部分獲取所有鏈接地址
先修改這個源碼的設(shè)置,注意設(shè)置GB2312編碼,否則漢字亂碼。
預(yù)留行,從109行開始,共19行
下一步是提取內(nèi)容:每個區(qū)的名稱和連接的地址;
此提取>:分隔符之間的文本,非常容易使用。在高級設(shè)置中應(yīng)跳過1個字符。請注意這一點(diǎn)”
獲取連接地址的方法是一樣的,但是不要跳過,可以直接獲取:
第二部分抓取
自定義列:可以使用Web進(jìn)行查詢。內(nèi)容根據(jù)鏈接地址。
單擊編輯后,將出現(xiàn)一個對話框,您仍然需要在其中選擇一個文本文件:
接下來是合并文件,選擇GB2312編碼要注意:
Power Query會像我們合并文件一樣自動生成一個用戶自定義函數(shù),參照這個用戶自定義函數(shù)合并所有頁面。為了方便后續(xù)操作,我們將在正確的步驟中后退一步,找到其他刪除的列。在這里,我們將檢索自動刪除的地區(qū)的名稱。如果我們沒有找到它們,我們將在以后再次提取它們。
最后的結(jié)果是這樣的:第二部分工作完成。
第三部分整理數(shù)據(jù)
在這么多行中,只有19行對我們有用
我們需要過濾掉這19行:通過觀察,只要包含這兩個關(guān)鍵詞的行是我們需要的,世界就會突然變得清爽。
使用提取>:分隔符之間的文本,這次不需要轉(zhuǎn)換它,而是使用添加列內(nèi)的提取來保存復(fù)制的列。首先提取經(jīng)度:
然后提取緯度:
最后,修改以下名稱和數(shù)據(jù)類型,您就完成了:
我們模擬了每個地區(qū)的銷售數(shù)據(jù)列表,然后用每個地區(qū)的名稱為索引列建立了一個表關(guān)系:
可以去BI做個圖:
最好將此網(wǎng)絡(luò)捕獲的數(shù)據(jù)作為歸檔文件保存在本地。不需要每次都在網(wǎng)絡(luò)上刷新。只需在Power BI Desktop中以表格模式復(fù)制表格,粘貼到Excel中即可。
如果在Excel中抓取Power Query中的數(shù)據(jù),會簡單一些,直接加載到表格中復(fù)制即可。
1.《上海經(jīng)緯度 Power Query獲取上海市各區(qū)的經(jīng)緯度》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《上海經(jīng)緯度 Power Query獲取上海市各區(qū)的經(jīng)緯度》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進(jìn)行證實(shí),對其原創(chuàng)性、真實(shí)性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/keji/1316387.html