經(jīng)過這個嘗試后,嚴禁復制網(wǎng)頁內(nèi)容的人似乎不再煩惱了。(莎士比亞)。
每個網(wǎng)頁右鍵會出現(xiàn)一個查看網(wǎng)頁源代碼的選項,看看都有些什么,這對于理解下面的代碼是有用處的。注意看類似這些行<a class="nav-link" href=;Community</a>。代碼里的find字符"a"和get的"href"方法主要作用就在這里。
網(wǎng)頁源代碼
直接上代碼吧:
import requests as rq
from bs4 import BeautifulSoup
url = input("Enter Link: ")
if ("https" or "http") in url:
data = rq.get(url)
else:
data = rq.get("https://" + url)
soup = BeautifulSou, ";)
saved = open("myLinks.txt", 'w')
for link in ("a"):
prin("href"))
("href"))
("\n")
運行示意和輸出的文件
1.《網(wǎng)頁下載怎么提取鏈接地址?終于找到答案了Python版的迷你程序——獲取給定網(wǎng)頁上的所有鏈接》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《網(wǎng)頁下載怎么提取鏈接地址?終于找到答案了Python版的迷你程序——獲取給定網(wǎng)頁上的所有鏈接》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/gl/3053009.html