可能所有前端工程師都想了解瀏覽器的工作方式。
我們希望知道從在瀏覽器地址欄中輸入 url 到頁面展現(xiàn)的短短幾秒內瀏覽器究竟做了什么;
我們希望了解平時常常聽說的各種代碼優(yōu)化方案是究竟為什么能起到優(yōu)化的作用;
我們希望更細化的了解瀏覽器的渲染流程。
瀏覽器的多進程架構
一個好的程序常常被劃分為幾個相互獨立又彼此配合的模塊,瀏覽器也是如此,以 Chrome 為例,它由多個進程組成,每個進程都有自己核心的職責,它們相互配合完成瀏覽器的整體功能,每個進程中又包含多個線程,一個進程內的多個線程也會協(xié)同工作,配合完成所在進程的職責。
對一些前端開發(fā)同學來說,進程和線程的概念可能會有些模糊,為了更好的理解瀏覽器的多進程架構,這里我們簡單討論一下進程和線程。
進程(process)和線程(thread)
進程就像是一個有邊界的生產(chǎn)廠間,而線程就像是廠間內的一個個員工,可以自己做自己的事情,也可以相互配合做同一件事情。
當我們啟動一個應用,計算機會創(chuàng)建一個進程,操作系統(tǒng)會為進程分配一部分內存,應用的所有狀態(tài)都會保存在這塊內存中,應用也許還會創(chuàng)建多個線程來輔助工作,這些線程可以共享這部分內存中的數(shù)據(jù)。如果應用關閉,進程會被終結,操作系統(tǒng)會釋放相關內存。更生動的示意圖如下:
一個進程還可以要求操作系統(tǒng)生成另一個進程來執(zhí)行不同的任務,系統(tǒng)會為新的進程分配獨立的內存,兩個進程之間可以使用 IPC (Inter Process Communication)進行通信。很多應用都會采用這樣的設計,如果一個工作進程反應遲鈍,重啟這個進程不會影響應用其它進程的工作。
如果對進程及線程的理解還存在疑惑,可以參考下述文章:
瀏覽器的架構
有了上面的知識做鋪墊,我們可以更合理的討論瀏覽器的架構了,其實如果要開發(fā)一個瀏覽器,它可以是單進程多線程的應用,也可以是使用 IPC 通信的多進程應用。
不同瀏覽器的架構模型
不同瀏覽器采用了不同的架構模式,這里并不存在標準,本文以 Chrome 為例進行說明 :
Chrome 采用多進程架構,其頂層存在一個 Browser process 用以協(xié)調瀏覽器的其它進程。
Chrome 的不同進程
具體說來,Chrome 的主要進程及其職責如下:
Browser Process:
- 負責包括地址欄,書簽欄,前進后退按鈕等部分的工作;
- 負責處理瀏覽器的一些不可見的底層操作,比如網(wǎng)絡請求和文件訪問;
Renderer Process:
- 負責一個 tab 內關于網(wǎng)頁呈現(xiàn)的所有事情
Plugin Process:
- 負責控制一個網(wǎng)頁用到的所有插件,如 flash
- GPU Process
- 負責處理 GPU 相關的任務
不同進程負責的瀏覽器區(qū)域示意圖
Chrome 還為我們提供了「任務管理器」,供我們方便的查看當前瀏覽器中運行的所有進程及每個進程占用的系統(tǒng)資源,右鍵單擊還可以查看更多類別信息。
通過「頁面右上角的三個點點點 — 更多工具 — 任務管理器」即可打開相關面板。
Chrome 多進程架構的優(yōu)缺點
優(yōu)點
某一渲染進程出問題不會影響其他進程
更為安全,在系統(tǒng)層面上限定了不同進程的權限
缺點
由于不同進程間的內存不共享,不同進程的內存常常需要包含相同的內容。
為了節(jié)省內存,Chrome 限制了最多的進程數(shù),最大進程數(shù)量由設備的內存和 CPU 能力決定,當達到這一限制時,新打開的 Tab 會共用之前同一個站點的渲染進程。
測試了一下在 Chrome 中打開不斷打開知乎首頁,在 Mac i5 8g 上可以啟動四十多個渲染進程,之后新打開 tab 會合并到已有的渲染進程中。
Chrome 把瀏覽器不同程序的功能看做服務,這些服務可以方便的分割為不同的進程或者合并為一個進程。以 Broswer Process 為例,如果 Chrome 運行在強大的硬件上,它會分割不同的服務到不同的進程,這樣 Chrome 整體的運行會更加穩(wěn)定,但是如果 Chrome 運行在資源貧瘠的設備上,這些服務又會合并到同一個進程中運行,這樣可以節(jié)省內存,示意圖如下。
iframe 的渲染 – Site Isolation
在上面的進程圖中我們還可以看到一些進程下還存在著 Subframe,這就是 Site Isolation 機制作用的結果。
Site Isolation 機制從 Chrome 67 開始默認啟用。這種機制允許在同一個 Tab 下的跨站 iframe 使用單獨的進程來渲染,這樣會更為安全。
iframe 會采用不同的渲染進程
Site Isolation 被大家看做里程碑式的功能, 其成功實現(xiàn)是多年工程努力的結果。Site Isolation 不是簡單的疊加多個進程。這種機制在底層改變了 iframe 之間通信的方法,Chrome 的其它功能都需要做對應的調整,比如說 devtools 需要相應的支持,甚至 Ctrl + F 也需要支持。關于 Site Isolation 的更多內容可參考下述鏈接:
介紹完了瀏覽器的基本架構模式,接下來我們看看一個常見的導航過程對瀏覽器來說究竟發(fā)生了什么。
導航過程發(fā)生了什么
也許大多數(shù)人使用 Chrome 最多的場景就是在地址欄輸入關鍵字進行搜索或者輸入地址導航到某個網(wǎng)站,我們來看看瀏覽器是怎么看待這個過程的。
我們知道瀏覽器 Tab 外的工作主要由 Browser Process 掌控,Browser Process 又對這些工作進一步劃分,使用不同線程進行處理:
- UI thread : 控制瀏覽器上的按鈕及輸入框;
- network thread: 處理網(wǎng)絡請求,從網(wǎng)上獲取數(shù)據(jù);
- storage thread: 控制文件等的訪問;
瀏覽器主進程中的不同線程
回到我們的問題,當我們在瀏覽器地址欄中輸入文字,并點擊回車獲得頁面內容的過程在瀏覽器看來可以分為以下幾步:
1. 處理輸入
UI thread 需要判斷用戶輸入的是 URL 還是 query;
2. 開始導航
當用戶點擊回車鍵,UI thread 通知 network thread 獲取網(wǎng)頁內容,并控制 tab 上的 spinner 展現(xiàn),表示正在加載中。
network thread 會執(zhí)行 DNS 查詢,隨后為請求建立 TLS 連接。
UI thread 通知 Network thread 加載相關信息
如果 network thread 接收到了重定向請求頭如 301,network thread 會通知 UI thread 服務器要求重定向,之后,另外一個 URL 請求會被觸發(fā)。
3. 讀取響應
當請求響應返回的時候,network thread 會依據(jù) Content-Type 及 MIME Type sniffing 判斷響應內容的格式。
判斷響應內容的格式
如果響應內容的格式是 HTML ,下一步將會把這些數(shù)據(jù)傳遞給 renderer process,如果是 zip 文件或者其它文件,會把相關數(shù)據(jù)傳輸給下載管理器。
Safe Browsing 檢查也會在此時觸發(fā),如果域名或者請求內容匹配到已知的惡意站點,network thread 會展示一個警告頁。此外 CORB 檢測也會觸發(fā)確保敏感數(shù)據(jù)不會被傳遞給渲染進程。
4. 查找渲染進程
當上述所有檢查完成,network thread 確信瀏覽器可以導航到請求網(wǎng)頁,network thread 會通知 UI thread 數(shù)據(jù)已經(jīng)準備好,UI thread 會查找到一個 renderer process 進行網(wǎng)頁的渲染。
收到 Network thread 返回的數(shù)據(jù)后,UI thread 查找相關的渲染進程
由于網(wǎng)絡請求獲取響應需要時間,這里其實還存在著一個加速方案。當 UI thread 發(fā)送 URL 請求給 network thread 時,瀏覽器其實已經(jīng)知道了將要導航到那個站點。UI thread 會并行的預先查找和啟動一個渲染進程,如果一切正常,當 network thread 接收到數(shù)據(jù)時,渲染進程已經(jīng)準備就緒了,但是如果遇到重定向,準備好的渲染進程也許就不可用了,這時候就需要重啟一個新的渲染進程。
5. 確認導航
進過了上述過程,數(shù)據(jù)以及渲染進程都可用了, Browser Process 會給 renderer process 發(fā)送 IPC 消息來確認導航,一旦 Browser Process 收到 renderer process 的渲染確認消息,導航過程結束,頁面加載過程開始。
此時,地址欄會更新,展示出新頁面的網(wǎng)頁信息。history tab 會更新,可通過返回鍵返回導航來的頁面,為了讓關閉 tab 或者窗口后便于恢復,這些信息會存放在硬盤中。
6. 額外的步驟
一旦導航被確認,renderer process 會使用相關的資源渲染頁面,下文中我們將重點介紹渲染流程。當 renderer process 渲染結束(渲染結束意味著該頁面內的所有的頁面,包括所有 iframe 都觸發(fā)了 onload 時),會發(fā)送 IPC 信號到 Browser process, UI thread 會停止展示 tab 中的 spinner。
Renderer Process 發(fā)送 IPC 消息通知 browser process 頁面已經(jīng)加載完成。
當然上面的流程只是網(wǎng)頁首幀渲染完成,在此之后,客戶端依舊可下載額外的資源渲染出新的視圖。
在這里我們可以明確一點,所有的 JS 代碼其實都由 renderer Process 控制的,所以在你瀏覽網(wǎng)頁內容的過程大部分時候不會涉及到其它的進程。不過也許你也曾經(jīng)監(jiān)聽過 beforeunload 事件,這個事件再次涉及到 Browser Process 和 renderer Process 的交互,當當前頁面關閉時(關閉 Tab ,刷新等等),Browser Process 需要通知 renderer Process 進行相關的檢查,對相關事件進行處理。
瀏覽器進程發(fā)送 IPC 消息給渲染進程,通知要離開當前網(wǎng)站了
如果導航由 renderer process 觸發(fā)(比如在用戶點擊某鏈接,或者 JS 執(zhí)行 window.location = "; ) renderer process 會首先檢查是否有 beforeunload 事件處理器,導航請求由 renderer process 傳遞給 Browser process。
如果導航到新的網(wǎng)站,會啟用一個新的 render process 來處理新頁面的渲染,老的進程會留下來處理類似 unload 等事件。
關于頁面的生命周期,更多內容可參考 Page Lifecycle API 。
瀏覽器進程發(fā)送 IPC 消息到新的渲染進程通知渲染新的頁面,同時通知舊的渲染進程卸載。
除了上述流程,有些頁面還擁有 Service Worker (服務工作線程),Service Worker 讓開發(fā)者對本地緩存及判斷何時從網(wǎng)絡上獲取信息有了更多的控制權,如果 Service Worker 被設置為從本地 cache 中加載數(shù)據(jù),那么就沒有必要從網(wǎng)上獲取更多數(shù)據(jù)了。
值得注意的是 service worker 也是運行在渲染進程中的 JS 代碼,因此對于擁有 Service Worker 的頁面,上述流程有些許的不同。
當有 Service Worker 被注冊時,其作用域會被保存,當有導航時,network thread 會在注冊過的 Service Worker 的作用域中檢查相關域名,如果存在對應的 Service worker,UI thread 會找到一個 renderer process 來處理相關代碼,Service Worker 可能會從 cache 中加載數(shù)據(jù),從而終止對網(wǎng)絡的請求,也可能從網(wǎng)上請求新的數(shù)據(jù)。
Service Worker 依據(jù)具體情形做處理。
關于 Service Worker 的更多內容可參考:
如果 Service Worker 最終決定通過網(wǎng)上獲取數(shù)據(jù),Browser 進程 和 renderer 進程的交互其實會延后數(shù)據(jù)的請求時間 。Navigation Preload 是一種與 Service Worker 并行的加速加載資源的機制,服務端通過請求頭可以識別這類請求,而做出相應的處理。
更多內容可參考:
渲染進程是如何工作的?
渲染進程幾乎負責 Tab 內的所有事情,渲染進程的核心目的在于轉換 HTML CSS JS 為用戶可交互的 web 頁面。渲染進程中主要包含以下線程:
渲染進程包含的線程
1. 主線程 Main thread
2. 工作線程 Worker thread
3. 排版線程 Compositor thread
4. 光柵線程 Raster thread
后文我們將逐步介紹不同線程的職責,在此之前我們先看看渲染的流程。
1. 構建 DOM
當渲染進程接收到導航的確認信息,開始接受 HTML 數(shù)據(jù)時,主線程會解析文本字符串為 DOM。
渲染 html 為 DOM 的方法由 HTML Standard 定義。
2. 加載次級的資源
網(wǎng)頁中常常包含諸如圖片,CSS,JS 等額外的資源,這些資源需要從網(wǎng)絡上或者 cache 中獲取。主進程可以在構建 DOM 的過程中會逐一請求它們,為了加速 preload scanner 會同時運行,如果在 html 中存在 <img><link> 等標簽,preload scanner 會把這些請求傳遞給 Browser process 中的 network thread 進行相關資源的下載。
3.JS 的下載與執(zhí)行
當遇到 <script> 標簽時,渲染進程會停止解析 HTML,而去加載,解析和執(zhí)行 JS 代碼,停止解析 html 的原因在于 JS 可能會改變 DOM 的結構(使用諸如 documwnt.write()等 API)。
不過開發(fā)者其實也有多種方式來告知瀏覽器應對如何應對某個資源,比如說如果在<script> 標簽上添加了 async 或 defer 等屬性,瀏覽器會異步的加載和執(zhí)行 JS 代碼,而不會阻塞渲染。更多的方法可參考 Resource Prioritization – Getting the Browser to Help You。
4. 樣式計算
僅僅渲染 DOM 還不足以獲知頁面的具體樣式,主進程還會基于 CSS 選擇器解析 CSS 獲取每一個節(jié)點的最終的計算樣式值。即使不提供任何 CSS,瀏覽器對每個元素也會有一個默認的樣式。
渲染進程主線程計算每一個元素節(jié)點的最終樣式值
5. 獲取布局
想要渲染一個完整的頁面,除了獲知每個節(jié)點的具體樣式,還需要獲知每一個節(jié)點在頁面上的位置,布局其實是找到所有元素的幾何關系的過程。其具體過程如下:
通過遍歷 DOM 及相關元素的計算樣式,主線程會構建出包含每個元素的坐標信息及盒子大小的布局樹。布局樹和 DOM 樹類似,但是其中只包含頁面可見的元素,如果一個元素設置了 display:none ,這個元素不會出現(xiàn)在布局樹上,偽元素雖然在 DOM 樹上不可見,但是在布局樹上是可見的。
6. 繪制各元素
即使知道了不同元素的位置及樣式信息,我們還需要知道不同元素的繪制先后順序才能正確繪制出整個頁面。在繪制階段,主線程會遍歷布局樹以創(chuàng)建繪制記錄。繪制記錄可以看做是記錄各元素繪制先后順序的筆記。
主線程依據(jù)布局樹構建繪制記錄
7. 合成幀
熟悉 PS 等繪圖軟件的童鞋肯定對圖層這一概念不陌生,現(xiàn)代 Chrome 其實利用了這一概念來組合不同的層。
復合是一種分割頁面為不同的層,并單獨柵格化,隨后組合為幀的技術。不同層的組合由 compositor 線程(合成器線程)完成。
主線程會遍歷布局樹來創(chuàng)建層樹(layer tree),添加了 will-change CSS 屬性的元素,會被看做單獨的一層。
主線程遍歷布局樹生成層樹
你可能會想給每一個元素都添加上 will-change,不過組合過多的層也許會比在每一幀都柵格化頁面中的某些小部分更慢。為了更合理的使用層,可參考 堅持僅合成器的屬性和管理層計數(shù) 。
一旦層樹被創(chuàng)建,渲染順序被確定,主線程會把這些信息通知給合成器線程,合成器線程會柵格化每一層。有的層的可以達到整個頁面的大小,因此,合成器線程將它們分成多個磁貼,并將每個磁貼發(fā)送到柵格線程,柵格線程會柵格化每一個磁貼并存儲在 GPU 顯存中。
柵格線程會柵格化每一個磁貼并存儲在 GPU 顯存中
一旦磁貼被光柵化,合成器線程會收集稱為繪制四邊形的磁貼信息以創(chuàng)建合成幀。
合成幀隨后會通過 IPC 消息傳遞給瀏覽器進程,由于瀏覽器的 UI 改變或者其它拓展的渲染進程也可以添加合成幀,這些合成幀會被傳遞給 GPU 用以展示在屏幕上,如果滾動發(fā)生,合成器線程會創(chuàng)建另一個合成幀發(fā)送給 GPU。
合成器線程會發(fā)送合成幀給 GPU 渲染
合成器的優(yōu)點在于,其工作無關主線程,合成器線程不需要等待樣式計算或者 JS 執(zhí)行,這就是為什么合成器相關的動畫 最流暢,如果某個動畫涉及到布局或者繪制的調整,就會涉及到主線程的重新計算,自然會慢很多。
瀏覽器對事件的處理
瀏覽器通過對不同事件的處理來滿足各種交互需求,這一部分我們一起看看從瀏覽器的視角,事件是什么,在此我們先主要考慮鼠標事件。
在瀏覽器的看來,用戶的所有手勢都是輸入,鼠標滾動,懸置,點擊等等都是。
當用戶在屏幕上觸發(fā)諸如 touch 等手勢時,首先收到手勢信息的是 Browser process, 不過 Browser process 只會感知到在哪里發(fā)生了手勢,對 tab 內內容的處理是還是由渲染進程控制的。
事件發(fā)生時,瀏覽器進程會發(fā)送事件類型及相應的坐標給渲染進程,渲染進程隨后找到事件對象并執(zhí)行所有綁定在其上的相關事件處理函數(shù)。
事件從瀏覽器進程傳送給渲染進程
前文中,我們提到過合成器可以獨立于主線程之外通過合成柵格化層平滑的處理滾動。如果頁面中沒有綁定相關事件,組合器線程可以獨立于主線程創(chuàng)建組合幀。如果頁面綁定了相關事件處理器,主線程就不得不出來工作了。這時候合成器線程會怎么處理呢?
這里涉及到一個專業(yè)名詞「理解非快速滾動區(qū)域(non-fast scrollable region)」由于執(zhí)行 JS 是主線程的工作,當頁面合成時,合成器線程會標記頁面中綁定有事件處理器的區(qū)域為 non-fast scrollable region ,如果存在這個標注,合成器線程會把發(fā)生在此處的事件發(fā)送給主線程,如果事件不是發(fā)生在這些區(qū)域,合成器線程則會直接合成新的幀而不用等到主線程的響應。
涉及 non-fast scrollable region 的事件,合成器線程會通知主線程進行相關處理。
web 開發(fā)中常用的事件處理模式是事件委托,基于事件冒泡,我們常常在最頂層綁定事件:
復制代碼
document.body.addEventListener('touchstart', event => { if === area) { event.preventDefault(); } } );上述做法很常見,但是如果從瀏覽器的角度看,整個頁面都成了 non-fast scrollable region 了。
這意味著即使操作的是頁面無綁定事件處理器的區(qū)域,每次輸入時,合成器線程也需要和主線程通信并等待反饋,流暢的合成器獨立處理合成幀的模式就失效了。
由于事件綁定在最頂部,整個頁面都成為了 non-fast scrollable region。
為了防止這種情況,我們可以為事件處理器傳遞 passive: true 做為參數(shù),這樣寫就能讓瀏覽器即監(jiān)聽相關事件,又讓組合器線程在等等主線程響應前構建新的組合幀。
復制代碼
document.body.addEventListener('touchstart', event => { if === area) { event.preventDefault() } }, {passive: true} );不過上述寫法可能又會帶來另外一個問題,假設某個區(qū)域你只想要水平滾動,使用 passive: true 可以實現(xiàn)平滑滾動,但是垂直方向的滾動可能會先于event.preventDefault()發(fā)生,此時可以通過 event.cancelable 來防止這種情況。
復制代碼
document.body.addEventListener('pointermove', event => { if ) { event.preventDefault(); // block the native scroll /* * do what you want the application to do here */ } }, {passive: true});也可以使用 css 屬性 touch-action 來完全消除事件處理器的影響,如:
復制代碼
#area { touch-action: pan-x; }查找到事件對象
當組合器線程發(fā)送輸入事件給主線程時,主線程首先會進行命中測試(hit test)來查找對應的事件目標,命中測試會基于渲染過程中生成的繪制記錄( paint records )查找事件發(fā)生坐標下存在的元素。
主線程依據(jù)繪制記錄查找事件相關元素。
事件的優(yōu)化
一般我們屏幕的刷新速率為 60fps,但是某些事件的觸發(fā)量會不止這個值,出于優(yōu)化的目的,Chrome 會合并連續(xù)的事件 (如 wheel, mousewheel, mousemove, pointermove, touchmove ),并延遲到下一幀渲染時候執(zhí)行 。
而如 keydown, keyup, mouseup, mousedown, touchstart, 和 touchend 等非連續(xù)性事件則會立即被觸發(fā)。
Chrome 會合并連續(xù)事件到下一幀觸發(fā)。
合并事件雖然能提示性能,但是如果你的應用是繪畫等,則很難繪制一條平滑的曲線了,此時可以使用 getCoalescedEvents API 來獲取組合的事件。示例代碼如下:
復制代碼
window.addEventListener('pointermove', event => { const events = event.getCoalescedEvents(); for (let event of events) { const x = event.pageX; const y = event.pageY; // draw a line using x and y coordinates. } });花了好久來整理上面的內容,整理的過程收獲還挺大的,也希望這篇筆記能對你有所啟發(fā),如果有任何疑問,歡迎一起來討論。
本文經(jīng)作者授權轉載,原文鏈接為:
參考鏈接
1.《重定向瀏覽器怎么知道看這里!史上最全!圖解瀏覽器的工作原理》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡信息知識,僅代表作者本人觀點,與本網(wǎng)站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《重定向瀏覽器怎么知道看這里!史上最全!圖解瀏覽器的工作原理》僅供讀者參考,本網(wǎng)站未對該內容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉載時請保留本站內容來源地址,http://f99ss.com/gl/3076846.html