大型網(wǎng)站的架構(gòu)演化過程,你知道嗎?(上)
2021-07-15
說到大型網(wǎng)站,我們先來說說大型網(wǎng)站的特點:高并發(fā)、大流量、高可用、海量數(shù)據(jù)等。再來說說大型網(wǎng)站的架構(gòu)演進。
1、網(wǎng)站架構(gòu)初期
初期比較簡單,一般一個服務器就可以搞個網(wǎng)站,看圖。
應用程序、數(shù)據(jù)庫、文件等所有資源都在一臺服務器上。通??梢杂肞HP完成整個項目的部署,然后買個域名租個便宜的服務器開始我們的建站之旅
2、應用服務和數(shù)據(jù)服務分離
隨著網(wǎng)站業(yè)務的發(fā)展php大型網(wǎng)站技術(shù)架構(gòu),一臺服務器逐漸不能滿足需求;這時候需要把應用和數(shù)據(jù)分開,如圖。
這三臺服務器的要求不同:
應用和數(shù)據(jù)分離后,每個職責變得更加具體,網(wǎng)站的性能進一步提升。但是,隨著用戶數(shù)量的不斷增加,我們需要進一步優(yōu)化網(wǎng)站結(jié)構(gòu)
3.使用緩存提升網(wǎng)站性能
毫無疑問,今天的網(wǎng)站基本上都使用緩存,即80%的業(yè)務訪問會集中在20%的數(shù)據(jù)上。
網(wǎng)站緩存可以分為兩種:應用服務器上緩存的本地緩存和專用分布式緩存服務器上緩存的遠程緩存
4、使用應用服務器集群提高網(wǎng)站并發(fā)處理能力
由于單個應用服務器可以處理的請求連接數(shù)有限,在網(wǎng)站訪問高峰期,應用服務器會成為整個網(wǎng)站的瓶頸。因此,使用負載均衡處理器是不可避免的。通過負載均衡調(diào)度服務器,可以將來自瀏覽器的訪問請求分發(fā)到應用集群中的任意服務器。
5、數(shù)據(jù)庫讀寫分離
使用緩存后php大型網(wǎng)站技術(shù)架構(gòu),大部分操作無需訪問數(shù)據(jù)庫即可完成,但仍有部分讀操作(緩存訪問未命中、緩存過期),所有寫操作都需要訪問數(shù)據(jù)庫。網(wǎng)站的用戶數(shù)達到一定程度,就會出現(xiàn)數(shù)據(jù)庫的負載問題。
當用戶達到一定規(guī)模時,數(shù)據(jù)庫因負載壓力過大成為網(wǎng)站的瓶頸。目前主流數(shù)據(jù)庫都提供了主從熱備份功能。通過配置兩個數(shù)據(jù)庫之間的主從關(guān)系,可以將一個數(shù)據(jù)庫的數(shù)據(jù)更新同步到另一臺服務器。網(wǎng)站利用數(shù)據(jù)庫的功能實現(xiàn)了數(shù)據(jù)庫的讀寫分離,從而提高了數(shù)據(jù)庫的負載壓力。
應用服務器在寫操作時訪問主庫,主庫通過主從復制機制同步更新數(shù)據(jù)到從庫,這樣應用服務器在執(zhí)行讀操作時就可以訪問來自數(shù)據(jù)庫的數(shù)據(jù)
6、使用反向代理和CDN加網(wǎng)站響應
提高網(wǎng)站訪問速度,主要手段是使用CDN和反向代理。
CDN 和反向代理的基本原理都是緩存。不同的是CDN部署在網(wǎng)絡提供商的機房,而反向代理部署在網(wǎng)站的中心機房。當用戶請求到達中心機房時,第一個訪問到代理,如果反向代理緩存了用戶請求的資源,則直接返回給用戶。
7、使用分布式文件系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)
任何強大的單一服務器都無法滿足大型網(wǎng)站不斷增長的業(yè)務需求。
分布式數(shù)據(jù)庫中網(wǎng)站數(shù)據(jù)庫拆分的最后手段只有在單表數(shù)據(jù)規(guī)模非常大時才使用。萬不得已,網(wǎng)站比較常用的數(shù)據(jù)庫拆分方式是業(yè)務拆分,將不同的業(yè)務數(shù)據(jù)部署在不同的物理服務器上。
8、使用和搜索引擎
搜索引擎已經(jīng)基本形成了現(xiàn)在大型網(wǎng)站必須提供的功能,網(wǎng)站需要采用一些非關(guān)系數(shù)據(jù)庫技術(shù),如搜索引擎等非數(shù)據(jù)庫查詢技術(shù)。
9、業(yè)務拆分
對于大型網(wǎng)站,我們可以分而治之,將整個網(wǎng)站業(yè)務劃分為不同的模塊。例如,大規(guī)模的交易和購物可以分為首頁、店鋪、訂單、買家等,分配給不同的業(yè)務團隊。
同時,我們按照模塊將一個網(wǎng)站拆分為多個應用程序。每個應用程序單獨部署和維護,通過應用程序之間的超鏈接(指向不同的應用程序地址)建立關(guān)系,最后通過同一個數(shù)據(jù)存儲系統(tǒng)形成一個相互連接的完整系統(tǒng)
10、分布式服務
隨著業(yè)務的拆分,整個系統(tǒng)變得越來越大,應用的整體復雜度呈指數(shù)級增長,部署和維護變得越來越困難,所有應用服務器都必須連接到數(shù)據(jù)庫服務。在規(guī)模的情況下,這些連接的數(shù)量是服務器規(guī)模的平方,導致資源不足
這時候就需要提取同一個業(yè)務,獨立部署,提取這些可復用的業(yè)務和連接數(shù)據(jù)庫等,提取為公共業(yè)務服務,應用系統(tǒng)只需要訪問公共業(yè)務服務通過分布式服務完成業(yè)務運營