現(xiàn)在有很多的項目,對計數(shù)器的實現(xiàn)甚是隨意,比如在實現(xiàn)網(wǎng)站文章點擊數(shù)的時候,是這么設(shè)計數(shù)據(jù)表的,如:”article_id, article_name, article_content, article_author, article_view……在article_view中記錄該文章的瀏覽量。詐一看似乎沒有問題。對于小站,比如本博客,就是這么做的,因為小菜的博客難道會涉及并發(fā)問題嗎?答案顯而易見,一天沒多少IP,而且以后不會很大。
言歸正傳,對文章資訊類為主的項目,在瀏覽一個頁面的時候不但要進行大量的查(查詢上文的記錄,已經(jīng)所屬分類的名字、熱門文章資訊評論、TAG等),還要進行寫操作(更新瀏覽數(shù)點擊數(shù))。把文章的詳細(xì)內(nèi)容和計數(shù)器放在一張表盡管對開發(fā)很方便,但是會造成數(shù)據(jù)庫的壓力過大(不然為什么大項目都要分庫分表呢)。
那么,分兩張表存放就好了么?一張表存文章詳細(xì)信息,另一張表單獨存計數(shù)器。
代碼如下:
CREATE TABLE `article_view`(
`article_id` int(11) NOT NULL,
`view` int(11) NOT NULL,
PRIMARY KEY (`article_id`)
)ENGINE=InnoDB;
這種方式,雖然分擔(dān)了文章表的壓力,但是每當(dāng)有一個進程請求更新的時候,都會產(chǎn)生全局的互斥鎖,只能串行,不能并行。在高并發(fā)下會有較長的等待時間。
另一種比較好的辦法是對每一個文章的計數(shù)器不是一行,而是多行,比如吧,一百行。每次隨機更新其中一行,該文章的瀏覽數(shù)就是所有行的和。
代碼如下:
CREATE TABLE `article_view`(
`article_id` int(11) NOT NULL,
`pond` tinyint(4) NOT NULL COMMENT '池子,就是用來隨機用的',
`view` int(11) NOT NULL,
PRIMARY KEY (`article_id`,`pond`)
)ENGINE=InnoDB;
小訪問量的隨機池子100個肯定多了,三五個足矣。每次訪問的時候,隨機一個數(shù)字(1-100)作為pond,如何該pond存在則更新view+1,否則插入,view=1。借助DUPLICATE KEY,不然在程序里是實現(xiàn)得先SELECT,判斷一下再INSERT或者UPDATE。
代碼如下:
INSERT INTO `article_view` (`article_id`, `pond`, `view`) VALUES (`123`, RAND()*100, 1) ON DUPLICATE KEY UPDATE `view`=`view`+1
獲取指定文章的總訪問量的時候:
代碼如下:
SELECT SUM(`view`) FROM `article_view` WHERE `article_id`='123'
PS:凡事都是雙刃劍。為了更快的讀我們通常要犧牲一些東西。在讀比較多的表要加快讀的速度,在寫較多的表要加快寫的速度。各自權(quán)衡。在加快讀的速度的時候,我們犧牲的并不僅僅是寫的性能,還有開發(fā)成本,開發(fā)變的更復(fù)雜,維護成本等。所以并不是讀的速度越快越好,需要找一個平衡點。
更多信息請查看IT技術(shù)專欄