羨慕火影忍者里鳴人的影分身么?沒錯,php程序是可以開動影分身的!想完成任務,又覺得一個進程太慢,那么,試試用多進程來搞吧。這篇文章將會介紹一下php多進程的基本需求,如何創(chuàng)建多進程以及基本的信號控制,暫時不會告訴你如何進行進程間通信和信息共享。
1. 準備
在動手之前,請確定你用的不是m$ windows平臺(因為我沒有windows)。linux / bsd / unix應該都是沒問題的。確認好了工作環(huán)境以后一起來看看我們需要的php模塊是否都有。打開終端輸入下面的命令:
代碼如下:
$ php -m
這個命令檢查并打印當前php所有開啟的擴展,看一下pcntl和posix是否在輸出的列表中。
1.1. pcntl
如果找不到pcntl,八成是編譯的時候沒把這個擴展編譯進去。如果你和我一樣是編譯安裝的php,那么需要重新編譯安裝php。在配置的時候記得加上--enable-pcntl參數(shù)即可。
代碼如下:
$ cd /path/to/php_source_code_dir
$ ./configure [some other options] --enable-pcntl
$ make && make install
1.2. posix
這貨一般默認就會裝上,只要你編譯的時候沒有加上--disable-posix。
2. 預備知識
在繼續(xù)之前,你還需要對linux多進程有一點了解。多進程是咋回事呢?這里可跟火影忍者里的影分身稍微有點不同。首先,鳴人從小長到大,比如16歲,咳。有一天他發(fā)動了影分身,分出了5個他。顯然,這些分身也是16歲的鳴人而不是剛出生啥也不懂就會哭的嬰兒(那叫克?。?。然后,不一樣的地方來了:分身們變成了獨立的人各自去做各自的事,互相之間不再知道其他分身和原身都做了什么(當然不會像動畫片里一樣積累經(jīng)驗給原身啦)。除非,他們互相之間有交流,不然,只有16歲之前的事情才是他們共同的記憶。
有同學說了,老大你這不坑爹呢么?我又沒看過火影忍者!那你去看一遍好了……
最后,預備知識完了,就是大致了解一下主進程開出來的子進程是怎么回事。子進程的代碼和主進程是完全一樣的,還有一部分一樣的東西就是直到發(fā)動影分身之前執(zhí)行的所有內(nèi)容。
3. 影分身之術
所以呢,沒有點基礎知識怎么能理解卷軸里的內(nèi)容呢?打開卷軸首先看到了一個單詞:fork。
3.1. fork
叉子?叉子是分岔的,一個變多個嘛!差不多就是這個意思。創(chuàng)建子進程就用這個命令。這里需要用到pcntl_fork()函數(shù)。(可以先簡單看一下php手冊關于這個函數(shù)的介紹。)創(chuàng)建一個php腳本:
代碼如下:
$pid = pcntl_fork(); // 一旦調(diào)用成功,事情就變得有些不同了
if ($pid == -1) {
die('fork failed');
} else if ($pid == 0) {
} else {
}
pcntl_fork()函數(shù)創(chuàng)建一個子進程,子進程和父進程唯一的區(qū)別就是pid(進程id)和ppid(父進程id)不同。在終端下查看進程用ps命令(問問man看ps怎么用:man ps)。當函數(shù)返回值為-1的時候,說明fork失敗了。試試在if前面加一句:echo $pid . php_eol;。運行你的腳本,輸出可能像下面這樣(結(jié)果說明子進程和父進程的代碼是相同的):
代碼如下:
67789 # 這個是父進程打印的
0 # 這個是子進程打印的
pcntl_fork()函數(shù)調(diào)用成功后,在父進程中會返回子進程的pid,而在子進程中返回的是0。所以,下面直接用if分支來控制父進程和子進程做不同的事。
3.2. 分配任務
然后我們來說說鳴人16歲那次影分身的事兒,給原身和分身分配兩個簡單的輸出任務:
代碼如下:
$parentpid = getmypid(); // 這就是傳說中16歲之前的記憶
$pid = pcntl_fork(); // 一旦調(diào)用成功,事情就變得有些不同了
if ($pid == -1) {
die('fork failed');
} else if ($pid == 0) {
$mypid = getmypid(); // 用getmypid()函數(shù)獲取當前進程的pid
echo 'i am child process. my pid is ' . $mypid . ' and my father's pid is ' . $parentpid . php_eol;
} else {
echo 'oh my god! i am a father now! my child's pid is ' . $pid . ' and mine is ' . $parentpid . php_eol;
}
輸出的結(jié)果可能是這樣:
代碼如下:
oh my god! i am a father now! my child's pid is 68066 and mine is 68065
i am child process. my pid is 68066 and my father's pid is 68065
再強調(diào)一下,pcntl_fork()調(diào)用成功以后,一個程序變成了兩個程序:一個程序得到的$pid變量值是0,它是子進程;另一個程序得到的$pid的值大于0,這個值是子進程的pid,它是父進程。在下面的分支語句中,由于$pid值的不同,運行了不同的代碼。再次強調(diào)一下:子進程的代碼和父進程的是一樣的。所以就要通過分支語句給他們分配不同的任務。
3.3. 子進程回收
剛剛有man ps么?一般我習慣用ps aux加上grep命令來查找運行著的后臺進程。其中有一列stat,標識了每個進程的運行狀態(tài)。這里,我們關注狀態(tài)z:僵尸(zombie)。當子進程比父進程先退出,而父進程沒對其做任何處理的時候,子進程將會變成僵尸進程。oops,又跟火影里的影分身不一樣了。鳴人的影分身被干死了以后就自動消失了,但是這里的子進程分身死了話還留著一個空殼在,直到父進程回收它。僵尸進程雖然不占什么內(nèi)存,但是很礙眼,院子里一堆躺著的僵尸怎么都覺得怪怪的。(別忘了它們還占用著pid)
一般來說,在父進程結(jié)束之前回收掛掉的子進程就可以了。在pcntl擴展里面有一個pcntl_wait()函數(shù),它會將父進程掛起,直到有一個子進程退出為止。如果有一個子進程變成了僵尸的話,它會立即返回。所有的子進程都要回收,所以多等等也沒關系啦!
3.4. 父進程先掛了
如果父進程先掛了怎么辦?會發(fā)生什么?什么也不會發(fā)生,子進程依舊還在運行。但是這個時候,子進程會被交給1號進程,1號進程成為了這些子進程的繼父。1號進程會很好地處理這些進程的資源,當它們結(jié)束時1號進程會自動回收資源。所以,另一種處理僵尸進程的臨時辦法是關閉它們的父進程。
4. 信號
一般多進程的事兒講到上面就完了,可是信號在系統(tǒng)中確實是一個非常重要的東西。信號就是信號燈,點亮一個信號燈,程序就會做出反應。這個你一定用過,比如說在終端下運行某個程序,等了半天也沒什么反應,可能你會按 ctrl+c 來關閉這個程序。實際上,這里就是通過鍵盤向程序發(fā)送了一個中斷的信號:sigint。有時候進程失去響應了還會執(zhí)行kill [pid]命令,未加任何其他參數(shù)的話,程序會接收到一個sigterm信號。程序收到上面兩個信號的時候,默認都會結(jié)束執(zhí)行,那么是否有可能改變這種默認行為呢?必須能??!
4.1. 注冊信號
人是活的程序也是活的,只不過程序需要遵循人制定的規(guī)則來運行?,F(xiàn)在開始給信號重新設定規(guī)則,這里用到的函數(shù)是pcntl_signal()(繼續(xù)之前為啥不先查查php手冊呢?)。下面這段程序?qū)⒔osigint重新定義行為,注意看好:
代碼如下:
// 定義一個處理器,接收到sigint信號后只輸出一行信息
function signalhandler($signal) {
if ($signal == sigint) {
echo 'signal received' . php_eol;
}
}
// 信號注冊:當接收到sigint信號時,調(diào)用signalhandler()函數(shù)
pcntl_signal(sigint, 'signalhandler');
while (true) {
sleep(1);
// do something
pcntl_signal_dispatch(); // 接收到信號時,調(diào)用注冊的signalhandler()
}
執(zhí)行一下,隨時按下 ctrl+c 看看會發(fā)生什么事。
4.2. 信號分發(fā)
說明一下:pcntl_signal()函數(shù)僅僅是注冊信號和它的處理方法,真正接收到信號并調(diào)用其處理方法的是pcntl_signal_dispatch()函數(shù)。試試把// do something替換成下面這段代碼:
代碼如下:
for ($i = 0; $i < 1000000; $i++) {
echo $i . php_eol;
usleep(100000);
}
在終端下執(zhí)行這個腳本,當它不停輸出數(shù)字的時候嘗試按下 ctrl+c 。看看程序有什么響應?嗯……什么都沒有,除了屏幕可能多了個^c以外,程序一直在不停地輸出數(shù)字。因為程序一直沒有執(zhí)行到pcntl_signal_dispatch(),所以就并沒有調(diào)用signalhandler(),所以就沒有輸出signal received。
4.3. 版本問題
如果認真看了php文檔,會發(fā)現(xiàn)pcntl_signal_dispatch()這個函數(shù)是php 5.3以上才支持的,如果你的php版本大于5.3,建議使用這個方法調(diào)用信號處理器。5.3以下的版本需要在注冊信號之前加一句:declare(ticks = 1);表示每執(zhí)行一條低級指令,就檢查一次信號,如果檢測到注冊的信號,就調(diào)用其信號處理器。想想就挺不爽的,干嘛一直都檢查?還是在我們指定的地方檢查一下就好。
4.4. 感受僵尸進程
現(xiàn)在我們回到子進程回收的問題上(差點忘了= =)。當你的一個子進程掛了(或者說是結(jié)束了),但是父進程還在運行中并且可能很長一段時間不會退出。一個僵尸進程從此站起來了!這時,保護傘公司(內(nèi)核)發(fā)現(xiàn)它的地盤里出現(xiàn)了一個僵尸,這個僵尸是誰兒子呢?看一下ppid就知道了。然后,內(nèi)核給ppid這個進程(也就是僵尸進程的父進程)發(fā)送一個信號:sigchld。然后,你知道怎么在父進程中回收這個子進程了么?提示一下,用pcntl_wait()函數(shù)。
4.5. 發(fā)送信號
希望剛剛有認真man過kill命令。它其實就是向進程發(fā)送信號,在php中也可以調(diào)用posix_kill()函數(shù)來達到相同的效果。有了它就可以在父進程中控制其他子進程的運行了。比如在父進程結(jié)束之前關閉所有子進程,那么fork的時候在父進程記錄所有子進程的pid,父進程結(jié)束之前依次給子進程發(fā)送結(jié)束信號即可。
5. 實踐
php的多進程跟c還是挺像的,搞明白了以后用其他語言寫的話也大同小異差不多都是這么個情況。如果有空的話,嘗試寫一個小程序,切身體會一下個中滋味:
1.16歲的鳴人發(fā)送影分身,分出5個分身
2.每個分身隨機生存10到30秒,每秒都輸出點什么
3.保證原身能感受到分身的結(jié)束,然后開動另一個分身,保證最多有5個分身
4.不使用nohup,讓原身在終端關閉后依舊能夠運行
5.把分身數(shù)量(5)寫進一個配置文件里,當給原身發(fā)送信號(可以考慮用sigusr1或sigusr2)時,原身讀取配置文件并更新允許的分身最大數(shù)量
6.如果分身多了,關閉幾個;如果少了,再分出來幾個
提示:
1.用while循環(huán)保證進程運行,注意sleep以免100%的cpu占用
2.運行進程的終端被關閉時,程序會收到一個sighup信號
3.可以用parse_ini_file()函數(shù)解析ini配置文件