一些運行在Nginx上的網站有時候會呈現“502 Bad Gateway”錯誤,有些時候甚至頻繁的呈現。有些站長是在方才轉移到Nginx之后就呈現了這個問題,所以常常會猜疑這是不是Nginx的問題,但事實上這是個誤區。
以下是從張宴和Ayou的博客匯集整理的一些Nginx 502錯誤的排查要領,供各人參考:
Nginx 502錯誤的原因較量多,是因為在署理模式下后端處事器呈現問題引起的。這些錯誤一般都不是nginx自己的問題,必然要從后端找原因!但nginx把這些墮落都攬在本身身上了,著實讓nginx的推廣者備受置疑,究竟從字眼上領略,bad gateway?不就是bad nginx嗎?讓不相識的人看到,會直接把責任推在nginx身上,但愿nginx下一個版本會把墮落提示寫稍微友好一些,至少不會是此刻簡樸的一句502 Bad Gateway,別的還不忘附上本身的臺甫。
Nginx 502的觸發條件
502錯誤最凡是的呈現環境就是后端主機當機。在upstream設置里有這么一項設置:proxy_next_upstream,這個設置指定了nginx在從一個后端主機取數據碰著何種錯誤時會轉到下一個后端主機,里頭寫上的就是會呈現502的所有環境拉,默認是error timeout。error就是當機、斷線之類的,timeout就是讀取堵塞超時,較量容易領略。我一般是全寫上的:
proxy_next_upstream error timeout invalid_header http_500 http_503;
不外此刻大概我要去掉http_500這一項了,http_500指定后端返回500錯誤時會轉一個主機,后端的jsp墮落的話,原來會打印一堆stacktrace的錯誤信息,此刻被502代替了。但公司的措施員可不這么認為,他們認定是nginx呈現了錯誤,我實在沒空跟他們表明502的道理了……
503錯誤就可以保存,因為后端凡是是apache resin,假如apache死機就是error,但resin死機,僅僅是503,所以照舊有須要保存的。
辦理步伐
碰著502問題,可以優先思量憑據以下兩個步調去辦理。
1、查察當前的PHP FastCGI歷程數是否夠用:
netstat -anpo | grep "php-cgi" | wc -l
假如實際利用的“FastCGI歷程數”靠近預設的“FastCGI歷程數”,那么,說明“FastCGI歷程數”不足用,需要增大。
2、部門PHP措施的執行時間高出了Nginx的期待時間,可以適當增加nginx.conf設置文件中FastCGI的timeout時間,譬喻:
......
http
{
......
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
......
}
......
php.ini中memory_limit設低了會墮落,修改了php.ini的memory_limit為64M,重啟nginx,發明好了,本來是PHP的內存不敷了。
假如這樣修改了還辦理不了問題,可以參考下面這些方案:
一、max-children和max-requests
一臺處事器上運行著nginx php(fpm) xcache,會見量日均 300W pv閣下
最近常常會呈現這樣的環境: php頁面打開很慢,cpu利用率溘然降至很低,系統負載溘然升至很高,查察網卡的流量,也會發明溘然降到了很低。這種環境只一連數秒鐘就規復了
查抄php-fpm的日志文件發明白一些線索
Sep 30 08:32:23.289973 [NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200
Sep 30 08:32:23.290212 [NOTICE] fpm_sockets_init_main(), line 371: using inherited socket fd=10, “127.0.0.1:9000″
Sep 30 08:32:23.290342 [NOTICE] fpm_event_init_main(), line 109: libevent: using epoll
Sep 30 08:32:23.296426 [NOTICE] fpm_init(), line 47: fpm is running, pid 30587
在這幾句的前面,是1000多行的封鎖children和開啟children的日志
本來,php-fpm有一個參數 max_requests,該參數指明白,每個children最多處理懲罰幾多個請求后便會被封鎖,默認的配置是500。因為php是把請求輪詢給每個children,在大流量下,每個childre達到max_requests所用的時間都差不多,這樣就造成所有的children根基上在同一時間被封鎖。
在這期間,nginx無法將php文件轉交給php-fpm處理懲罰,所以cpu會降至很低(不消處理懲罰php,更不消執行sql),而負載會升至很高(封鎖和開啟children、nginx期待php-fpm),網卡流量也降至很低(nginx無法生成數據傳輸給客戶端)
辦理問題很簡樸,增加children的數量,而且將 max_requests 配置未 0 可能一個較量大的值:
打開 /usr/local/php/etc/php-fpm.conf