一些運(yùn)行在Nginx上的網(wǎng)站有時(shí)候會(huì)呈現(xiàn)“502 Bad Gateway”錯(cuò)誤,有些時(shí)候甚至頻繁的呈現(xiàn)。有些站長(zhǎng)是在方才轉(zhuǎn)移到Nginx之后就呈現(xiàn)了這個(gè)問(wèn)題,所以常常會(huì)猜疑這是不是Nginx的問(wèn)題,但事實(shí)上這是個(gè)誤區(qū)。
以下是從張宴和Ayou的博客匯集整理的一些Nginx 502錯(cuò)誤的排查要領(lǐng),供各人參考:
Nginx 502錯(cuò)誤的原因較量多,是因?yàn)樵谑鹄砟J较潞蠖颂幨缕鞒尸F(xiàn)問(wèn)題引起的。這些錯(cuò)誤一般都不是nginx自己的問(wèn)題,必然要從后端找原因!但nginx把這些墮落都攬?jiān)诒旧砩砩狭耍鴮?shí)讓nginx的推廣者備受置疑,究竟從字眼上領(lǐng)略,bad gateway?不就是bad nginx嗎?讓不相識(shí)的人看到,會(huì)直接把責(zé)任推在nginx身上,但愿nginx下一個(gè)版本會(huì)把墮落提示寫(xiě)稍微友好一些,至少不會(huì)是此刻簡(jiǎn)樸的一句502 Bad Gateway,別的還不忘附上本身的臺(tái)甫。
Nginx 502的觸發(fā)條件
502錯(cuò)誤最凡是的呈現(xiàn)環(huán)境就是后端主機(jī)當(dāng)機(jī)。在upstream設(shè)置里有這么一項(xiàng)設(shè)置:proxy_next_upstream,這個(gè)設(shè)置指定了nginx在從一個(gè)后端主機(jī)取數(shù)據(jù)碰著何種錯(cuò)誤時(shí)會(huì)轉(zhuǎn)到下一個(gè)后端主機(jī),里頭寫(xiě)上的就是會(huì)呈現(xiàn)502的所有環(huán)境拉,默認(rèn)是error timeout。error就是當(dāng)機(jī)、斷線之類(lèi)的,timeout就是讀取堵塞超時(shí),較量容易領(lǐng)略。我一般是全寫(xiě)上的:
proxy_next_upstream error timeout invalid_header http_500 http_503;
不外此刻大概我要去掉http_500這一項(xiàng)了,http_500指定后端返回500錯(cuò)誤時(shí)會(huì)轉(zhuǎn)一個(gè)主機(jī),后端的jsp墮落的話,原來(lái)會(huì)打印一堆stacktrace的錯(cuò)誤信息,此刻被502代替了。但公司的措施員可不這么認(rèn)為,他們認(rèn)定是nginx呈現(xiàn)了錯(cuò)誤,我實(shí)在沒(méi)空跟他們表明502的道理了……
503錯(cuò)誤就可以保存,因?yàn)楹蠖朔彩鞘莂pache resin,假如apache死機(jī)就是error,但resin死機(jī),僅僅是503,所以照舊有須要保存的。
辦理步伐
碰著502問(wèn)題,可以?xún)?yōu)先思量憑據(jù)以下兩個(gè)步調(diào)去辦理。
1、查察當(dāng)前的PHP FastCGI歷程數(shù)是否夠用:
netstat -anpo | grep "php-cgi" | wc -l
假如實(shí)際利用的“FastCGI歷程數(shù)”靠近預(yù)設(shè)的“FastCGI歷程數(shù)”,那么,說(shuō)明“FastCGI歷程數(shù)”不足用,需要增大。
2、部門(mén)PHP措施的執(zhí)行時(shí)間高出了Nginx的期待時(shí)間,可以適當(dāng)增加nginx.conf設(shè)置文件中FastCGI的timeout時(shí)間,譬喻:
......
http
{
......
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
......
}
......
php.ini中memory_limit設(shè)低了會(huì)墮落,修改了php.ini的memory_limit為64M,重啟nginx,發(fā)明好了,本來(lái)是PHP的內(nèi)存不敷了。
假如這樣修改了還辦理不了問(wèn)題,可以參考下面這些方案:
一、max-children和max-requests
一臺(tái)處事器上運(yùn)行著nginx php(fpm) xcache,會(huì)見(jiàn)量日均 300W pv閣下
最近常常會(huì)呈現(xiàn)這樣的環(huán)境: php頁(yè)面打開(kāi)很慢,cpu利用率溘然降至很低,系統(tǒng)負(fù)載溘然升至很高,查察網(wǎng)卡的流量,也會(huì)發(fā)明溘然降到了很低。這種環(huán)境只一連數(shù)秒鐘就規(guī)復(fù)了
查抄php-fpm的日志文件發(fā)明白一些線索
Sep 30 08:32:23.289973 [NOTICE] fpm_unix_init_main(), line 271: getrlimit(nofile): max:51200, cur:51200
Sep 30 08:32:23.290212 [NOTICE] fpm_sockets_init_main(), line 371: using inherited socket fd=10, “127.0.0.1:9000″
Sep 30 08:32:23.290342 [NOTICE] fpm_event_init_main(), line 109: libevent: using epoll
Sep 30 08:32:23.296426 [NOTICE] fpm_init(), line 47: fpm is running, pid 30587
在這幾句的前面,是1000多行的封鎖children和開(kāi)啟children的日志
本來(lái),php-fpm有一個(gè)參數(shù) max_requests,該參數(shù)指明白,每個(gè)children最多處理懲罰幾多個(gè)請(qǐng)求后便會(huì)被封鎖,默認(rèn)的配置是500。因?yàn)閜hp是把請(qǐng)求輪詢(xún)給每個(gè)children,在大流量下,每個(gè)childre達(dá)到max_requests所用的時(shí)間都差不多,這樣就造成所有的children根基上在同一時(shí)間被封鎖。
在這期間,nginx無(wú)法將php文件轉(zhuǎn)交給php-fpm處理懲罰,所以cpu會(huì)降至很低(不消處理懲罰php,更不消執(zhí)行sql),而負(fù)載會(huì)升至很高(封鎖和開(kāi)啟children、nginx期待php-fpm),網(wǎng)卡流量也降至很低(nginx無(wú)法生成數(shù)據(jù)傳輸給客戶端)
辦理問(wèn)題很簡(jiǎn)樸,增加children的數(shù)量,而且將 max_requests 配置未 0 可能一個(gè)較量大的值:
打開(kāi) /usr/local/php/etc/php-fpm.conf