先说下背景:这是个运行在 5 台云服务器(8 核 CPU,32GB 内存)上的老 PHP 应用。这些机器配置很强,对这个应用来说完全是过度配置了。
这事一直没有优先级,所以我从来没处理过——直到现在。
监控显示服务器使用了约 15% 的 CPU,流量增加时最高到 30%,内存使用率也很低。我知道原因:php-fpm 从来没有为这些机器正确配置过,而且 OPCache 是禁用的。
优化前
pm.max_children = 100
pm.start_servers = 6
pm.min_spare_servers = 4
pm.max_spare_servers = 8
优化后
pm.max_children = 300
pm.start_servers = 100
pm.min_spare_servers = 60
pm.max_spare_servers = 150
PHP-FPM 是最广泛使用的 PHP 应用服务方式,本质上是一个进程管理器。大多数请求遵循这个流程:
请求 -> NGINX -> php-fpm -> (选择或创建 PHP 进程)-> 执行代码 -> 响应
NGINX 作为反向代理通过 socket 与 fpm 通信——FPM 负责从进程池中选择一个进程,或者在没有空闲进程时创建新进程(如果低于定义的 max_children 值)。
例如,假设以下配置:
如果收到 8 个并发请求,php-fpm 会简单地从池中选择空闲进程。如果收到 10 个请求,它会选择 8 个空闲进程并 fork 2 个额外的进程。
Fork 进程是有开销的,但这不是世界末日。我们稍后会回到这个话题。
简单来说,OPCache 是一个操作码缓存。
那么什么是操作码?操作码是低级机器指令,它告诉处理器要执行什么操作。我们不需要深入这个兔子洞。当 PHP 脚本执行时会发生以下过程:
当启用 OPCache 时,步骤 2 和 3 被跳过:
显然,如果缓存未命中,所有步骤都必须执行。可以想象,缓存这些昂贵的操作可以提供巨大的性能改进,需要更少的 CPU 周期并减少整体内存消耗。
我在云厂商上设置了几台机器进行测试:
Laravel 应用运行的代码如下:
<?php
namespace App\Http\Controllers;
use App\Models\Visit;
class FooController
{
public function __invoke()
{
Visit::query()->create();
return response()->json([
'visits' => Visit::query()->count(),
]);
}
}
服务器是用自动化部署工具部署的。
让我们从结果开始。
初始基准测试
我运行了一个简单的测试(ab -n 1000 -c 10
),得到的结果是:33 reqs/s,服务器 CPU 满负荷运行。如下图所示 启用 OPCache 后
119 reqs/s,而且没有拖垮服务器。好多了。
调整 php-fpm 后
直接飙到了 310 reqs/s,憾的是,没办法将 CPU 调整到接近 100% 使用率。
在调整 FPM 之前,我建议启用 OPCache——否则你需要重新调整,因为 CPU 负载和内存使用会发生变化。OPCache 作为扩展分发,请确保已安装。首先,运行 php -v
查看是否已安装:
Copyright (c) The PHP Group
Zend Engine v4.2.8, Copyright (c) Zend Technologies
with Xdebug v3.2.2, Copyright (c) 2002-2023, by Derick Rethans
with Zend OPcache v8.2.8, Copyright (c), by Zend Technologies
看开没开,跑 php -i | grep opcache
找 opcache.enable
:
/etc/php/8.2/conf.d/10-opcache.ini,
opcache.blacklist_filename => no value => no value
opcache.consistency_checks => 0 => 0
opcache.dups_fix => Off => Off
opcache.enable => Off => Off
要开 opcache,先跑 php --ini
找到 Loaded Configuration File
,定位你的 php.ini:
cd /etc/php/8.2
vim php.ini
找到 [opcache]
那块,把 opcache.enable
改成 1。
还有个重要配置 opcache.max_accelerated_files
,决定缓存多少文件,vendor 目录也算。
开了 OPCache 后记得重启 php-fpm:service php-fpm reload
。
顺便说下:每次部署新代码都该重启 php-fpm。不想重启的话可以开 opcache.validate_timestamps
,让 OPCache 自己跟踪文件变化,不过会影响性能。
光是 OPCache 就能让性能飞起来。试试就知道了。
PHP-FPM 有这些配置:
理想情况下,你的配置应该:
FPM 默认配置通常是这样:
pm = dynamic
pm.max_children = 10
pm.start_servers = 2
pm.max_spare_servers = 3
pm.min_spare_servers = 1
这配置明显不行。意思是你最多只能处理 10 个并发请求(多了就得等),而且超过 3 个请求就得新建 7 个进程。
设置 FPM 的直观方法(大多数指南会这么告诉你)是计算每个进程消耗多少内存,加点缓冲,然后用系统可用内存除以这个值。我们测试中每个进程消耗约 16MB 内存。
可以用这个命令粗略估算:
ps --no-headers -eo rss,comm | grep php | awk '{sum+=$1; count++} END {if (count > 0) print "Average Memory Usage (KB):", sum/count; else print "No PHP processes found."}'
我们的情况下,大概是:3500 / 16 = 218,意味着可以跑最多 218 个进程。简化点,就设 200 吧。
不过,虽然这么算有道理,但进程数最多不一定性能最好:这取决于你的应用是 I/O 密集型还是 CPU 密集型,各个端点的特性等等。比如,如果 CPU 是瓶颈,fork 更多进程没用,因为调度器没法在它们之间正常切换。
有很多瓶颈光增加进程数解决不了:
我的建议是用默认设置做基准测试,监控 CPU 和内存使用。
在这篇文章的测试中,我发现最佳配置是 100 个最大进程,虽然内存够跑超过 200 个进程。我用的配置:
pm = dynamic
pm.max_children = 100
pm.start_servers = 70
pm.max_spare_servers = 80
pm.min_spare_servers = 60
这让 fpm 启动时就有合理数量的进程,如果流量增加,可以 fork 新进程处理。实际使用中,你肯定要靠监控来衡量服务器负载,看是否需要更多进程。这只是个起点。
我的建议还是先玩玩这个配置,然后盯着监控进一步调整。某个时候,增加进程数可能会有反效果——记住 fork 进程有开销,进程间切换也有开销。应用还受延迟、I/O 操作等影响。基础设施方面数据是你的朋友,没数据你就是瞎子。随着流量模式/使用变化调整设置也是关键。
所以,你要做的是: