通过优化Gunicorn配置获得更好的性能

对于受CPU限制的应用程序,增加了工作程序和/或内核。对于受I / O限制的应用程序,请使用“伪线程”。

Gunicorn是Python WSGI HTTP Server,通常驻留在反向代理(例如Nginx)或负载平衡器(例如AWS ELB)和Web应用程序(例如Django或Flask)之间。

1 第一种并发方式(工作者,又名UNIX进程)

每个工作程序都是一个加载Python应用程序的UNIX进程。工作人员之间没有共享内存。
建议的数量workers是(2*CPU)+1。
对于双核(2 CPU)计算机,建议workers值为5 。

gunicorn --workers = 5 main:app

2 第二种并发方式(线程)

Gunicorn还允许每个工人都有多个线程。在这种情况下,每个工作程序会加载一次Python应用程序,并且同一工作程序产生的每个线程都共享相同的内存空间。
要将线程用于Gunicorn,请使用threads设置。每次使用时threads,worker类都设置为gthread:

gunicorn --workers = 5 --threads = 2 main:app

workers * threads在我们的情况下,最大并发请求数为10。
使用辅助线程和线程时,建议的最大并发请求数仍为(2*CPU)+1。
因此,如果我们使用的是四核(4 CPU)计算机,并且要使用工作程序和线程的混合,则可以使用3个工作程序和3个线程,以获取9个最大并发请求。

gunicorn --workers = 3 --threads = 3 main:app

3 第三种并发方式(“伪线程”)

有一些Python库(例如gevent和Asyncio)通过使用由协程实现的“伪线程”在Python中启用并发。
Gunicorn通过设置它们的相应工作程序类,允许使用这些异步Python库。
这里的设置适用于我们要使用gevent以下命令运行的单核计算机:

gunicorn --worker-class = gevent --worker-connections = 1000 --workers = 3 main:app

worker-connections是gevent worker类的特定设置。
(2CPU)+1仍然建议使用,workers因为我们只有1个核心,我们将使用3个工作线程。
在这种情况下,最大并发请求数为3000(3个工作程序
每个工作程序1000个连接)

实际用例

通过调整Gunicorn设置,我们希望优化应用程序性能。
1 如果应用程序受I / O限制,则最佳性能通常来自使用“伪线程”(gevent或asyncio)。如我们所见,Gunicorn通过设置适当的worker类并调整workersto 的值来支持这种编程范例(2*CPU)+1。

2 如果应用程序受CPU限制,则应用程序处理多少个并发请求都无关紧要。唯一重要的是并行请求的数量。由于Python的GIL,线程和“伪线程”无法并行运行。实现并行性的唯一方法是增加到workers 建议的(2*CPU)+1,要理解的是,并行请求的最大数量是内核数。

3 如果有一个关于应用程序的关注内存占用,使用threads 和其对应的g线程工人阶级有利于workers产生更好的性能,因为应用程序加载每个工人和工人股运行一些内存每个线程一次,这涉及到一些费用额外的CPU消耗。

4 如果您不知道自己在做什么,请从最简单的配置开始,该配置仅设置workers为(2*CPU)+1,无需担心threads。从那时起,基准测试全都在反复试验。如果瓶颈是内存,请开始引入线程。如果瓶颈是I / O,请考虑使用其他python编程范例。如果瓶颈是CPU,请考虑使用更多的内核并调整其workers值。

建立系统

软件开发人员通常认为,可以通过优化应用程序代码来解决每个性能瓶颈,但并非总是如此。有时候,调整HTTP服务器的设置,使用更多资源或重新设计应用程序以使用不同的编程范例是我们提高整体应用程序性能所需的解决方案。在这种情况下,构建系统意味着了解我们可用于部署高性能应用程序的计算资源的类型(进程,线程和“伪线程”)。通过了解,设计和实施具有正确资源的正确技术解决方案,我们避免陷入尝试通过优化应用程序代码来提高性能的陷阱。

原文地址:https://www.cnblogs.com/vinic-xxm/p/11865265.html