如何在 Python 中使用 concurrent.futures？

当前位置：技术文章>> 如何在 Python 中使用 concurrent.futures？

文章标题：如何在 Python 中使用 concurrent.futures？

文章分类: 后端
3080 阅读

在Python中，concurrent.futures 模块是一个强大的工具，它提供了高级接口用于异步执行调用。这个模块让并发执行变得更加简单和直观，无论是通过线程（ThreadPoolExecutor）还是进程（ProcessPoolExecutor）来实现。使用 concurrent.futures，你可以轻松地并行化你的代码，从而显著提高执行效率，尤其是在处理大量独立任务时。下面，我将详细介绍如何在Python中有效地使用 concurrent.futures 模块。

一、引言

在Python中，由于全局解释器锁（GIL）的存在，多线程并不总是提高CPU密集型任务的执行效率。然而，对于I/O密集型任务或等待密集型任务（如网络请求、文件读写等），多线程可以显著提升性能。另一方面，多进程不受GIL的限制，能够充分利用多核CPU的优势，适用于CPU密集型任务。concurrent.futures 模块通过提供线程池和进程池的执行器，让开发者能够根据需要选择合适的并发模式。

二、`concurrent.futures` 基础

1. `ThreadPoolExecutor` 和 `ProcessPoolExecutor`

ThreadPoolExecutor：用于创建线程池。它适合执行I/O密集型任务。
ProcessPoolExecutor：用于创建进程池。它不受GIL限制，适合执行CPU密集型任务。

两者都实现了 Executor 接口，提供了 submit() 方法来异步执行调用，以及 map() 方法来并行执行可迭代对象中的每个元素。

2. 使用 `submit()` 方法

submit() 方法用于提交一个可调用对象（通常是函数）给执行器执行，并立即返回一个 Future 实例。这个 Future 实例代表了异步执行的操作，你可以通过它来检查任务是否完成、等待任务完成、获取任务结果等。

from concurrent.futures import ThreadPoolExecutor

def task(n):
    return n * n

with ThreadPoolExecutor(max_workers=5) as executor:
    future = executor.submit(task, 2)
    print(future.done())  # 检查任务是否完成
    result = future.result()  # 获取任务结果
    print(result)

3. 使用 `map()` 方法

map() 方法类似于内置的 map() 函数，但它会并行地对可迭代对象中的每个元素执行指定的函数。与内置 map() 不同的是，concurrent.futures 的 map() 方法返回一个迭代器，迭代器中的元素在需要时才会计算，并且计算是并行的。

from concurrent.futures import ThreadPoolExecutor

def task(n):
    return n * n

numbers = [1, 2, 3, 4, 5]
with ThreadPoolExecutor(max_workers=3) as executor:
    results = executor.map(task, numbers)
    for result in results:
        print(result)

三、进阶使用

1. 等待多个 `Future` 实例完成

当你需要等待多个任务完成时，可以使用 as_completed() 方法。它会返回一个迭代器，迭代器中的 Future 实例会按照它们完成的顺序返回。

from concurrent.futures import ThreadPoolExecutor

def task(n):
    import time
    time.sleep(n)
    return n * n

with ThreadPoolExecutor(max_workers=3) as executor:
    futures = [executor.submit(task, n) for n in [1, 2, 3]]
    for future in concurrent.futures.as_completed(futures):
        print(future.result())

2. 异常处理

当使用 concurrent.futures 执行任务时，如果任务函数抛出异常，该异常会被捕获并存储到返回的 Future 对象中。你可以通过 result() 方法触发异常的重新抛出，或者使用 exception() 方法检查是否有异常被捕获。

from concurrent.futures import ThreadPoolExecutor

def task(n):
    if n == 2:
        raise ValueError("Invalid input")
    return n * n

with ThreadPoolExecutor(max_workers=1) as executor:
    future = executor.submit(task, 2)
    try:
        print(future.result())
    except Exception as exc:
        print(f"Caught an exception: {exc}")

3. 结合使用 `wait()` 和 `as_completed()`

wait() 方法用于等待由 Future 实例组成的可迭代对象完成。它提供了更多的灵活性，比如你可以同时等待完成和未完成的任务，并获取它们的列表。

from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED

def task(n):
    import time
    time.sleep(n)
    return n * n

with ThreadPoolExecutor(max_workers=3) as executor:
    futures = [executor.submit(task, n) for n in [1, 2, 3]]
    done, not_done = wait(futures, return_when=ALL_COMPLETED)
    for future in done:
        print(future.result())
    # 如果有未完成的任务，你也可以在这里处理

四、实际应用场景

1. 并发下载多个文件

使用 ThreadPoolExecutor 可以轻松实现多个文件的并发下载。每个下载任务作为一个独立的任务提交给线程池执行。

2. 并发处理大量数据

在处理大量数据时，可以将数据分割成多个小块，每块数据作为一个任务提交给 ProcessPoolExecutor 或 ThreadPoolExecutor 执行。这样可以显著减少总处理时间。

3. 并发网络请求

在编写需要发起多个网络请求的应用程序时，concurrent.futures 可以帮助减少总请求时间，提高应用性能。

五、总结

concurrent.futures 模块为Python开发者提供了强大的并发执行工具，无论是通过线程还是进程。它简化了并发编程的复杂性，使得开发者能够更容易地编写出高效、可扩展的并发代码。通过合理使用 ThreadPoolExecutor 和 ProcessPoolExecutor，以及它们提供的 submit()、map()、as_completed() 和 wait() 等方法，你可以轻松实现任务的并行处理，提升程序的执行效率。

在探索和实践 concurrent.futures 的过程中，不妨关注一些在线资源，如“码小课”网站，这里提供了丰富的编程教程和实战案例，可以帮助你更深入地理解并发编程的精髓，并应用到实际项目中。通过不断学习和实践，你将能够编写出更加高效、健壮的并发应用程序。

文章标题：如何在 Python 中使用 concurrent.futures？

一、引言

二、concurrent.futures 基础

1. ThreadPoolExecutor 和 ProcessPoolExecutor

2. 使用 submit() 方法

3. 使用 map() 方法