python async await 协程,python asyncio
本文主要介绍了Python中异步语法协同处理的实现。文章围绕主题,详细介绍了内容,有一定的参考价值,有需要的朋友可以参考一下。
00-1010前言1。传统同步语法请求2的示例。异步请求3。基于生成器的协同学3.1生成器3.2使用生成器实现协同学
目录
在io较多的场景下,异步文法编写的程序会用更少的时间和更少的资源完成同样的任务。本文介绍了Python异步语法的协同过程是如何实现的。
前言
同样,在理解异步语法的实现之前,先从Sync的语法示例开始。现在假设有一个HTTP请求,这个程序会通过这个请求得到相应的响应内容并打印出来。代码如下:
导入插座
定义请求(主机: str) -无:
模拟请求并打印响应正文
url: str=fhttp://{host}
sock:插座。SocketType=socket.socket()
sock.connect((host,80))
sock . send(f get { URL } HTTP/1.0 r n host : { host } r n r n 。编码( ascii ))
response_bytes: bytes=b
chunk: bytes=sock.recv(4096)
而chunk:
响应字节=块
chunk=sock.recv(4096)
打印( n 。join([I for I in response _ bytes . decode()。拆分( rn ))))
if __name__==__main__:
请求( so1n.me )
运行程序,程序可以正常输出。上半部分打印相应的HTTP响应头,下半部分打印HTTP响应体。你可以看到服务器告诉我们以https,输出结果如下:.的形式再次请求
HTTP/1.1 301已永久移动
GitHub.com :号服务器
内容类型:文本/html
位置: https://so1n.me/
x-GitHub-Request-id : a 744:3871:4136 af :48 bd9f :6188 db 50
内容长度: 162
接受范围:字节
2021年11月8日星期一08:11:37 GMT
Via: 1.1清漆
年龄: 104
连接:关闭
X-Served-By:缓存-qpg1272-QPG
X-Cache:命中
x缓存命中率: 2
x定时器: S1636359097.026094,VS0,VE0
Vary:接受编码
x-fast ly-Request-id : 22fa 337 f 777553d 33503 CEE 5282598 c6a 293 fb5e
超文本标记语言
标题301永久移动/标题/标题
身体
中心h1301永久移动/h1/中心
hrcentinginx/center
/body
/html
但是,这里不想谈HTTP请求是如何实现的,也不太了解细节。在这段代码中,socket的默认调用被阻塞。当一个线程调用connect或者recv (send不是必须的,但是在高并发的情况下,你需要等待drain之后才可以。
send, 小demo不需要用到drain
方法), 程序将会暂停直到操作完成。 当一次要下载很多网页的话, 这将会如上篇文章所说的一样, 大部分的等待时间都花在io上面, cpu却一直空闲时, 而使用线程池虽然可以解决这个问题, 但是开销是很大的, 同时操作系统往往会限制一个进程,用户或者机器可以使用的线程数, 而协程却没有这些限制, 占用的资源少, 也没有系统限制瓶颈。
2.异步的请求
异步可以让一个单独的线程处理并发的操作, 不过在上面已经说过了, socket是默认阻塞的, 所以需要把socket设置为非阻塞的, socket提供了setblocking
这个方法供开发者选择是否阻塞, 在设置了非阻塞后,connect
和recv
方法也要进行更改。
由于没有了阻塞, 程序在调用了connect
后会马上返回, 只不过Python
的底层是C
, 这段代码在C
中调用非阻塞的socket.connect后会抛出一个异常, 我们需要捕获它, 就像这样:
import socket
经过一顿操作后, 就开始申请建立连接了, 但是我们还不知道连接啥时候完成建立, 由于连接没建立时调用send
会报错, 所以可以一直轮询调用send
直到没报错就认为是成功(真实代码需要加超时):
while True:
但是这样让CPU空转太浪费性能了, 而且期间还不能做别的事情, 就像我们点外卖后一直打电话过去问饭菜做好了没有, 十分浪费电话费用, 要是饭菜做完了就打电话告诉我们, 那就只产生了一笔费用, 非常的省钱(正常情况下也是这样子)。
这时就需要事件循环登场了,在类UNIX中, 有一个叫select
的功能, 它可以等待事件发生后再调用监听的函数, 不过一开始的实现性能不是很好, 在Linux
上被epoll
取代, 不过接口是类似的, 所在在Python
中把这几个不同的事件循环都封装在selectors
库中, 同时可以通过DefaultSelector
从系统中挑出最好的类select
函数。
这里先暂时不说事件循环的原理, 事件循环最主要的是他名字的两部分, 一个是事件, 一个是循环, 在Python
中, 可以通过如下方法把事件注册到事件循环中:
def demo(): pass
这样这个事件循环就会监听对应的文件描述符fd, 当这个文件描述符触发写入事件(EVENT_WRITE)时,事件循环就会告诉我们可以去调用注册的函数demo
。不过如果把上面的代码都改为这种方法去运行的话就会发现, 程序好像没跑就结束了, 但程序其实是有跑的, 只不过他们是完成的了注册, 然后就等待开发者接收事件循环的事件进行下一步的操作, 所以我们只需要在代码的最后面写上如下代码:
while True:
这样程序就会一直运行, 当捕获到事件的时候, 就会通过for循环告诉我们, 其中key.data
是我们注册的回调函数, 当事件发生时, 就会通知我们, 我们可以通过拿到回调函数然后就运行, 了解完毕后, 我们可以来编写我们的第一个并发程序, 他实现了一个简单的I/O复用的小逻辑, 代码和注释如下:
import socket
这段代码接近同时注册了4个请求并注册建立连接回调, 然后就进入事件循环逻辑, 也就是把控制权交给事件循环, 直到事件循环告诉程序说收到了socket建立的通知, 程序就会取消注册的回调然后发送请求, 并注册一个读的事件回调, 然后又把控制权交给事件循环, 直到收到了响应的结果才进入处理响应结果函数并且只有收完所有响应结果才会退出程序。
下面是我其中的一次执行结果
so1n.me connect success
github.com connect success
google.com connect success
recv google.com body success
recv google.com body success
baidu.com connect success
recv github.com body success
recv github.com body success
recv baidu.com body success
recv baidu.com body success
recv so1n.me body success
recv so1n.me body success
可以看到他们的执行顺序是随机的, 不是严格的按照so1n.me
,github.com
,google.com
,baidu.com
顺序执行, 同时他们执行速度很快, 这个程序的耗时约等于响应时长最长的函数耗时。
但是可以看出, 这个程序里面出现了两个回调, 回调会让代码变得非常的奇怪, 降低可读性, 也容易造成回调地狱, 而且当回调发生报错的时候, 我们是很难知道这是由于什么导致的错误, 因为它的上下文丢失了, 这样子排查问题十分的困惑。 作为程序员, 一般都不止满足于速度快的代码, 真正想要的是又快, 又能像Sync
的代码一样简单, 可读性强, 也能容易排查问题的代码, 这种组合形式的代码的设计模式就叫协程。
协程出现得很早, 它不像线程一样, 被系统调度, 而是能自主的暂停, 并等待事件循环通知恢复。由于协程是软件层面实现的, 所以它的实现方式有很多种, 这里要说的是基于生成器的协程, 因为生成器跟协程一样, 都有暂停让步和恢复的方法(还可以通过throw
来抛错), 同时它跟Async
语法的协程很像, 通过了解基于生成器的协程, 可以了解Async
的协程是如何实现的。
3.基于生成器的协程
3.1生成器
在了解基于生成器的协程之前, 需要先了解下生成器,Python
的生成器函数与普通的函数会有一些不同, 只有普通函数中带有关键字yield
, 那么它就是生成器函数, 具体有什么不同可以通过他们的字节码来了解:
In [1]: import dis
上面分别是普通函数, 普通函数调用函数和普通生成器函数的字节码, 从字节码可以看出来, 最简单的函数只需要LOAD_CONST
来加载变量None压入自己的栈, 然后通过RETURN_VALUE
来返回值, 而有函数调用的普通函数则先加载变量, 把全局变量的函数aaa
加载到自己的栈里面, 然后通过CALL_FUNCTION
来调用函数, 最后通过POP_TOP
把函数的返回值从栈里抛出来, 再把通过LOAD_CONST
把None压入自己的栈, 最后返回值。
而生成器函数则不一样, 它会先通过LOAD_CONST
来加载变量None压入自己的栈, 然后通过YIELD_VALUE
返回值, 接着通过POP_TOP
弹出刚才的栈并重新把变量None压入自己的栈, 最后通过RETURN_VALUE
来返回值。从字节码来分析可以很清楚的看到, 生成器能够在yield
区分两个栈帧, 一个函数调用可以分为多次返回, 很符合协程多次等待的特点。
接着来看看生成器的一个使用, 这个生成器会有两次yield
调用, 并在最后返回字符串'None'
, 代码如下:
In [8]: def demo():
这段代码首先通过函数调用生成一个demo_gen
的生成器对象, 然后第一次send
调用时返回值1, 第二次send
调用时返回值2, 第三次send
调用则抛出StopIteration
异常, 异常提示为None
, 同时可以看到第一次打印aaa
和第二次打印bbb
时, 他们都能打印到当前的函数局部变量, 可以发现在即使在不同的栈帧中, 他们读取到当前的局部函数内的局部变量是一致的, 这意味着如果使用生成器来模拟协程时, 它还是会一直读取到当前上下文的, 非常的完美。
此外,Python
还支持通过yield from
语法来返回一个生成器, 代码如下:
In [1]: def demo_gen_1():
通过yield from
就可以很方便的支持生成器调用, 假如把每个生成器函数都当做一个协程, 那通过yield from
就可以很方便的实现协程间的调用, 此外生成器的抛出异常后的提醒非常人性化, 也支持throw
来抛出异常, 这样我们就可以实现在协程运行时设置异常, 比如Cancel
,演示代码如下:
In [1]: def demo_exc():
从中可以看到在运行中抛出异常时, 会有一个非常清楚的抛错, 可以明显看出错误堆栈, 同时throw
指定异常后, 会在下一处yield
抛出异常(所以协程调用Cancel
后不会马上取消, 而是下一次调用的时候才被取消)。
3.2用生成器实现协程
我们已经简单的了解到了生成器是非常的贴合协程的编程模型, 同时也知道哪些生成器API是我们需要的API, 接下来可以模仿Asyncio
的接口来实现一个简单的协程。
首先是在Asyncio
中有一个封装叫Feature
, 它用来表示协程正在等待将来时的结果, 以下是我根据asyncio.Feature
封装的一个简单的Feature
, 它的API没有asyncio.Feature
全, 代码和注释如下:
class Status:
在理解Future
时, 可以把它假想为一个状态机, 在启动初始化的时候是peding
状态, 在运行的时候我们可以切换它的状态, 并且通过__iter__
方法来支持调用者使用yield from Future()
来等待Future
本身, 直到收到了事件通知时, 可以得到结果。
但是可以发现这个Future
是无法自我驱动, 调用了__iter__
的程序不知道何时被调用了set_result
, 在Asyncio
中是通过一个叫Task
的类来驱动Future
, 它将一个协程的执行过程安排好, 并负责在事件循环中执行该协程。它主要有两个方法:
1.初始化时, 会先通过
send
方法激活生成器2.后续被调度后马上安排下一次等待, 除非抛出
StopIteration
异常
还有一个支持取消运行托管协程的方法(在原代码中,Task
是继承于Future
, 所以Future
有的它都有), 经过简化后的代码如下:
class Task:
这样Future
和Task
就封装好了, 可以简单的试一试效果如何:
In [2]:def wait_future(f: Future, flag_int: int) -> Generator[Future, None, None]:
这段程序会先初始化Future
, 并把Future
传给wait_future
并生成生成器, 再交由给Task
托管, 预激, 由于Future
是在生成器函数wait_future
中通过yield from
与函数绑定的, 真正被预激的其实是Future
的__iter__
方法中的yield self
, 此时代码逻辑会暂停在yield self
并返回。
在全部预激后, 通过调用Future
的set_result
方法, 使Future
变为结束状态, 由于set_result
会执行注册的回调, 这时它就会执行托管它的Task
的step
方法中的send
方法, 代码逻辑回到Future
的__iter__
方法中的yield self
, 并继续往下走, 然后遇到return
返回结果, 并继续走下去, 从输出可以发现程序封装完成且打印了ready
后, 会依次打印对应的返回结果, 而在最后一个的测试cancel
方法中可以看到,Future
抛出异常了, 同时这些异常很容易看懂, 能够追随到调用的地方。
现在Future
和Task
正常运行了, 可以跟我们一开始执行的程序进行整合, 代码如下:
class HttpRequest(object):
这段代码通过Future
和生成器方法尽量的解耦回调函数, 如果忽略了HttpRequest
中的connected
和read
方法则可以发现整段代码跟同步的代码基本上是一样的, 只是通过yield
和yield from
交出控制权和通过事件循环恢复控制权。 同时通过上面的异常例子可以发现异常排查非常的方便, 这样一来就没有了回调的各种糟糕的事情, 开发者只需要按照同步的思路进行开发即可, 不过我们的事件循环是一个非常简单的事件循环例子, 同时对于socket相关都没有进行封装, 也缺失一些常用的API, 而这些都会被Python
官方封装到Asyncio
这个库中, 通过该库, 我们可以近乎完美的编写Async
语法的代码。
NOTE: 由于生成器协程中无法通过yield from
语法使用生成器, 所以Python
在3.5之后使用了Await
的原生协程。
到此这篇关于Python中Async语法协程的实现的文章就介绍到这了,更多相关Python协程内容请搜索盛行IT软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行IT软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。