当前位置: 首页 > news >正文

迭代器和生成器的学习笔记

迭代器       

Python 迭代器是一种对象,它实现了迭代协议,包括 __iter__() 和 __next__() 方法。迭代器可以让你在数据集中逐个访问元素,而无需关心数据结构的底层实现。与列表或其他集合相比,迭代器可以节省内存,因为它们一次只生成一个元素。

迭代器的基本特点

  1. 懒加载:迭代器不会一次性将所有数据加载到内存中,而是根据需要生成元素。
  2. 状态保持:迭代器在迭代过程中会保持其状态,可以从上次停止的地方继续迭代。
  3. 可以遍历:迭代器是可遍历的,可以使用 for 循环等结构来进行遍历。

 下面的代码可以看出迭代器在节省内存方面的作用。

import sys
import random# 生成 1-100的随机数的集合,共1000个元素
numbers = [random.randint(1, 100) for _ in range(1000)]
iterator = iter(numbers)# 打印对象的内存大小
print(sys.getsizeof(numbers))   # 9016
print(sys.getsizeof(iterator))  # 48

 迭代器的经典demo:

# 创建一个简单的迭代器
class MyIterator:def __init__(self, limit):self.limit = limitself.current = 0def __iter__(self):return selfdef __next__(self):if self.current < self.limit:self.current += 1return self.currentelse:raise StopIteration# 使用迭代器
for num in MyIterator(5):print(num)

 迭代器在读取大文件的经典应用:

with open('users.csv', 'r') as file:for line in file:print(line.strip())

         逐行读取文件内容,而不需要将整个文件加载到内存中。这种方法节省了内存资源,特别是在处理非常大的文件时。

生成器

生成器是一种特殊类型的迭代器,它允许你在函数中暂停执行并在以后继续。 

使用 yield 的基本概念

  1. 生成器函数:当一个函数包含yield语句时,它不再是一个普通的函数,而是一个生成器函数。当调用这个函数时,它不会立即执行,而是返回一个生成器对象。

  2. 状态保留:每次调用生成器的__next__()方法(或者使用next()函数)时,生成器函数会从上次执行的位置继续执行,直到遇到下一个yield语句。在此时,函数的执行状态(包括局部变量)会被保留。

  3. 迭代:生成器可以被用于迭代,像普通的列表或其他可迭代对象一样。使用for循环可以逐个获取生成器产生的值。

# 定义一个生成器函数
def read_users():with open('users.csv', 'r') as file:for line in file:yield line.strip()r1 = read_users()  # 定义一个生成器对象
r2 = read_users()  # 定义另一个生成器对象
print(next(r1))
print(next(r1))
print(next(r1))
print(next(r1))
print(next(r2))
print(next(r2))
print(next(r2))
print(next(r2))

局部变量保留的demo

list1 = ['a', 'b', 'c', 'd', 'e', 'f']def iterator():i = 0for x in list1:yield do_something(i, x)i += 1def do_something(i, x):print(i, x)r1 = iterator()  # 定义一个生成器对象
r2 = iterator()  # 定义另一个生成器对象
next(r1)
next(r1)
next(r1)
next(r1)
next(r2)
next(r2)
next(r2)
next(r2)
next(r2)
运行结果:
0 a
1 b
2 c
3 d
0 a
1 b
2 c
3 d
4 e

更深入理解yield的“暂停”

函数每次遇到yield就暂停,它并不在意yield时来自于循环、迭代或者是在函数体内重复定义的,这意味着一个函数中可以有不止一个yield,并且每次运行到yield时,函数就暂停运行,并保存中间结果和变量,直到下一次next()后继续运行。

list1 = ['a', 'b', 'c', 'd', 'e', 'f']def iterator():for x in list1:yield print(x)yield print(x)yield print(x)yield print(x)r1 = iterator()  # 定义一个生成器对象
next(r1)
next(r1)
next(r1)
next(r1)
next(r1)
next(r1)# 运行结果:
# a
# a
# a
# a
# b
# b

可以将yield理解为一个中断标志

        可以将yield理解为一个中断标志,当生成器遇到 yield 语句时,它会暂停执行,并返回 yield 后面跟随的值或者函数。如果yield后面没有跟随内容,那么它就仅仅是一次暂停标志而已。

list1 = ['a', 'b', 'c', 'd', 'e', 'f']def iterator():i = 0for x in list1:print('loop', i)yieldi += 1print(x)r1 = iterator()  # 定义一个生成器对象
next(r1)
next(r1)
next(r1)
# 执行结果:
# loop 0
# a
# loop 1
# b
# loop 2

 yield的灵活运用

既然函数每次遇到yield就暂停,它并不在意yield时来自于循环、迭代或者是在函数体内重复定义的,而且可以将yield理解为一个中断标志,那么我们也就可以生成一个不循环的函数,通过yield达到步进执行的效果。

list1 = ['a', 'b', 'c', 'd', 'e', 'f']def iterator():i = 0print('breakpoint', i)yieldi += 1print('breakpoint', i)yieldi += 1print('breakpoint', i)yieldi += 1print('breakpoint', i)yieldi += 1print('breakpoint', i)r1 = iterator()  # 定义一个生成器对象
next(r1)
next(r1)
next(r1)
# 执行结果:
# breakpoint 0
# breakpoint 1
# breakpoint 2

注意可暂停和可迭代次数

要保证调用的次数不要大于可迭代次数或者可暂停次数,否则就会报错。

def iterator():i = 0print('breakpoint', i)i += 1yieldprint('breakpoint', i)i += 1yieldr1 = iterator()  # 定义一个生成器对象
next(r1)
next(r1)
next(r1)

上面的例子,定义了两个yield,但是next()调用了三次,所以出错。 

list1 = [1, 2, 3]def iterator():for i in list1:  # 遍历列表yield print(i)r1 = iterator()  # 定义一个生成器对象
next(r1)
next(r1)
next(r1)
next(r1)

这个,由于调用次数大于了列表的元素数量,也会出错。

采取措施,避免程序崩溃

1、使用try

def iterator():i = 0print('breakpoint', i)i += 1yieldprint('breakpoint', i)i += 1yieldr1 = iterator()  # 定义一个生成器对象def next_do():try:next(r1)except StopIteration:print("No more items to yield")next_do()
next_do()
next_do()
next_do()
list1 = [1, 2, 3]def iterator():for i in list1:  # 遍历列表yield print(i)r1 = iterator()  # 定义一个生成器对象def next_do():try:next(r1)except StopIteration:print("No more items to yield")next_do()
next_do()
next_do()
next_do()
next_do()# 运行结果:
# 1
# 2
# 3
# No more items to yield
# No more items to yield

2、指定next()的默认返回值参数,如果指定了该参数,并且迭代器没有更多的值可返回,则返回该参数的值,而不是引发 StopIteration 异常。

def iterator():i = 0print('breakpoint', i)i += 1yieldprint('breakpoint', i)i += 1yielddef next_do():if next(r1, 'END'):print('No more items to yield')r1 = iterator()  # 定义一个生成器对象next_do()
next_do()
next_do()
next_do()
next_do()# 运行结果:
# breakpoint 0
# breakpoint 1
# No more items to yield
# No more items to yield
# No more items to yield


http://www.mrgr.cn/news/31676.html

相关文章:

  • 《让手机秒变超级电脑!ToDesk云电脑、易腾云、青椒云移动端评测》
  • 在安装软件的时候显示缺少dll文件
  • 线程安全问题
  • 2024 “华为杯” 中国研究生数学建模竞赛(C题)深度剖析|数据驱动下磁性元件的磁芯损耗建模|数学建模完整代码+建模过程全解全析
  • 用户态缓存:链式缓冲区(Chain Buffer)
  • 【python设计模式6】行为型模式1
  • 高校心理辅导:Spring Boot技术实现
  • 强化学习基础:主要算法框架与Python实现示例
  • 【高级编程】XML DOM4J解析XML文件(含案例)
  • docker之自定义镜像上传至阿里云
  • ChromaDB教程_2024最新版(下)
  • Spring Boot框架下的心理教育辅导系统开发
  • 蓝灵娥以萝莉形态激萌返场!玄机科技再证国漫匠心
  • javascript 关于监听鼠标按键的补充
  • 掌握AI创作神器:10分钟搞定ComfyUI和Flux大模型
  • Android开发Intent详解
  • JavaEE: 深入探索TCP网络编程的奇妙世界(一)
  • Packet Tracer - IPv4 ACL 的实施挑战(完美解析)
  • JavaEE---Spring配置文件
  • 华为地图服务 - 如何实现地图数据聚合效果? -- HarmonyOS自学20