浅析Python pickle 包的理解和使用

寻技术 Python编程 2023年10月12日 65

picklePython 库中的一个模块,用于将 Python 对象序列化和反序列化。pickle 可以将对象序列化为字符串或字节序列,以便在网络上传输或保存到文件中。

pickle 是一个非常有用的工具,可以将 Python 对象转换为可序列化的字符串或字节序列,然后将这些数据保存到文件中或在网络上传输。这在多个领域中都非常有用,特别是在缓存、配置和持久化等领域。pickle 可以处理大多数 Python 对象,包括基本数据类型、字典、列表、元组、集合、用户自定义类和实例等。

使用 pickle,可以轻松地将一个 Python 对象序列化为字节流:

import pickle
data = [1, 2, 3, 4, 5]
# 序列化对象
pickled_data = pickle.dumps(data)
print(pickled_data)

输出结果为:

b'\x80\x04\x95\x0f\x00\x00\x00\x00\x00\x00\x00]\x94(K\x01K\x02K\x03K\x04K\x05e.'

反序列化:

unpickled_data = pickle.loads(pickled_data)
print(unpickled_data)

输出结果为:

[1, 2, 3, 4, 5]

注意:pickle 序列化的对象是二进制数据,所以在打印输出时需要使用字节串前缀 “b”

pickle 还有很多其他功能,比如使用 dump()load() 将数据序列化和反序列化到文件中,使用 Protocol 参数控制序列化的版本,使用 HIGHEST_PROTOCOL 指定最高版本的序列化协议等。需要注意的是,pickle 可能存在一些安全问题,因为它可以反序列化任意 Python 代码。因此,建议只从受信任的源中反序列化 pickle 数据。

picklePython 标准库中的一个序列化模块,它可以将 Python 对象转换成字节流,以便将它们保存到文件或将它们在网络上传输。

pickle 能够处理大多数 Python 对象,包括基本数据类型、复杂数据类型和用户自定义类的实例。pickle 可以实现序列化和反序列化,将一个对象转换成字节流即序列化,将一个字节流转换成对象即反序列化。pickle 的主要应用包括:缓存、配置和持久化等领域。

举个例子,假设我们有一个 Python 的字典,我们想要将它持久化到文件中或者将它传输到网络中,可以使用 pickle 包来实现:

import pickle
# 定义一个字典
person = {'name': 'Alice', 'age': 28, 'gender': 'Female'}
# 将字典对象序列化为字节流
bytes_person = pickle.dumps(person)
# 将字节流反序列化为对象
new_person = pickle.loads(bytes_person)
print(person)       # {'name': 'Alice', 'age': 28, 'gender': 'Female'}
print(new_person)   # {'name': 'Alice', 'age': 28, 'gender': 'Female'}

输出结果为:

{'name': 'Alice', 'age': 28, 'gender': 'Female'}
{'name': 'Alice', 'age': 28, 'gender': 'Female'}

我们再来一个更实际的例子。假设我们有一个机器学习模型,我们希望将该模型保存到文件中,并在需要的时候重新加载该模型,以便进行预测。我们可以使用 pickle 包来实现模型的序列化和反序列化。

import pickle
import numpy as np
from sklearn.linear_model import LogisticRegression
# 生成一些随机数据
X = np.random.rand(100, 5)
y = np.random.randint(0, 2, (100,))
# 实例化一个逻辑回归模型
clf = LogisticRegression()
# 拟合模型
clf.fit(X, y)
# 将模型序列化为字节流
bytes_model = pickle.dumps(clf)
# 将字节流反序列化为模型对象
new_clf = pickle.loads(bytes_model)
# 对新数据进行预测
new_X = np.random.rand(10, 5)
new_y_pred = new_clf.predict(new_X)
print(new_y_pred)

输出结果为:

[1 1 0 1 0 1 1 0 1 1]

原文地址:https://blog.csdn.net/wzk4869/article/details/130648728
关闭

用微信“扫一扫”