python怎么存储ndarry

在Python编程中，ndarray是一种常用的数组类型，它由NumPy库提供支持，NumPy是Python中用于数值计算的核心库，广泛应用于数据分析、机器学习等领域，如何在Python中存储ndarray呢？本文将详细介绍几种存储ndarray的方法。

我们需要导入NumPy库，如果还没有安装NumPy，可以通过pip命令进行安装，以下是如何在Python中存储ndarray的详细步骤和方法：

使用文件格式存储

1.1 二进制文件格式（.npy和.npy）

NumPy提供了自己的二进制文件格式，可以用来存储和读取ndarray，使用numpy.save()函数可以将数组保存为.npy文件，使用numpy.load()函数可以读取.npy文件。

Python

import numpy as np
创建一个ndarray
arr = np.array([1, 2, 3, 4, 5])
保存ndarray到.npy文件
np.save('arr.npy', arr)
读取.npy文件
loaded_arr = np.load('arr.npy')

2 文本文件格式（.txt）

除了二进制文件，我们还可以将ndarray保存为文本文件，使用numpy.savetxt()函数可以将数组保存为.txt文件，使用numpy.loadtxt()函数可以读取.txt文件。

Python

保存ndarray到.txt文件
np.savetxt('arr.txt', arr)
读取.txt文件
loaded_arr = np.loadtxt('arr.txt')

使用pickle模块存储

Python的pickle模块提供了一个简单的序列化和反序列化Python对象的方法，我们可以使用pickle来存储和读取ndarray。

Python

import pickle
创建一个ndarray
arr = np.array([[1, 2, 3], [4, 5, 6]])
保存ndarray到pickle文件
with open('arr.pkl', 'wb') as f:
    pickle.dump(arr, f)
读取pickle文件
with open('arr.pkl', 'rb') as f:
    loaded_arr = pickle.load(f)

使用HDF5格式存储

HDF5是一种面向存储和组织大量数据的文件格式，NumPy与HDF5格式兼容，可以使用h5py库来存储和读取ndarray。

Python

import h5py
创建一个ndarray
arr = np.random.rand(100, 100)
保存ndarray到HDF5文件
with h5py.File('arr.h5', 'w') as f:
    f.create_dataset('dataset_1', data=arr)
读取HDF5文件
with h5py.File('arr.h5', 'r') as f:
    loaded_arr = f['dataset_1'][:]

使用内存映射存储

NumPy提供了内存映射功能，可以将大文件映射到内存中，这样可以实现对大数组的高效访问，使用numpy.memmap类可以创建内存映射。

Python

创建内存映射文件
mmap = np.memmap('mmap.dat', dtype='float32', mode='w+', shape=(100, 100))
将数据写入内存映射
mmap[:] = np.random.rand(100, 100)
读取内存映射
loaded_arr = np.memmap('mmap.dat', dtype='float32', mode='r', shape=(100, 100))