5.3.tensorRT基础(2)-从下载onnx-tensorrt到配置好并运行起来

发布人：shili8 发布时间：2025-02-12 16:09 阅读次数：0

**TensorRT 基础 (2) - 从下载 ONNX 到配置好并运行起来**

在前一篇文章中，我们已经了解了什么是 TensorRT，以及它如何帮助我们加速深度学习模型的推理速度。现在，我们将一步步地讲解如何从下载 ONNX 模型到配置好并运行起来。

**1. 下载 ONNX 模型**

首先，我们需要下载一个 ONNX 模型。ONNX 是一种开放式的、跨语言的深度学习模型格式，支持多种框架，如 TensorFlow、PyTorch 等。在这里，我们将使用 PyTorch 来训练一个简单的神经网络，然后导出为 ONNX 格式。

import torchimport torch.nn as nn# 定义一个简单的神经网络class Net(nn.Module):
 def __init__(self):
 super(Net, self).__init__()
 self.fc1 = nn.Linear(5,10)
 self.fc2 = nn.Linear(10,5)

 def forward(self, x):
 x = torch.relu(self.fc1(x))
 x = self.fc2(x)
 return x# 初始化神经网络net = Net()

# 定义输入数据input_data = torch.randn(1,5)

# 前向传播output = net(input_data)

# 导出为 ONNX 格式import onnxonnx.save(net.state_dict(), "model.onnx")

**2. 安装 TensorRT**

接下来，我们需要安装 TensorRT。TensorRT 是一个由 NVIDIA 提供的、用于加速深度学习模型推理的库。在这里，我们将使用 pip 来安装。

bashpip install tensorrt

**3. 下载 ONNX 模型到 TensorRT**

现在，我们可以下载 ONNX 模型到 TensorTR 中了。我们需要使用 `trt.Runtime` 类来加载 ONNX 模型。

import tensorrt as trt# 加载 ONNX 模型runtime = trt.Runtime()
engine = runtime.deserializeEngine("model.onnx")

# 获取引擎的输入和输出名称input_names = engine.get_input_names()
output_names = engine.get_output_names()

print("Input Names:", input_names)
print("Output Names:", output_names)

**4. 配置 TensorRT**

在上一步中，我们已经加载了 ONNX 模型到 TensorTR 中。现在，我们需要配置 TensorRT 来加速模型的推理速度。在这里，我们将使用 `trt.Builder` 类来配置引擎。

# 创建一个 Builder 对象builder = trt.Builder()

# 配置 Builderbuilder.max_workspace_size =1 << 30# 构建引擎engine = builder.build_engine(engine)

# 获取构建好的引擎print("Engine Built Successfully!")

**5. 运行 TensorRT**

最后，我们可以使用 `trt.Runtime` 类来运行 TensorTR 引擎了。

# 创建一个 Runtime 对象runtime = trt.Runtime()

# 运行引擎context = runtime.create_context(engine)

# 前向传播input_tensor = torch.randn(1,5)
output_tensor = context.execute_v2([input_tensor])

print("Output Tensor:", output_tensor)

在本文中，我们一步步地讲解了从下载 ONNX 模型到配置好并运行起来的过程。我们使用 PyTorch 来训练一个简单的神经网络，然后导出为 ONNX 格式。在下一篇文章中，我们将继续探讨 TensorRT 的更多功能和应用。

上一条：【Python数据分析】Python基础知识篇

下一条：C++最佳实践：优雅的C++ lambda