加载onnx模型进行推理onnx的模型加载,需要用到onnx runtime。 推理代码: import torch import onnxruntime as rt from transformers import Lla...最新博文# import# llamatokenizer# onnx2年前020