TPU-MLIR快速入门手册

SOPHGO LOGO
法律声明
版权所有 © 算能 2025. 保留一切权利。
非经本公司书面许可, 任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部, 并不得以任何形式传播。
注意
您购买的产品、服务或特性等应受 算能 商业合同和条款的约束, 本文档中描述的全部或部分产品、服务或特性可能不在您的购买或使用范围之内。 除非合同另有约定, 算能 对本文档内容不做任何明示或默示的声明或保证。 由于产品版本升级或其他原因, 本文档内容会不定期进行更新。 除非另有约定, 本文档仅作为使用指导, 本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
技术支持
地址:

北京市海淀区丰豪东路9号院中关村集成电路设计园(ICPARK)1号楼

邮编:

100094

网址:

https://www.sophgo.com/

邮箱:

sales@sophgo.com

电话:

010-57590723

发布记录

版本

发布日期

说明

v1.18.0

2025.05.01

yolo系列增加自动混精设置; run_calibration增加SmoothQuant选择; 新增llm一键编译脚本

v1.17.0

2025.04.03

LLM模型编译速度大幅提升; TPULang支持PPL算子接入; 修复Trilu bf16在Mars3上随机出错问题

v1.16.0

2025.03.03

TPULang ROI_Extractor支持; Einsum支持 abcde,abfge->abcdfg模式; LLMC支持Vila模型

v1.15.0

2025.02.05

支持LLMC量化; codegen地址越界判断; 修复若干对比问题

v1.14.0

2025.01.02

yolov8/v11后处理融合支持; Conv3D stride大于15支持; FAttention精度提升

v1.13.0

2024.12.02

精简Release发布包; MaxPoolWithMask训练算子性能优化; RoPE大算子支持;

v1.12.0

2024.11.06

tpuv7-runtime cmodel接入; BM1690多核LayerGroup优化; 支持PPL编写后端算子

v1.11.0

2024.09.27

BM1688 tdb增加soc模式; bmodel支持细粒度合并; 修复若干性能下降问题

v1.10.0

2024.08.15

支持yolov10; 增加量化调优章节; 优化tpu-perf日志打印

v1.9.0

2024.07.16

BM1690新增40个模型回归测试; 量化算法新增octav,aciq_guas和aciq_laplace

v1.8.0

2024.05.30

BM1690支持多核MatMul算子; TPULang支持输入输出顺序指定; tpuperf移除patchelf依赖

v1.7.0

2024.05.15

CV186X双核修改为单核; BM1690测试流程与BM1684X一致; 支持gemma/llama/qwen等模型

v1.6.0

2024.02.23

添加了Pypi发布形式; 支持用户自定义Global算子; 支持了CV186X处理器平台

v1.5.0

2023.11.03

更多Global Layer支持多核并行;

v1.4.0

2023.09.27

系统依赖升级到Ubuntu22.04; 支持了BM1684 Winograd

v1.3.0

2023.07.27

增加手动指定浮点运算区域功能; 添加支持的前端框架算子列表; 添加NNTC与TPU-MLIR量化方式比较

v1.2.0

2023.06.14

调整了混合量化示例

v1.1.0

2023.05.26

添加使用智能深度学习处理器做后处理

v1.0.0

2023.04.10

支持PyTorch, 增加章节介绍转PyTorch模型

v0.8.0

2023.02.28

添加使用智能深度学习处理器做前处理

v0.6.0

2022.11.05

增加章节介绍混精度操作过程

v0.5.0

2022.10.20

增加指定model-zoo, 测试其中的所有模型

v0.4.0

2022.09.20

支持Caffe, 增加章节介绍转Caffe模型

v0.3.0

2022.08.24

支持TFLite, 增加章节介绍转TFLite模型。

v0.2.0

2022.08.02

增加了运行SDK中的测试样例章节。

v0.1.0

2022.07.29

初版发布, 支持 resnet/mobilenet/vgg/ssd/yolov5s , 并用yolov5s作为用例。

目录