基于yolo11 + reCamera 的深度学习workshop

背景

2025年08月31日,参加了个AI深度学习workshop,记录和复盘一下整个workshop例子。

环境准备

  • 显卡:L20

    因为手上有算力资源,本次记录就不使用AutoDL租借算力,本次使用L20,顺便完善一下yolo11环境,方便以后训练复用,同时也顺便测一下与4090的算力情况。

  • 训练环境:yolo11环境搭建
  • 视觉模块:reCamera 摄像头 $49.90刀
    • 缺点:我觉得像素还是上不了生产,还不如一个高清摄像头。
    • 优点:小,不仅仅一个摄像头,相当于一个边缘设备,可以独立部署上去。整合了工作流,可以快速部署监测模型。

实践

数据集准备

首先到 roboflow 找一份数据集,这次复盘记录我选一个螺丝数据集吧,毕竟这个reCamera的外观有一点工业风,就拿工业场景来做比较合适。

数据训练

前面准备了yolo11环境搭建,我们开始在这个yolo11环境开始训练。

模型量化与格式转换

  • 工具安装

    我们使用docker

    1
    2
    3
    4
    5
    # 拉取镜像并启动容器
    docker pull sophgo/tpuc_dev:v3.4
    docker run --privileged --name reCamera_dev -v $PWD:/workspace -it sophgo/tpuc_dev:v3.4
    #容器内安装工具包 tpu_mlir
    pip install tpu_mlir[all]==1.7

    上面方法慢的话:

    1
    2
    wget https://sophon-assets.sophon.cn/sophon-prod-s3/drive/25/04/15/16/tpuc_dev_v3.4.tar.gz
    docker load -i tpuc_dev_v3.4.tar.gz
    1
    2
    3
    4
    5
    6
    7
    8
    9
    version: '3.8'
    services:
    recamera_dev:
    image: sophgo/tpuc_dev:v3.4
    container_name: reCamera_dev
    privileged: true
    volumes:
    - .:/workspace
    restart: unless-stopped
  • 格式转换

    之所以要进行格式转换,因为不同的部署平台的架构不一样,支持的的格式不一

    • reCamera 基于RISC-V架构
      • ONNX→MLIR转换→cvimodel量化

部署与测试

  • 使用reCamera测试
  • 在本地电脑部署测试
  • 在手机端部署测试

场景思考

  • 深度学习在供应链中的应用

相关链接

ReCamera AI模型转换与量化全流程指南