概述
在自己的Windows台式机上折腾了下Mask-RCNN
的训练,本来想切换到tensorflow 2.8.0,但是遇到的问题实在太多了,还是退回到1.15.0版本了
训练内容
主要是为了跑通训练流程,直接使用了Mask-RCNN
的Balloon训练数据集,基于coco
的权重文件开始训练
环境配置
Python: 3.7.13
依赖包,限定死版本的几个,也是遇到问题慢慢锁定的版本
numpyscipyPillowcythonmatplotlibscikit-image == 0.16.2tensorflow == 1.15.0tensorflow-gpu == 1.15.0keras == 2.1.3opencv-pythonh5py == 2.10imgaugIPython[all]
CUDA
CUDA: 10.0cudnn: v7.6.5.32 并且支持对应 CUDA 10.0
CUDA和cudnn安装完,bin目录配置到环境变量
代码改动
主要改动了IMAGES_PER_GPU = 2
,改成了IMAGES_PER_GPU = 1
,因为渣显卡显存有限
模型使用
balloon.py里一共会跑30个Epoch,在logs下对应的目录里,会有每个Epoch产生的h5模型文件。拿最后一个使用即可
原文:https://juejin.cn/post/7097602025717760036