PaddleSeg:车道线检测

0.1 任务

要求参赛者利用提供的训练数据,设计一个车道线检测和分类模型,来检测测试数据中车道线的具体位置和类别。样例示范:


0.2 数据集描述


本次赛题数据集包括x张手机拍摄的道路图片数据,并对这些图片数据标注了车道线的区域和类别,其中标注数据以灰度图的方式存储。

标注数据是与原图尺寸相同的单通道灰度图,其中背景像素的灰度值为0,不同类别的车道线像素分别为不同的灰度值,具体如下表所示:




3. 数据处理

参考项目从头搭建无人车车道线检测挑战赛解决方案中提到:

通过仔细观察,我们发现这些数据有一个共同的特点,就是图片的上三分之一部分都是天空,是没有车道线存在的,知道了这点后,我们就可以进行一个裁剪的过程,一下子就可以节省下三分之一的显存,是不是很爽呢?这里我选择裁剪上方690个像素的高度。


在本次比赛的数据集中,这种现象同样存在,因此本文也采用截去天空的方式进行训练,省下内存空间。本文的做法是直接裁剪掉图片的上半部分。

3.1 裁剪效果

注:如果感觉裁剪幅度过大,读者可自行修改裁剪比例


4. 开始训练

4.1 注意事项

训练时需要注意,默认PaddleSeg v0.6在Paddlepaddle 1.8.4的框架版本下paddle.enable_static()这句代码会报错,解决办法就是将pdseg/train.py中这行代码注释掉;后面pdseg/vis.pypdseg/eval.py也需要进行相同操作。



4.2 类别不均衡问题处理

在PaddleSeg文档中,特别就类别不均衡问题的处理进行了说明:

在图像分割任务中,经常出现类别分布不均匀的情况,例如:工业产品的瑕疵检测、道路提取及病变区域提取等。

针对这个问题,您可使用Weighted softmax loss、Dice loss、Lovasz hinge loss和Lovasz softmax loss进行解决。

  • Weighted softmax loss

Weighted softmax loss是按类别设置不同权重的softmax loss。

通过设置cfg.SOLVER.CROSS_ENTROPY_WEIGHT参数进行使用。
默认为None. 如果设置为'dynamic',会根据每个batch中各个类别的数目,动态调整类别权重。也可以设置一个静态权重(list的方式),比如有3类,每个类别权重可以设置为[0.1, 2.0, 0.9]. 示例如下

SOLVER: CROSS_ENTROPY_WEIGHT: 'dynamic'

由于比赛是一个分类问题,因此参考configs/lovasz_softmax_deeplabv3p_mobilenet_pascal.yaml的配置方式,对SLOVER进行设置。

而在比赛基线项目中,也给出了类别权重的计算过程:


4.3 DeepLabv3+模型finetune

这里参考文档的DeepLabv3+模型使用教程进行设置,参考config文件

https://gitee.com/paddlepaddle/PaddleSeg/blob/develop/tutorial/finetune_deeplabv3plus.md

5. 训练过程可视化

在可视化模块中配置logdir路径为PaddleSeg/vdl_log_dir可对训练过程进行监控

6. 生成预测结果

6.1 修改配置文件

这里注意要将不同分辨率的图片分开,然后修改配置文件中的:

  • EVAL_CROP_SIZEEVAL_CROP_SIZE: (1920, 1080)EVAL_CROP_SIZE: (1280, 720)

  • 对应的VIS_FILE_LISTTEST_FILE_LIST路径配置

  • BATCH_SIZE建议改为1,否在显存可能不够用



6.2 修改vis.py使其将预测结果输出为单通道灰度图

其实就是将灰度图转伪彩色部分的代码注释掉:

In [10]

# 对test_list2.txt和test_list3.txt分别进行预测,result目录下就是可提交的图片文件
!python pdseg/vis.py --use_gpu --cfg ./configs/deeplabv3p_resnet50_vd_cityscapes.yaml --vis_dir result

预测可视化效果:

  


原文地址

https://aistudio.baidu.com/aistudio/projectdetail/1081298?channelType=1&channel=1


相关推荐

  • 1024只有一天,小红书的程序员节竟然有 3 天
  • 涉及万亿元规模资产,华润集团数字化转型如何“大象转身”(附下载)
  • 揭秘汇丰科技高效研发的三大创新路径|Q推荐
  • 移动云消息中间件产品矩阵在开源技术创新领域的演进之路
  • 比流计算资源效率最高提升 1000 倍,“增量计算”新模式能否颠覆数据分析?
  • “这是一件关于云服务的大事儿!”英特尔 4400 万美元投资基础设施初创公司,硬刚公有云
  • 马斯克𝕏一周年成绩单:估值降至200亿美元,广告收入下降60%,自己成发帖最多的人
  • 小米3999新旗舰发布,搭载全新自研操作系统!打通手机家庭汽车
  • 郭德纲用英语说相声,那叫一个地地地地地道!
  • 波士顿动力机器狗能开口聊天了!ChatGPT加持,对话机智妙语连珠
  • 实测腾讯AI文生图!王者荣耀画风一键直出,小程序就能玩
  • Java8 Stream 一行代码实现数据分组统计、排序、最大值、最小值、平均值、总数、合计
  • 首个AI Prompt 工程师计划发布!
  • RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶
  • 小米14发布:搭载全新澎湃OS,Pro版用上钛金属
  • 波士顿动力机器狗装上ChatGPT大脑当导游,一开口就是老伦敦腔
  • DeepMind:谁说卷积网络不如ViT?
  • 每人10万元,这13位青年人才获得2023年度字节跳动奖学金
  • OpenAI 组建安全 AGI 新团队!应对AI“潘多拉魔盒”
  • 音乐智能体登场!我和杰伦的距离或许只差一个 MusicAgent!