【深度学习】MagicNet | CVPR2022 | 医学图像的3D mixer

<<最近读物>>TMI 2019 | Multi-Modal Knowledge Distillation
  • 论文名称:MagicNet: Semi-Supervised Multi-Organ Segmentation via Magic-Cube Partition and Recovery
  • 论文链接:https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_MagicNet_Semi-Supervised_Multi-Organ_Segmentation_via_Magic-Cube_Partition_and_Recovery_CVPR_2023_paper.pdf

摘要

我们提供了一种teacher-student model for semi-supervised multi-organ segmentation.

通常在teacher-student框架中,数据增强是一种常见的作用在无标签数据上,然后通过teacher和student的一致性训练来regularize。我们从一个关键的点子出发:

  • fixed relative locations
  • variable sizes of different organs can provide distribution information where a multi-organ CT scan is drawn 因此这是一个利用先验结构来引导模型训练的半监督算法。此外,我们提出了一种数据增强的策略,基于partition-and-recovery N3 cubes。

method

符号定义:

  1. CT是X,尺寸为WHL;
  2. 有C个类别
  3. 训练集D包含两个子集,,前者是有标签的数据,后者是无标签的数据。
  4. 在文章的其他地方,we denote the oringal and mixed CT scans as magic-cubes, and denote the partitional small cubes as cubes for simplicity.

magic-cube partition and recovery

【如何把CT划分成magic cubes的】

看起来就是把原始CT划分成N份,其实问题就是:如果WHL不相等,那么每一个matic cube也是长方体而不是正方形。

把这个magic cube 划分成更小的叫做cube的东西,其实我理解就是patch下面在划分成patch,然后可以把有标签的patch和没有标签的patch进行打乱,也就是上图中Mix small-cubes cross-image的东西。这个mix patch经过seg之后,得到的结果,我们可以recover成原来的进行计算损失。

这样做的目的是encourage labeled and unlabeled images to learn comprehensive common semantics from each other.(我还没想好,其实挺有趣的做法,但是还是感觉有点怪怪的。最大的问题就是,这种mix一定程度打乱了卷积的局部相关性,不同数据的这种mix混合是否会有增强效果。做法其实应该在全监督分割中做过,就是两个数据进行各种方法的融合,比方说moco?我觉得这种做法在teacher-student自然图像当中,好像有过类似的idea。只是这里放在了3D上面。再比如,如果我做一个事情,就是完全抛弃CT的先验结构,我通过数据增强,让一个人身体里面有两个心脏?让肾脏甚至可以和骨头进行重叠?这样的增强方式更类似最初的自然图像的mixer的逻辑。但是医学中这样做会不会有效果呢?这篇文章并没有这样做,而是在先验结构的协议下,进行的增强。)

上面是对于migic cube进行分割的叫做,cross-image的增强,下面还做了叫做with-in partition,我理解应该是输入小尺寸的数据,也就是cubes而不是magic cube。上图中的第一行就是在做这个事情。

Cube-wise Pseudo-label Blending

这一部分我觉得不太合理,感兴趣可以看下原文。

Magic-cube Location Reasoning

目的是利用prior anatomical knowledge of multi-organs。image的encoder得到特征图后,需要经过连个全连接层进行分类,预测的对象是这个magic-cube是哪一个位置的。这是一种理论上可以让模型考虑先验知识的做法。当然这样的做法是否真的有用:分割模型加入这个预测位置的分支,是否会影响特征提取对于分割的结合性。

此外,这篇文章的做法我最大的疑惑就是:2. 作者把数据变成1.5x1.5x2mm的spacing,但是不同的人不同的身高,那么意味着不同的人可能会在同样的magic cube上有不同的结构。这样的问题会对模型有

往期精彩回顾



  • 交流群

欢迎加入机器学习爱好者微信群一起和同行交流,目前有机器学习交流群、博士群、博士申报交流、CV、NLP等微信群,请扫描下面的微信号加群,备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~(也可以加入机器学习交流qq群772479961


相关推荐

  • 可以提取图像文本的 5 大 Python 库
  • 效率提升 100%,一款效果炸裂的白板神器!
  • 一夜之间,上千家初创公司,全被OpenAI干倒了!GPT-4超豪华套餐上线!文件上传分析,模型自动选择
  • 豆瓣9分线代教材免费了!斯坦福伯克利都在用,新版PDF直接下载
  • 有了HTTP,为什么还要RPC?
  • 聊一聊如何在 Vue3 表单中显示和隐藏元素
  • DDD与微服务集成的第一战役:客户端重试&服务端幂等
  • 轻松合并Excel工作表:Java批量操作优化技巧
  • Ant Design 5.10.3 发布
  • 买彩票能中大奖?用Java盘点常见的概率悖论
  • GPT-4 又进化了!画图、插件、代码等能力被整合,网友:“更像是 AI Agent 了!”
  • 华为申请“遥遥领先”商标;苹果发布M3系列芯片和全新MacBook Pro;GitHub Stars功能已被滥用|极客头条
  • 使用 CSS columns 布局来实现自动分组布局
  • 阿里终面:10亿数据如何快速插入MySQL?
  • 太强了!看看别人设计的安全好用的OpenApi!
  • “内向”的技术人如何主动社交?
  • 【附源码】使用 Threejs 从基础开始构建 3D 地球!!!
  • 未来不一定有SaaS
  • Mybatis-Plus通用枚举功能 [MyBatis-Plus系列] - 第493篇
  • Amazing!三维场景竟然可以一键生成