我们提供了一种teacher-student model for semi-supervised multi-organ segmentation.
通常在teacher-student框架中,数据增强是一种常见的作用在无标签数据上,然后通过teacher和student的一致性训练来regularize。我们从一个关键的点子出发:
符号定义:
【如何把CT划分成magic cubes的】
看起来就是把原始CT划分成N份,其实问题就是:如果WHL不相等,那么每一个matic cube也是长方体而不是正方形。
把这个magic cube 划分成更小的叫做cube的东西,其实我理解就是patch下面在划分成patch,然后可以把有标签的patch和没有标签的patch进行打乱,也就是上图中Mix small-cubes cross-image的东西。这个mix patch经过seg之后,得到的结果,我们可以recover成原来的进行计算损失。
这样做的目的是encourage labeled and unlabeled images to learn comprehensive common semantics from each other.(我还没想好,其实挺有趣的做法,但是还是感觉有点怪怪的。最大的问题就是,这种mix一定程度打乱了卷积的局部相关性,不同数据的这种mix混合是否会有增强效果。做法其实应该在全监督分割中做过,就是两个数据进行各种方法的融合,比方说moco?我觉得这种做法在teacher-student自然图像当中,好像有过类似的idea。只是这里放在了3D上面。再比如,如果我做一个事情,就是完全抛弃CT的先验结构,我通过数据增强,让一个人身体里面有两个心脏?让肾脏甚至可以和骨头进行重叠?这样的增强方式更类似最初的自然图像的mixer的逻辑。但是医学中这样做会不会有效果呢?这篇文章并没有这样做,而是在先验结构的协议下,进行的增强。)
上面是对于migic cube进行分割的叫做,cross-image的增强,下面还做了叫做with-in partition,我理解应该是输入小尺寸的数据,也就是cubes而不是magic cube。上图中的第一行就是在做这个事情。
这一部分我觉得不太合理,感兴趣可以看下原文。
目的是利用prior anatomical knowledge of multi-organs。image的encoder得到特征图后,需要经过连个全连接层进行分类,预测的对象是这个magic-cube是哪一个位置的。这是一种理论上可以让模型考虑先验知识的做法。当然这样的做法是否真的有用:分割模型加入这个预测位置的分支,是否会影响特征提取对于分割的结合性。
此外,这篇文章的做法我最大的疑惑就是:2. 作者把数据变成1.5x1.5x2mm的spacing,但是不同的人不同的身高,那么意味着不同的人可能会在同样的magic cube上有不同的结构。这样的问题会对模型有
往期精彩回顾
交流群
欢迎加入机器学习爱好者微信群一起和同行交流,目前有机器学习交流群、博士群、博士申报交流、CV、NLP等微信群,请扫描下面的微信号加群,备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~(也可以加入机器学习交流qq群772479961)