【深度学习】CLAIM | AI在医学影像的checklist

Checklist for Artificial Intelligence in Medical Imaging
  • 文章转自:机器学习炼丹术
  • 作者:陈亦新

今天学习一下CLAIM,也就是AI在医学影像的checklist,有一些期刊可能会用这个checklist,所以早晚要用上这个(对我来说).其实这个checklist也是对于论文中每一个section的内容的一个规范。

文件大概是这样的:

Title/Abstract

  1. Identification as a study of AI methodology, specifying the category of technology used (e.g., deep learning)识别为AI方法研究,明确所使用技术类别(例如,深度学习)这一项要求明确研究是关于人工智能方法的,同时指定所使用的技术类别,如深度学习。

  2. Structured summary of study design, methods, results, and conclusions 研究设计、方法、结果和结论的结构化摘要.为研究设计、方法、结果和结论提供结构化摘要,以便清晰地呈现这些关键信息。

Introduction

  1. Scientific and clinical background, including the intended use and clinical role of the AI approach科学和临床背景,包括AI方法的预期用途和临床角色

  2. Study objectives and hypotheses研究目标和假设

Methods

study design

  1. Prospective or retrospective study指明研究是前瞻性还是回顾性的。

  2. Study goal, such as model creation, exploratory study, feasibility study, non-inferiority trial描述研究的目标,例如创建模型、探索性研究、可行性研究、非劣效试验等。

Data

  1. Data sources描述数据的来源。

  2. Eligibility criteria: how, where, and when potentially eligible participants or studies were identified (e.g.,  symptoms, results from previous tests, inclusion in registry, patient-care setting, location, dates)符合资格标准:如何、何地以及何时确定可能符合条件的参与者或研究(例如,症状、先前测试结果、纳入登记册、患者护理设置、地点、日期)

  3. Data pre-processing steps 描述数据的预处理步骤。

  4. Selection of data subsets, if applicable说明如何选择数据的子集。

  5. Definitions of data elements, with references to Common Data Elements定义数据元素,并引用通用数据元素。

  6. De-identification methods描述去识别方法。

  7. How missing data were handled描述如何处理缺失数据。

Ground truth

  1. Definition of ground truth reference standard, in sufficient detail to allow replication详细定义地面真相参考标准,以便其他人能够复制研究。

  2. Rationale for choosing the reference standard (if alternatives exist)解释选择参考标准的原因,如果存在替代方案。

  3. Source of ground-truth annotations; qualifications and preparation of annotators描述地面真相注释的来源,注释者的资格和准备。

  4. Annotation tools描述用于注释的工具。

  5. Measurement of inter- and intrarater variability; methods to mitigate variability and/or resolve discrepancies测量评价者间和评价者内的变异,并描述减轻变异和/或解决差异的方法。

Data Partitions

  1. Intended sample size and how it was determined描述预期的样本大小及其确定方式。

  2. How data were assigned to partitions; specify proportions描述将数据分配给分区的方式,并指定比例。

  3. Level at which partitions are disjoint (e.g., image, study, patient, institution)描述分区是否在图像、研究、患者、机构等层次上相互独立。

Model

  1. Detailed description of model, including inputs, outputs, all intermediate layers and connections提供模型的详细描述,包括输入、输出、所有中间层和连接。

  2. Software libraries, frameworks, and packages描述使用的软件库、框架和包。

  3. Initialization of model parameters (e.g., randomization, transfer learning)描述模型参数的初始化,例如是否采用随机化或迁移学习

Training

  1. Details of training approach, including data augmentation, hyperparameters, number of models trained描述训练方法的详细信息,包括数据增强、超参数、训练的模型数量等。

  2. Method of selecting the final model 描述选择最终模型的方法。

  3. Ensembling techniques, if applicable描述集成技术,如果使用的话。

Evaluation

  1. Metrics of model performance描述模型性能的度量标准。

  2. Statistical measures of significance and uncertainty (e.g., confidence intervals)描述模型性能的统计措施和不确定性。

  3. 描述鲁棒性或敏感性分析的方法。Robustness or sensitivity analysis

  4. Methods for explainability or interpretability (e.g., saliency maps), and how they were validated描述解释性或可解释性的方法,以及它们的验证方式。

  5. Validation or testing on external data描述在外部数据上的验证或测试方法。

Results

Data

  1. Flow of participants or cases, using a diagram to indicate inclusion and exclusion使用图表描述参与者或案例的流程,包含和排除的情况。

  2. Demographic and clinical characteristics of cases in each partition描述每个分区中案例的人口统计和临床特征。

Model performance

  1. Performance metrics for optimal model(s) on all data partitions描述所有数据分区上最佳模型的性能度量。

  2. Estimates of diagnostic accuracy and their precision (such as 95% confidence intervals)描述诊断准确性及其精度估计,如95%置信区间。

  3. Failure analysis of incorrectly classified cases对错误分类案例进行失败分析。

Discussion

  1. Study limitations, including potential bias, statistical uncertainty, and generalizability讨论研究的限制,包括潜在的偏见、统计不确定性和可推广性。

  2. Implications for practice, including the intended use and/or clinical role 讨论研究对实践的影响,包括预期的用途和/或临床角色。

往期精彩回顾



  • 交流群

欢迎加入机器学习爱好者微信群一起和同行交流,目前有机器学习交流群、博士群、博士申报交流、CV、NLP等微信群,请扫描下面的微信号加群,备注:”昵称-学校/公司-研究方向“,例如:”张小明-浙大-CV“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~(也可以加入机器学习交流qq群772479961


相关推荐

  • 【NLP】大模型最全八股和答案(中)
  • 【学术相关】一位苦读6年终于毕业的博士说出了读博的四个陷阱
  • 大模型实践之浅尝prompt咒语设计:one-shot微调chatglm-6b实践信息抽取
  • 首发!文心一言「插件开发」中文教程,来了!
  • Node.js有多强?
  • Redis分布式锁存在哪些问题,该如何解决?
  • 2023年了,Java后端还能再战么?
  • 华为悬赏200万解答技术难题;“ChatGPT 之父”暗讽马斯克:你的Grok过时了;微软视窗操作系统诞生四十周年|极客头条
  • 一个前端非侵入式骨架屏自动生成方案
  • ​Pytest 高效测试 Python 代码
  • 润乾报表杀疯了,几十万的软件,卖1万!
  • 纯CSS实现魔法渐变边框卡片
  • ​前端代码一定要优雅,高端前端程序员都应该具备的 !
  • Git操作你还在用merge么?了解了解rebase吧!
  • 2300 万,35 岁腾讯员工准备提前退休了
  • 程序员被奖励 38g 黄金空格键,价值近 2 万元,网友:“每次敲击一下都是钱声!”
  • 【值得收藏】优秀前端必备:基本素养、代码规范、开发技巧!!!
  • Vue的@input怎么做到不监听输入法拼音的?90%人不知道~
  • 阿里云史诗级崩溃。。。
  • GitHub 官方开源的字体集「GitHub 热点速览」