医学影像分割系统综述Data preparation for artificial intelligence in medical imaging: A comprehensive guide ...

  • Data preparation for artificial intelligence in medical imaging: A comprehensive guide to open-access platforms and tools
  • 数据准备流程


    (i)临床站点的图像采集,(ii)图像去识别以去除个人信息并保护患者隐私,(iii)数据管理以控制图像和非图像信息的质量,(iv)图像存储和管理,最后(v)图像注释。
    • FAIR数据指导原则:可查找、可访问、可互操作和可重用的
    • 数据分类:与患者健康信息链接的任何受保护的健康信息(PHI)和个人可识别信息(PII)
      PII:可包括来自电子健康记录(EHR)、医学图像、临床和生物学数据,以及卫生服务提供者收集的任何其他数据
    • 数据格式:DICOM。通常称为元数据,图像包含一个标题,其中包含关于图像序列、医院、供应商、临床医生或患者信息等信息。
    • 去识别工具:FreeSurfer的 mri_deface、pydeface、mridefacer和Quickshear
      前三个是python库
      • 数据去识别工具的要求列表:不用的识别信息除去,用的看情况留;在临床站点训练,避免数据二次传输
      • ISO 25237:现有隐私保护采用标准
      • 详细列表
    • 内容管理工具:可进行格式转换和数据测试训练集管理
    •  
      • DICOM格式下例如DCMTK
      • GUI:Posda, DVTk, dcm4che, BrainVoyager, LONI Debabeler,dcm2niix的GUI是MRIcroGL
        Posda、DVTk和dcm4che提供web\GUI接口
    • 图像存储
    •  
      • PACS:在中央数据库中存储多模态医学图像(MRI、计算机断层扫描CT、正电子发射断层扫描PET等),并通过基于浏览器的格式(即DICOM)进行通信,这些格式可在整个医院以及多个设备和地点轻松访问。(会多重备份
        质量保证(QA)工作站:验证患者统计数据和研究的任何其他重要属性。•存档(中央存储设备):存储经过验证的图像以及任何报告、测量和其他相关信息。•阅读工作站:放射科医生审查数据并制定诊断的地方。
        • 医疗自动化系统接口:医院信息系统(HIS)、电子病历(EMR)和放射信息系统(RIS)
        • 开源解决例子
          Dcm4che (https://www.dcm4che.org)
          Kheops (Home - KHEOPS )
          可扩展神经影像档案工具包(XNAT) XNAT - Home



           
          • XNAT:Java web,在Postgres数据库中搜索,基于XML的数据模型,它可以支持任何类型的表格数据
          • Dicoogle:开源PACS存档,没数据库
          • Orthanc
          • 3D图像的标注:3D Slicer
    • 图像注释工具:3D Slicer
    •  
      • ITK-SNAP:贴标可在所有三个正交切面(轴向、冠状和矢状)上进行,并显示为3D渲染
      • MITK:辅助注解服务器的能力,并执行自动分割
      • Horos Viewer:基于OsiriXTM和其他开源医学图像库
      • ImageJ:java,支持DICOM
      • 插件:
        • Bio-Formats:专有的显微图像数据和元数据转换为标准化的开放格式
        • SciView:图像和网格的3D可视化和虚拟现实功能
        • MaMuT:用于浏览、注释和管理大图像数据的注释
        • Trainable Weka Segmentation:产生基于像素的分割
        • crowd Cure和CMRAD平台:云端
    • 医学图像存储库
      • 按目标器官和疾病分类的开放获取医学影像数据库的各种来源
      •  
        • TCIA:针对癌症成像的多种器官影像。DICOM格式,使用国家生物医学影像档案(NBIA)软件(https://imaging.nci.nih.gov)作为骨干
        • UK Biobank:临床数据
          如电子病历,它拥有超过10万名参与者的成像收集,包括大脑、心脏、腹部、骨骼和颈动脉的扫描
        • Kaggle
        • 神经成像数据集:IDA、OASIS、NITRC和CQ500
        • 视网膜眼底图像分割:STARE、DRIVE (Grand- Challenges的一部分)和HRF
        • 皮肤病变的数字图像集合:国际皮肤成像合作组织(ISIC)
        • 乳腺癌筛查乳房x线照片:OPTIMAM (OMI-DB)
        • 超声心动图视频:EchoNet- Dynamic
        • 心血管研究:euCanSHare
        • 常见胸部疾病的带注释x线影像:NHS Chest X-ray
        • 诊断肺部CT图像:康奈尔大学工程:视觉和图像分析实验室存储库
        • covid - 19:BIMCV COVID19 , COVID- 19 Image Data Collection
        • TCIA数据库
  • 挑战:关于各个阶段都有
  • AI发展方向:(i)数据增强与合成,(ii)Federated learning,(iii) AI的合理使用问题,(iv)不确定性估计
    • 数据增强与合成:使用可行的几何变换、翻转、颜色修改、裁剪、旋转、噪声注入和随机擦除的基本策略,以及其他更先进的技术,包括创建新的合成图像,如生成对抗网络
    • Federated learning:多个分散的持有本地数据样本的临床站点上训练算法,而不交换数据样本。经过本地训练的AI结果随后会在一个集中的位置组合起来。
    • 合理使用:临床站点收集的常规临床数据可能存在缺陷、偏差(如性别失衡)或容易产生噪声(如存在图像伪影)。通过定义有效跟踪这些问题的算法,可以实现一些进步
    • 不确定性:模型准确度,提示临床医生对软件的依赖程度

猜你喜欢

转载自blog.csdn.net/qq_56061892/article/details/126224572