百奥知

【直播回顾】基于AI技术的真实世界数据治理

发布时间:2022-04-22 阅读:2839

      4月21日下午,由百奥知开发总监鲁楠老师直播的《基于AI技术的真实世界数据治理》课程回放已生成!欢迎大家关注百奥知公众号,进入公众号“大讲堂”即可观看!

      真实世界研究

课程概要


      本期课程中,鲁老师开篇对真实世界研究的起源、特点等整体概况、体系架构、RWD的广泛来源等为大家做了详细的介绍,通过分析传统数据治理的现状,提出基于照片进行数据治理的新方式。

      接下来,详细分析了CDE发布的指导原则中数据治理的整个流程,明确了数据治理系统的设计目标:能够整合RWD的各种碎片化数据,通过通用数据模型将各数据源数据进行提取,脱敏,清洗,转化,并将建立数据稽查轨迹机制,数据质量核查机制,最终保证RWDRWE的成功转化。

      随后,展示了数据治理系统的“技术架构图”,共分为三层:

      一是数据层,采用通用数据结构,实现CRF表格多种样式的设计需求,同时兼顾DVP核查功能,更重要的是实现多中心,多系统之间的多元异构数据下的同一转化和整合。在数据传输方面,采用区块链技术实现多中心之间的数据加密传输,支持医院HIS系统对接,CSV结构化数据导出,临床数据照片上传三种数据源提取方式,降低单一数据源下关键数据缺失的风险,提供补充数据的多种途径。

      二是技术层,通过自然语言处理以及上下文语义识别,利用机器学习结合数据模型实现对自由文本病历、检查报告、护理记录等全量数据的结构化处理;采用图像处理技术实现对图片的脱敏和预处理,进一步保证OCR识别的结果准确可靠,通过自动分类,采用不同的方法和模型进行解析,提取并结构化照片文字信息。

      三是功能层,将临床数据治理规则抽象为数据提取,数据清洗,数据转化三种类型,并支持通用规则配置;搭建了数据质量评价体系,提供规则的效果统计核对及验证,并支持导出数据治理的结果及全生命周期的日志文件,进而提出了数据治理系统的AI技术融合势在必行。

      最后,鲁老师在直播现场演示了百奥知系统中AI技术处理的整个流程,详尽解答了现场观众对于图像自动脱敏,图像自动分类,图像校正,图像识别,自然语言解析等技术功能点的技术实现细节和解决的问题。本课程让我们大家能够切实体会到AI技术的实现能够促使整个数据治理流程准确、高效完成的效果。