昨日,大数据助力精准医疗产业沙龙在张江·中国药谷生物医药创新交流中心成功举办。会议围绕“大数据助力精准医疗”这一主题开展,吸引了80多位大数据相关领域的专家、企业家和从业者参与,有孚网络作为此次会议的协办方,有孚网络CTO臧云峰携有孚专有存储云,与在座专家共同探讨大数据如何助力精准医疗,现场座无虚席,干货满满。
本次活动邀请了大数据、生物信息、临床试验、新药研发、企业信息化等方面的研究者、技术专家和应用专家,针对精准医疗大数据目前的发展现状、存在的问题,以及未来大数据如何推动精准医疗产业的发展进行了深入探讨,推进大数据为基础研究、临床应用和新药研发赋能,推动精准医疗产业发展。
自2015年宣布精准医疗计划,发布“精准医疗”白皮书以来,精准医疗迅速成为医学界关注的焦点。精准医疗是生物技术和信息技术在医学临床实践的交汇融合应用,是医学科技发展的前沿方向。加强精准医疗研究布局,对于加快重大疾病防控技术突破、占据未来医学及相关产业发展主导权、打造我国生命健康产业发展的新驱动力至关重要。
作为网络通信和云计算领域资深专家,有孚网络CTO臧云峰主持和参与了多个大型国家A级标准数据中心建设与运营,也是国内最早的专有云概念提出者。他此次分享的主题是“专有云助力精准医疗”。在会议中,他提出:我们正在从云1.0时代向云2.0时代迈进,随着5G的推进,云边协同与融合逐渐成为核心,并给数据带来了更好的储存方式。而精准医疗是数据驱动的科学,人工智能和大数据和精准医疗的结合还处于爬坡阶段,在此背景下,数据存储面临多方面挑战。精准医疗专有云的设计可以确保数据有效管理与执行。
臧云峰在会议现场提到:随着二代基因测序技术的发展,基因测序的成本超摩尔下降。未来,基因测序技术将可能在如下三个应用场景发力:精准的健康管理、癌症早期筛查和基因编辑。精准医疗,就是以个体化医疗为基础、随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。
他说:每个人都有自己的基因,如果我们对这些潜在的基因数据进行分析,就能够精准地诊断出病源。仅一个人的分析过程即可产生GB级数据,而精准医疗的充分实施将涉及对成千上万人群数据的整合分析。同时,基于基因组学和影像学的分析正成为标准诊断过程,综上原因,带来的影像数据+临床数据+基因组数据都构成了精准医疗海量数据。这些数据中80%以上为非机构化数据,这就带来了数据在管理和运用上的困难和挑战:
数据海量增加
一张X光片的数据量就达几十兆,一个CT可达100MB,一个标准病理图接近5GB,以国内医院数量约3万家来计,每年增长的数据总量将达到60PB-1EB之多,所以每一二年医院存储系统都要扩容。
数据管理周期
对于访问频次低的影像数据,需要合理规划影像数据的生命周期管理以降低存储资源的投入。
数据安全性
各影像数据都需要长期保存至少30年,且数据需要具有冗余保护机制和数据备份机制来对抗病毒等攻击。
数据读取速率
存储系统需要具有良好的读写性能要求,满足1MB左右PACS小文件读写性能。
有孚网络以客户对精准医疗大数据管理与运营的迫切需求为初心,利用有孚云平台多年来在各大行业成熟的对象存储运营经验,提出了专属于精准医疗大数据的数据分级存储解决方案:根据医疗数据访问频率划分为热数据、温数据及冷数据,将影像热数据和温数据存储在有孚云存储中,通过SSD和HDD提供更高性能的访问速度影像;冷数据迁移到有孚蓝光云,解决医院对影像数据长期保存、数据备份的需求。数据分层转储可通过设置分层策略自动转储,或手动加自动混合策略实现。
有孚专有存储云,通过分布式计算平台和存储系统,实现专门针对结构化与非结构化数据间的关联与高效数据查询的数据结构设计和数据组织算法设计。同时支持基于分布式系统的可扩展与高并发能力,构建信息系统和数据挖掘的基础平台。针对各类非结构化数据的不同特点,和由此引发的数据查询的时间复杂度,以机器学习的方式实现高效索引。系统架构设计支持与主流机器学习引擎的无缝对接,包括数据结构和数据分布方式的兼容,为使用者定制医疗大数据应用提供良好的可扩展性。
此外,有孚专有存储云平台根据精准医疗大数据实际运用过程中的痛点,规划出专有云体系架构,将基因测序的服务商、合作伙伴、实验室、科研机构、联盟医院,通过专线电路互联起来。利用这些高带宽、高安保级别的专线,可以直接连通到有孚专有云的使用区,专有云区利用专有的计算器和存储器,通过统一的云管平台和业务管理平台,管理及调度有效的资源。此外云平台的纳管功能延伸到用户侧,提升基因测序的效率。
本次沙龙在热烈的讨论中落下帷幕,现场提问踊跃,专家倾囊相授,参会者意犹未尽。为精准医疗的发展做出了一次有益的探讨,有孚网络今后也将持续助力精准医疗行业向前迈步。