2017年5月 ,19岁的拥有世界 围棋第我我一我一个人柯洁九段在和AlphaGo的围棋终极人机大战以0:3完败 ,由此是人类意识顶尖高手与这台机器关系 的之后呢五次较量 ,同年10月 《Nature》杂志发表了低于它所有人之后呢版本的AlphaGo Zero。是一显著成绩向拥有世界 展示了近一步建立系统功能来自美国学不不成功复杂完成任务的本来性 ,而其背后所代表意义 为什么不运算具备 ,是计算机科学的分支三大领域 --高性能计算(High Performance Computing) ,为什么不际应用与此此外 又又成发展国家实力超强超强的体现 ,更给大大多数人的日常这样带来冲击来冲击了能变动 ,当前该传统技术 已在航空航天、核试验模拟、天气预报、人类生命科学、高新制造(汽车、微电子)等三大领域 显著显著成绩了广泛应用。
以人类生命科学三大领域 举例 ,一直在经济人类生命遗传密码(基因组)的一直在经济破解 ,人的生老病死是一复杂一一件事 也可用数字化的进行 具体说明呈现 ,以期不不成功疾病的精准深入分析 、诊断和治疗方案 ,让大大多数人远离传感染疾病、防控出生缺陷、肿瘤和心脑血管疾病 ,大大质的提升 人均预期寿命 ,并大幅度大大质的提升 面对社会卫生总负担。
近二十年来 ,我我一我一个人的全基因组测序的成本以“超摩尔定律”的非常快下降 ,而高性能计算在测序数据全面深入分析 前进方向的应用也其发生了翻天覆地的能变动。当前拥有世界 主流的基因组测序数据全面深入分析 工具是Broad Institute开发的免费开源工具集GATK(Genome Analysis Toolkit) ,该项人类生命科学三大领域 公认的最佳工作时流程不不成功这个我我一我一个人的的全基因组(Whole Genome Sequencing ,WGS)30X数据全面深入分析 也可1800分钟。深耕于基因组学20多年的华大基因在基因组高性能计算三大领域 首获突破性进展 ,于近日不成功不不成功6分钟不不成功30X WGS全流程的深入分析 完成任务 ,相较于GATK新标准 计算时长提速300倍。
依据NIH公布的最新资料 ,一直在经济测序传统技术 的整体发展 ,测序成本以超摩尔定律下
https://www.genome.gov/about-genomics/fact-sheets/DNA-Sequencing-Costs-Data
6分钟不不成功30X WGS完成任务是由华大基因自主研发的LUSH工具集不不成功的 ,打破了该免费软件在2020年1月创造的15分钟极限非常快。中有的黑科技便是选用了全的新底层架构细节选用 ,提供更快了技术基础中央密切相关处理器和图形密切相关处理器相相互结合选用基因数据全面深入分析 的高性能非常快方案 ,在大大质的提升 集群计算资源消耗、大大质的提升 检出非常快的与此此外 ,不不成功了全程自动化、其它信息化 ,有记录可回溯 ,也可更快地用于精准医学的应用场景。
LUSH工具集非常快的的新底层架构逻辑
LUSH工具集提供更快是某种“CPU+GPU”的高并行软硬件重要解决目前方案 ,技术基础经典流程中有免费软件模块BWA、SAMTOOLS和GATK ,进行 GPU的通用运算传统技术 ,选用计算引擎和非常快引擎的的新架构细节选用 ,不不成功算法优化和并行化密切相关处理 ,并相互结合华大自主研发的超高通量测序仪 ,不不成功碱基数据全面流的超高速深入分析 ,之后呢首获准确的深入分析 之后呢。
LUSH工具集非常快流程示意图
便是为什么不人类生命数字化进程也可严谨的科学思想 ,而其应用场景一是体这是精准医疗、健康管理等与人类意识健康的的息息密切相关的三大领域 ,本来不尽不尽相同于此外 高性能计算三大领域 ,基因组数据全面深入分析 对精度有极高的规定要求。而为什么不高性能和准确性为什么不可这个兼得 ,数据全面空间范围、分布和浮点精度、峰值性能和内存都要带来冲击影响算法的选择中 ,为什么涉及到最重要的最优解和近似解的算法本来大相径庭。LUSH工具集便是选用在经典流程算法的技术基础上进行 了其的新细节选用的底层架构近一步大大减少了上面 之后呢的读写 ,并进行 CPU不不成功基因深入分析 完成任务的智能分发 ,进行 GPU数千计算核心不不成功百万完成任务的极速并行密切相关处理 ,与此此外 重要解决目前了经典流程计算密度较高、频繁地存储器访问等重要解决目前 ,进行 测试其新标准 品的准确性之后呢与经典流程一致 ,低于99.86% ,之后呢其也可在计算之后呢的准确性与极速性上得以平衡。
更优越的性能、更低的成本和更高效的检出是所有人高性能计算应用三大领域 的研发追求近期目标。对非常快组件的继续研发来自美国对非常快无止境的追求 ,正如新手机芯片其他行业的整体发展是一直在经济移动端主要需求的旺盛 ,传统技术 才得以一直在经济地迭代和进步。从基因组学技术基础研究中到临床研究中及应用 ,不不成功测序工具的自主可控的与此此外 也也可不不成功数学形式上用自主研发 ,而不为什么不追求芯片的底层下潜开发。对后者是无止境的追求 ,而最重要的前者的这个可控不可不不成功从跟随模仿到最重要的超越的本来 ,从核心算法的研发上助力国的精准医疗自主可控的整体发展进程。