近年来,大规模人群基因组学研究项目方兴未艾,相关陆续发布,标志着生命科学产业和精准医学,正式进入了基因大数据时代。但庞大的基因数据也带来了前所未有的挑战,带动互联网企业陆续入场布局。大科学、大数据、大合作的时代正在加速到来,未来,基因大数据将给人类带来哪些巨大影响?4天后,第三届基因组云计算技术开发者大会(GCTA2018)将在深圳国家基因库一一解答。风云际会、大咖论道!一个大科学、大数据、大合作的时代正在加速到来。
日前,最新一期《Nature》发表两项重磅研究,集中介绍了英国生物样本库(UK Biobank)的遗传数据。该数据集涵盖了约50万个体的全基因组遗传数据、临床测量以及健康记录,向我们了生物大数据对于精准医学的极高价值。
10月4日,《Cell》发布了迄今为止最大规模的中国人基因组学大数据研究,这是由华大的科研团队主导,历时两年,对14余万中国人无创产前基因检测数据进行深入研究的科研。这也是由华大主导的“百万人群基因大数据研究”项目的首秀。
放眼全球,近年来,大规模人群基因组学研究项目方兴未艾。相关陆续发布,标志着生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代;其次,也验证了基于大人群的精准医学研究已成为新的科研模式,对基因组学大数据研究具有开创性价值。
生命科学及精准医学进入大数据驱动的性变革时代,最早可追溯到20世纪末,国际人类基因组计划启动,包括中国科学家在内的研究人员,耗时13年,斥资30亿美元,破解人类第一个“生命”。
过去20年,个人基因组测序的费用以“超摩尔定律”的速度在迅速下降。国产测序仪的加入,更加速了其进程。华大基因在2016年宣布个人基因组重测序已经进入百元美金时代。未来,标准的数字化成本越来越低将成为不可逆的趋势,这也使得生命大数据呈现爆炸式增长。业界甚至认为,在不久的将来,数据存储成本将超过测序成本。
爆炸式的数据产出对海量信息的传输、存储、计算及分析提出了新的挑战。如何及时获取、快速分析、安全储存这些庞大的数据是研究者们急需解决的问题。围绕大数据所产生的存、读、懂、写、存、用也成为业内人士争相追捧的焦点,并为BT+IT行业带来了新市场、新挑战、新需求。
国内测序龙头企业华大基因,早在2015年就和阿里云、英特尔进行合作共同推出大规模生物信息分析平台BGI Online,为用户免费提供最新版的基因组分析工具箱GATK4的使用授权。
近年来,亚马逊、微软、腾讯、华为等互联网公司也都纷纷入场,布局基因大数据。而业界也涌现了不少专注于生物信息分析的企业,聚道科技、人和未来、达仁基因等都是其中的佼佼者。此外,基于大数据研究,诸如微基因等新兴互联网企业,借助直接面向消费者(DTC)的基因检测,进一步拉近了高端科研与大众的距离。测试你前世怎么死的