生物谷专访金唯智中国区葛毅总经理:人工智能热潮下,基因组学研究的机遇和挑战
从新千年的钟声敲响的那一刻起,我们便开始感受到了互联网带来的巨大的变革。近几年来,大数据技术和人工智能取得了突破性进展,从出行方式、通讯渠道、消费习惯到饮食起居,我们生活的方方面面正被这一波波的新技术重塑改变着。另一方面,我们对于健康管理、疾病预防和治疗的传统认知,正被人类基因组计划打开的生命科学研究新认知不断颠覆。究竟是信息技术还是生物技术,是这个时代的主旋律呢?拥有计算机和生命科学双重教育背景的金唯智中国区总经理葛毅,喜欢把上帝看做一个伟大的程序员,利用AGCT的四进制代码来编写生命的奥秘。在他看来,BT和IT代表的两股技术方向,就像两片铜锣,相互撞击之下才能奏出21世纪华美的乐章。
生物谷:葛总您好,作为在两个领域都有丰富的实践经验的复合型人才,您是如何看待生命科学和信息科学的发展和关系的呢?
葛毅:生命是个复杂的现象,生命科学有一个很难处理的问题,就是很难量化,很难用精准的数学模型或算法去表达。后人类基因组时代,我们对生命的认识取得了很多突破性进展,也有些三十年前面临的问题依然存在较大挑战,可以算是“机遇与挑战并存”。
我是在1988年进清华学生物医学工程仪器专业,近三十年来一直围绕IT和生命科学工作。这两个交叉学科都是让人兴奋的学科,也出现了不少的突破。
1999年我曾就职于一家在美国新泽西的公司,PHYSIOME SCIENCES ,主要研究的就是通过超级计算机进行建模来模拟生物路径、药物动力学和药物对生物体的作用。当时,公司花了500万美元购买了最先进UNIX服务器—IBM的eServer p690(“Regatta”)。尽管当时没有“大数据”的概念,我们实际是做了今天所谓大数据的工作 – 通过收集大量实验数据及文献报道总结出数学模型,然后通过这个模型预测药物对生物体的作用。取得了一定的成绩,但也存在能否替代实验室试验,结果是否被生物学家所承认的问题。现在的计算机性能得到了大幅的提升,如何精准的预测生物体对药物的反应或生物路径,还是面临同样的问题。去年,我在美国参加了BI-IT World大会,看到的一些最新的模型和算法,性能上有很大的提升,但仍然没办法替代动物实验和临床测试。总的来说,我认为比较成熟模型也还是需要理论和实践相结合,利用数学模型的预测来指导一些方向和假设,通过实验来印证假设是否是正确的,就像我们金唯智现在用基因生物信息学方法来辅助客户进行抗体药物的研发一样。
说到这两个学科的关系,一直以来,IT都是为生命科学做服务的,不论是我们做的基因数据的分析,还是医学图像的模式识别。以金唯智为例,我们配备集聚先进的IT资源来为生命科学领域的研究人员服务,从智能化、信息化的订单管理系统到高性能计算和云存储的生物信息分析平台,这些IT领域的先进技术在帮助研究人员加速项目进展方面起了很大的助力。反过来,生命科学的发现和应用需求也极大地促进了IT技术的发展,比如人工神经网络和遗传算法,其实都是从大脑结构和生物遗传的自然现象悟出的人工智能算法。
生物谷:英特尔的创始人之一戈登·摩尔,曾经提出了著名的“摩尔定律”,用来形容计算机的飞速发展,如今形容测序行业,又有“超摩尔定律”这一说法,您觉得这背后有什么共同之处?
葛毅:我们所期待的,是摩尔定律所带来的效果。正是因为微处理器性能如同摩尔定律预测的那样飞速发展,使得个人计算机进入千家万户成为现实,催生了大量的应用,也给计算技术行业带来了腾飞的机会。对于测序行业的超摩尔定律,我们也是希望,能够产生更多的测序技术发展带来的应用场景。
就像PC机刚进入家庭时,人们也不太清楚应该如何使用,好像除了玩个游戏也不能做什么。现在,我们的日常工作和生活都已经离不开PC机了,从工作、学习、购物、娱乐到孩子教育的方方面面。实际上,现在的移动互联网的很多商业模式和服务也是一个基于智能手机的应用场景延伸。那么,基因测序在科研上还可以有什么新的应用?医学上还有没有类似无创产前基因检测NIPT(Noninvasive Prenatal Testing)这样的应用领域?除了鉴定祖先,还有没有其它更实用的情景呢?
在我看来,食品和健康领域将来可能会出现更多的应用。现在我们可以用基因测序鉴定大马哈鱼是否是正宗的,随着测序成本的降低,下一步是否可以用来做常规食品和水果检测呢?研究上,我们已经开始通过分析肠道菌群来评估肠道健康和疾病进程,未来是否可以用来指导我们个人的饮食习惯呢? 这可能需要我们大家集思广益,共同来创造和推动应用开发。作为全球基因组学服务商,金唯智的科研人员也在通过和全球合作伙伴的协作,努力寻找基因测序的更加广泛应用。
生物谷:测序成本的降低使得基因测序技术的广泛应用,随着而来的是如何处理分析海量生物大数据, 作为金唯智的全球CIO,您对这个问题如何看待?
葛毅:基因数据可以说天然具有大数据属性,每次的测序都会产生大量的基因序列信息。测序成本的降低,为研究人员从基因序列角度理解和研究生命现象提供了大量的便利。
当然,数据本身并不能产生知识, 只有有效地对数据进行处理、分析和挖掘, 才能发挥出数据的价值。在我看来,数据处理的关键问题是如何能够去伪存真,实现sample to answer – 样本的分析处理能否回答所研究的问题。
由于生命现象的复杂性,作为生物大数据的基因数据也很难清晰的解释所有的研究问题。现在有很多研究开始将临床表征和基因数据信息进行联合分析,以便从更完整的角度来得到对人类疾病和健康的准确了解。这是基因组学和大数据分析的发展带来时代机遇,也存在很大的挑战。最大障碍还是医疗数据分享问题 。如何形成一个完整的规划?样本数据的标准化?如何处理医院间的数据分享的安全和法律顾虑?
相比标准统一的基因数据,临床信息的记录和信息缺少一定的规范和标准,数字化程度比较低,语言表达的差异化,在使用起来会有一定的困难。现在阶段,我们需要做的一个很重要的工作可能是先要制定一个大家都能认可的规范,把这些不同的医疗信息汇聚起来。国内外已经有一些政府和行业协会开始着手解决这个问题,发起制订标准规范,建立可分享的生物样本库。金唯智依托南京扬子科技创新平台,也参与了国家的医疗大数据测序和挖掘工作,我们期待未来可以在这个领域和科学家们一道,更好的解释生命的奥秘和促进疾病的治疗。
生物谷:就您看来,目前处于爆发式发展阶段的人工智能技术对于未来生命科学的研究领域会带来哪些可以期待的变化?
葛毅:就像我们前面提到的生物大数据的分析方面,把基因数据和医疗信息进行结合,人工智能会有比较重要的应用和发展。人工智能领域应用的很多基础理论,早在80年代我在清华求学时就接触到了,当时叫做模式识别,能够辅助处理一些简单的问题。目前的人工智能的很多理论和我当年在清华求学时学到的可以说是大同小异,表面上看起来只是神经网络的层数多了些,好像没有什么大的变革。但现在庞大的数据资源和超强的计算机性能,加上算法的优化,为人工智能提供了前所未有的能力,比如战胜人类围棋手的AlphaGo。
在生命科学领域,因为生命现象本身的复杂性,很多研究能否取得突破性的进展和研究方向的选择有很大的关系。目前,在金唯智我们也已经着手做了一些实践,类似基因合成领域的密码子优化,抗体药物研发中的靶点筛选,基因编辑领域的gRNA设计等都可以通过人工智能的算法来辅助指导,帮研究人员寻找最优的答案,提高他们的研究效率。
对于未来,随着基因技术和人工智能算法的不断优化,定制化的生命设计在技术上应该是可以实现。相比目前的很多早教培训,通过优化基因建立各方面的技能优势对很多家长来说更具有诱惑力,这种以往在科幻小说里出现的情形,很有可能改变未来的人类,但也有很多伦理问题。
生物谷:作为全球基因组学服务供应商,金唯智在行业内率先推出了电商化的在线订单系统和移动端,已然在数字化和信息化平台建设方面走在行业前列。未来,金唯智又会给基因组服务领域带来什么新的改变呢?
葛毅:每一家公司的存在都应该能够解决一些社会发展的需求和问题。对于金唯智的来说,高效率、高质量的服务来降低研究人员的成本是我们的使命。诸如引进最先进的高通量测序平台HiSeq X Ten、NovaSeq、及PacBio Sequel,推出智能化的在线订单系统,以及最近发布的移动端订单管理,都是我们围绕效率和质量所做的努力。通过引入德国工业4.0的理念,将我们的实验流程进行智能化改造,显著地提高了订单处理的效率和质量,以及客户在订购服务到接受结果的诸多便利。
尽管技术手段和研究热点不断在变化,但我想,研究人员对时间和质量的需求依然不会变。金唯智目前在全球多个国家运营着15个基因组实验室,为包括30位诺贝尔获奖者在内的数万名全球研究人员提供研究服务。未来,除了继续巩固和增强我们在基因组学领域的服务能力,依托聚集的庞大的客户群体,我们将组建一站式的生命科学服务平台。希望通过一些优质厂商的合作,扩展基因组学服务以外的蛋白质组学、代谢组学等方面的业务,共同为生命科学领域的研究人员提供全面的服务。
我们将继续在人工智能和大数据分析方面开拓创新,通过我们的CLIMS4云平台更高效地为科研工作者提供更准确的基因分析和更优质的基因合成服务。
新年寄语
正如当年被这个描述所吸引进入生物行业,现在我也更加相信,21世纪是生命科学的世纪。在过去的18年里,金唯智有幸参与见证了诸多生命科学领域的重大突破和进展。从Sanger测序到二代、三代测序服务,帮助全球科学家解读生命的奥秘。从H7N9病毒、埃博拉病毒到寨卡病毒,我们和健康领域研究人员及医生—道为破解病毒传播机制争取先机。从世界首例人类线粒体基因组,绿藻叶绿体基因组到酿酒酵母基因组的人工合成,我们在书写生命的道路上携手前进。
2018年,金唯智愿与生命科学研究的同行们一道,用我们不断提升的高效和优质服务,助力大家向着下一个突破和发现迈进!