1994 年,南加州大学计算机科学家 Leonard Adleman 在 Science 上发表了关于 DNA 计算的开创性研究,提出用 DNA 计算解决“旅行商”问题的方案。这项实验为 DNA 计算奠定了基础,并展示了其解决计算难题的潜力。
2001 年,以色列魏茨曼科学研究所的研究人员取得重大突破,构建了由 DNA 分子和酶分子组成的“生物计算机”,首次实现了 DNA 计算设备的自主运行。这项研究展示了 1 千亿 DNA 计算器件在溶液中平行运行,仅需 0.0000000001 瓦能量即可支持 1 亿次综合状态跳转,为开发更复杂的 DNA 计算系统开辟了道路。
2006 年,加州理工大学的研究人员取得重大突破,通过 DNA 序列编码构建了多种 DNA 逻辑门,实现了 DNA 数字逻辑电路。这项研究首次提出了 DNA 逻辑运算元件的模块化设计和构建方法,为系统地创建复杂而可靠的数字逻辑电路开辟了道路。
随着人类产生数据的爆炸式增长,DNA 分子的高信息密度特性逐渐得到关注,使用 DNA 作为数据存储介质的概念开始流行,为解决日益凸显的“数据存储危机”提供了可能性。
2023 年,上海交通大学的研究人员在 DNA 计算领域取得重要进展并在 Nature 发文。他们发展了一种支持通用性数字计算的 DNA 可编程门阵列(DNA-based programmable gate array, DPGA),可通过分子指令编程的方式实现通用数字 DNA 计算,实现了无衰减大规模液相分子电路的构建。
这项研究的通讯作者之一王飞是上海交通大学长聘教轨副教授,她长期致力于发展大规模、高性能 DNA 计算系统与大数据 DNA 存储系统,在设计策略、观测方法、反应模型等方面深入研究 DNA 计算体系的化学反应与信息处理机制,于近两年取得了里程碑式的突破。
凭借着首次在实验上展示了包含 30 个逻辑门元件、30 层 DNA 链取代反应的大规模计算电路的可靠运行,突破了近 20 年 DNA 分子计算在电路规模和电路深度的瓶颈。王飞成为 2023 年度《麻省理工科技评论》“35 岁以下科技创新 35 人” 中国入选者之一。
成为科学家是大多数学子儿时的梦想,王飞也不例外。从中学时期就以李政道和黄昆先生为榜样的她最终考取了中国科学技术大学物理学院,并在选修《现代生命科学导论》课程后,开始对生命系统产生浓厚的兴趣。
2013 年,王飞保研至中国科学院上海应用物理研究所,师从樊春海院士及王丽华研究员。樊春海团队很早就展开新兴的 DNA 纳米技术研究,彼时已在结构技术、分子成像、核酸传感等方面积累了很多成果。
在樊春海的鼓励和引导下,王飞开始了自己的研究之路。
博士期间,王飞的研究项目是“基于 DNA 的分子计算和超分辨成像”。这一阶段,她构筑了一系列基于 DNA 纳米技术的分子计算电路,并首次实现了对纳米电路分子信号传输轨迹的 10 纳米级光学超分辨成像。
2018 年,王飞申请上海交通大学博士后,期间将 DNA 计算反应网络与 CRISPR 基因编辑工具结合,致力于实现活细胞基因表达的可控编程。最终实现了 DNA 计算的活细胞编程,包括逻辑门控制的 CRISPR 基因成像以及细胞抑癌基因拯救等功能。
如今,王飞就职于上海交通大学,致力于 DNA 计算体系设计范式的创新,其设计了具有通用性编程能力的 DNA 可编程门阵列,突破了溶液相分子的无序碰撞对 DNA 分子电路规模的限制。
回顾一路的研究历程,王飞感慨道,“当初选择这些方向投入主要是出于对 DNA 计算的研究热情。博士期间通过设计原则与观测方法的研究,加深对 DNA 计算体系运行机制的理解;博后期间,将 DNA 计算的研究拓宽到活细胞编程,探索 DNA 计算体系的生物应用;建立课题组,回归到 DNA 计算系统的设计本质。我认为,这样的研究过程有助于使我在 DNA 计算领域的研究逐步深入,解决其中重要的科学问题,同时也为未来持续的创新能力奠定基础。”
DNA 计算是一种利用生物有机分子的信息处理能力来代替数字物理开关元器件的计算模式。
要想用 DNA 进行计算,就要建立 DNA 逻辑门作为基本的计算组件。逻辑门是一种通过逻辑运算将一组输入转换为可检测输出的组件。当具有特殊设计序列的 DNA 分子彼此混合时,它们可以结合在一起并以某种方式分离,从而可以充当逻辑门(执行与、或、非等逻辑运算)。
近年来,DNA 计算得到了快速发展,通过编程 DNA 分子间的相互作用进行可定义的信息处理,已经形成了一种高并行度、低能耗的新型计算模式。然而,受限于溶液中分子间的无序碰撞,DNA 分子计算功能复杂度与可扩展性提升逐渐遭遇瓶颈。目前,可以实现的 DNA 计算大多数是为实现特定算法或有限数量的计算任务而在硬件上定制的。
“一旦 DNA 溶液中分子种类增多,产生相互干扰,规模无法扩大,导致运算能力无法提高,因此也无法面向实际应用场景。”王飞进一步解释道。
可编程性和可扩展性是实现通用计算的两个关键因素。可编程性使设备能够执行各种算法,而可扩展性允许通过向系统添加资源来处理越来越多的工作。
王飞及团队开发了一种支持通用性数字计算的 DNA 可编程门阵列(DPGA),并支持器件层次的多 DPGA 集成,实现了器件内的可编程性和器件间可集成性。
当电路的复杂度超出单个 DPGA 可执行规模时,DPGA 可分解为多个子任务,并生成对应的分子指令;每一个子电路的分子指令通过逻辑地址调用并连接参与运算的 DNA 元件,实现 DPGA 的编程;子电路之间的信号传输则通过 DNA 折纸寄存器介导的多 DPGA 布线实现,从而实现器件级的多 DPGA 集成。
利用 DPGA 的可编程性与高集成度,该研究突破了 DNA 分子计算在电路规模和电路深度的瓶颈,首次在实验上展示了高达 30 个逻辑元件、500 条 DNA链,包含 30 层 DNA 链取代反应的电路规模。这也代表了近 20 年来 DNA 计算领域的新突破。
由于 DPGA 的可扩展性,理论上任何实际问题都可以在模数转换后接入 DPGA 电路。这项研究概念性展示了将 DPGA 作为分子诊断中的信息处理核心,对疾病相关的分子靶标进行非线性分类。
提及该研究的产业化前景,王飞表示,通用 DNA 分子计算集成电路的设计,有助于实现 DNA 计算器件的量产以及用户与设计者的分离,有望在分子医学领域取得更广泛的应用;此外,DNA 作为一种信息材料,可以将数字信息编码成 DNA 碱基序列而实现对人类生产数据的存储。
据悉,其未来的目标之一就是构建大数据 DNA 存储系统,利用分子组装取代从头的化学合成,显著降低 DNA 数据的写入成本,有可能将 DNA 存储推向实际应用。通过发展新一代的高密度、低能耗、长寿命的数字信息存储技术,解决全球生产的数据指数增长带来的数据存储难题。