本站内容为虚构演示,与真实新闻及机构无关;请勿当作事实或专业意见。

全文

FULL TEXT

查看本期期刊

DNA存储搜索引擎GeneFind上线:在万亿碱基对中毫秒级检索目标数据

微软研究院与Illumina联合开发的GeneFind搜索引擎解决了DNA数据存储的最大瓶颈——检索速度,首次实现毫秒级的DNA数据随机访问。

微软研究院在9月5日发布了与基因测序公司Illumina联合开发的DNA存储搜索引擎GeneFind。这个系统解决了DNA数据存储技术面临的最大实际瓶颈:如何在数万亿碱基对中快速找到并读取目标数据片段。

DNA数据存储的密度极高(1克DNA可存储215PB数据),但其检索速度一直是商业化的主要障碍。传统方法需要对整个DNA池进行全量测序才能找到目标数据,耗时从数小时到数天不等。

GeneFind引入了一种名为「分子索引」的技术方案。在数据写入DNA时,系统会为每个数据块附加一段独特的索引序列。检索时,GeneFind使用CRISPR-Cas系统作为「分子搜索引擎」——它携带与目标索引序列互补的引导RNA,在DNA池中精准定位并切割目标片段,随后通过纳米孔测序仪快速读取。

在基准测试中,GeneFind在包含10万亿碱基对的DNA存储池中实现了平均3.2毫秒的检索延迟,比传统全量测序方法快了约1000万倍。Illumina首席技术官表示:「GeneFind让DNA存储从冷归档技术变成了热存储技术。」