当前位置:科学 > 正文

科学家提出DNA信息存储阴阳双编码新方法

2022-05-07 10:46:33  来源:中国科学报

DNA存储作为生物技术与信息技术相融合的主要方向之一,近年来受到广泛关注。DNA存储的编解码,即比特与碱基之间的转换,是DNA存储中最重要的环节之一,不仅决定信息转换的效率(信息密度),还直接影响存储信息的稳定性及可靠恢复性。从2012年起,编解码技术的发展主要聚焦于提升信息密度,而技术兼容性和原始信息的稳定恢复方面的考虑尚不全面。2017年以前,编解码技术都未能实现完全的技术兼容,产生序列的GC含量很大程度上还是依赖于原始数据的0/1分布情况。2017年,美国哥伦比亚大学研究团队开发的DNA喷泉码几乎解决了这一问题,但直接套用的信道编码技术有较强的数据类型偏好性,因此在实际的存储应用中存在较高的数据无法恢复风险的问题。

沈玥在实验室 研究团队供图

该论文的通讯作者沈玥告诉《中国科学报》,为解决这一问题,他们将从DNA双链模型中受到的启发,与中华文化中“阴阳”对立统一的思想相结合,巧妙地应用于DNA编解码系统,以两套不同的规则,分别对两条二进制信息进行“一对一”编译转换,再取两者统一交集的部分为最终解,实现将两条独立的信息组合统一为一串DNA序列;另一方面,通过引入筛选机制,他们将与现有合成测序技术兼容性不佳的序列通过预先设置的筛选条件进行过滤。根据不同的组合方法,该系统共能提供1536种不同的编码规则组合,大大扩展了其应用场景范围。

研究人员还通过编码学的理论推导以及不同数据类型文件的模拟编码,证明了该系统在保证信息密度的前提下,在数据恢复稳定性方面体现显著的性能提升(存储数据的平均恢复率较DNA喷泉码现有水平提升近两个数量级)。

平质在实验室 研究团队供图

该论文的共同第一作者、深圳华大生命科学研究院助理研究员平质告诉记者,近年来用细胞进行DNA信息存储也受到了极大关注,为此,他们还测试了该系统在酵母细胞内存储、传代后的数据恢复稳定性。结果证明,作为载体的酵母菌株经过1000代以上的传代,信息仍可以被完整恢复,该存储方式接近天然DNA分子存储物理信息密度的理论极限,每克DNA能存储的信息量约为 432.2EB。

该研究开发了一种全新的DNA存储编码方法,并提出1536种不同编码规则组合的方案,为DNA存储的多类型应用提供了重要工具,有望在海量数据长期存储的新型介质研究中起到积极的推动作用。

相关论文信息:

https://doi.org/10.1038/s43588-022-00231-2

https://doi.org/10.1038/s43588-022-00235-y

关键词: 科学探索 科学家提出DNA信息存储阴阳双编码新方法 cnBeta

推荐阅读

运动型轿车是什么 运动型轿车与普通车有何区别?

运动型轿车凭借着外观酷炫,动力性能强的特点,深受国内众多消费者的喜爱。特别是在年轻消费者心目中,运动型轿车基本上是购车的首选。但是 【详细】

汽油清洗剂是什么 汽油清洗剂加在汽油里是干嘛的?

最近有很多车主反映加油的时候总是建议用汽油清洁剂。但是,大部分人还是不太了解,还有就是一部分人纳闷汽油清洗剂加在汽油里是干嘛的?汽 【详细】

中国最便宜的汽车是哪个 最便宜的汽车汇总

现在汽车已经成为了大家最常见的交通代步工具了。但是,依然还是有很多的家庭非常的需要代步工具,却买不起特别贵的汽车。所以今天,我们就 【详细】

伊莱克斯冰箱质量怎么样 伊莱克斯冰箱质量好不好?

伊莱克斯冰箱质量怎么样:在2018年全球500强企业中,伊莱克斯排名第162位,在2020年全球2000强企业中,伊莱克斯排名第1965位,可见伊莱克斯 【详细】

劳动保护用品是什么 劳动保护用品有哪些?

劳动保护用品有哪些?劳动防护用品分为特殊劳动防护用品和一般劳动防护用品,一般劳动防护用品是指未列入目录的一般劳动防护用品。以下产品 【详细】

相关新闻

关于我们  |  联系方式  |  免责条款  |  招聘信息  |  广告服务  |  帮助中心

联系我们:85 572 98@qq.com备案号:粤ICP备18023326号-40

科技资讯网 版权所有