欢迎访问
又是神经网络又是DNA,存储技术正在把主意打到“人”身上
2024-05-27 来源:贤集网
629

关键词: 存储器 芯片 人工智能

近日,沙特阿卜杜拉国王科技大学何钊博士和所在团队,打造了一种基于量子芯片的神经储存器,支持每平方厘米万亿个节点。相比此前的同类系统,本次系统的网络规模高出 2-7 个数量级。对于每个网络节点来说,它都由薄膜上的量子核化诱导的纳米电路组成。而这种薄膜则由相变材料构成,这让单个读出通道只需消耗 0.07 纳瓦特的电功率。

相比此前最佳的人造储存器,在电功率上降低了 6 个数量级,并且比人脑生物神经元的效率高出 1 个数量级。

由于本次芯片含有大量的神经网络节点,并拥有出色的功率效率。课题组结合其量子特性,开辟了一种新形式的硬件安全原语。



安全原语,是一个物理系统或设备,它能够基于单向物理现象生成独特、且不可复制的数字指纹。安全原语的强大功能,吸引了学界研究身份验证系统的兴趣。当前的身份验证方法比如密码和生物识别,已被证明可被黑客攻击,不再足以保护用户。

而本次研究证明:通过神经芯片可以打造一种新技术,由于受到量子力学法则的保护,因此不会被硬件克隆所影响。

对于当前和未公开的任何类型的人工智能攻击,上述新技术都具有免疫性。

实验结果显示:其具有 99.6% 的可靠性、100% 的用户认证准确度、以及较为理想的 50% 的密钥唯一性。

其所拥有的量子特性,也比目前最好的技术高 3 倍以上,同时能在仅有 1 平方厘米的面积内存储 21104 多个密钥。

在应用前景上:

其一,可以实现安全应用。

本次芯片能帮助确保智能能源网络等关键基础设施拒绝未经授权的访问,助力实现技术深度渗透的智慧城市。

未来,假如在成熟度更高的技术阶段,基于本次芯片的原型能够完成验证,那么预计这项技术可以显著遏制攻击私人公司和政府机构的网络犯罪行为。

其二,可用于自然语言处理任务。

比如,它能进行语言建模、情感分析、文本分类、机器翻译和语音识别等。

基于储存器的循环性质,使其非常适合用于处理文本等顺序数据。与此同时,它还具备捕获复杂模式的能力,这让其能针对语言的细微差别进行建模。

基于芯片上神经储存器的大规模神经网络节点和高功率效率,则使其能在资源受限环境之中,开展实时的语言处理应用。


DNA存储技术能保持迄今为止的所有数据

日本东京大学在《自然》杂志上发表了一项DNA存储技术的新进展。

说起DNA存储技术,可能很多人还都比较陌生。它是仿照地球上生物存储基因数据的方式,用DNA螺旋上一对对的碱基序列来存储信息。这种技术的主要优势是,存储的信息密度非常大,地球上迄今为止的所有数据,如果都使用这种方式来保存,只需要一公斤左右的DNA物质。

不过,目前DNA存储技术还处在早期探索阶段,还有一系列需要解决的问题。比如,我们现在的确可以通过一些生物化学方法,把数据用碱基序列存储下来,但是,如何准确、快速地从一团乱麻的DNA物质中定位、读取这些数据,到现在连技术路线都不明确,更别说具体的操作了。

这次东京大学的科学家们发表的研究,就是对解决这个问题的一次新尝试。研究人员提出了一种新技术,叫做“基于生物酶的人工神经网络”。别看名字里面有“神经网络”四个字,这种技术并不是真的把DNA数据输入到电脑的神经网络里面进行计算,而是仿照神经网络的多层结构,用化学的方法来定位、标记出特定物质。

所谓神经网络算法,其实就是一层一层的加减乘除和函数运算。要用化学方法来模拟神经网络算法的计算过程,研究人员需要三样东西,分别是:数据载体、算法载体、运算平台。



数据载体,就是试管里面的DNA物质。

算法载体,就是生物酶。研究人员利用三种生物酶,它们各自的作用是:产生、剪切、降解DNA物质。这三种酶可以理解成类似加减乘除这些算法的对应载体,用它们来一层一层地筛选DNA物质。


运算平台,是一种生物芯片。将DNA物质涂敷在芯片上,进而利用生物酶来跟DNA物质产生反应,通过显微镜来观察反应的结果。这就好比是一台模拟计算机,在运算这个生物酶的神经网络算法。


通过这种方式,研究人员成功地从大量DNA样品中定位了一些物质片段。研究人员表示,下一步,他们将尝试用这种方法,计算存储了真实数据的DNA,比如图片数据、声音数据等等。

当然,这种基于DNA存储路线的数据提取方法还处在非常早期的阶段,还有很多难题没有攻克。甚至,DNA物质是否真正适合除了生物之外的数据存储场景,也有待讨论。


中科院超大光盘有望走向商业化数据存储市场

中国科学院上海光学精密机械研究所(以下简称“上海光机所”)与上海理工大学等科研单位合作,在超大容量超分辨三维光存储研究中取得突破性进展,在国际上首次实现Pb量级的超大容量光存储。相关研究成果于2024年2月22日发表于《自然》(Nature)杂志。

研究成果的通讯作者之一上海光机所研究员阮昊接受记者采访表示,如果后续产业界投入充足的话,这项技术预计五到十年左右能走向产业化,成为大数据长期存储的首选。特别是随着人工智能时代的来临,需要大量数据存下来用于训练,数据存储将是一个爆炸性增长的市场。

研究团队利用国际首创的双光束调控聚集诱导发光超分辨光存储技术,实验上首次在信息写入和读出均突破了衍射极限的限制,实现了点尺寸为54nm、道间距为70nm的超分辨数据存储,并完成了100层的多层记录,单盘等效容量达Pb量级,对于我国在信息存储领域突破关键核心技术、实现数字经济的可持续发展具有重大意义。

相关研究成果于2024年2月22日发表于《自然》(Nature)杂志。论文第一作者单位为上海光机所,通讯作者为上海光机所阮昊研究员,上海理工大学光子芯片研究院院长、中国工程院外籍院士顾敏和上海理工大学教授文静。上海光机所博士后赵苗和上海理工大学教授文静为并列第一作者。

光存储技术具有绿色节能、安全可靠、寿命长达50到100年的独特优势,非常适合长期低成本存储海量数据,然而受到衍射极限的限制,传统商用光盘的最大容量仅在百GB量级。在信息量日益增长的大数据时代,突破衍射极限、缩小信息点尺寸、提高单盘存储容量长久以来一直都是光存储领域的不懈追求。

据中国信息通信研究院发布的《全球数字经济白皮书(2023年)》,主要国家数字经济发展持续提速。

阮昊接受上证报记者采访时说:“数据存储是数字经济的基石之一。80%的数据都需长期、绿色、安全保存,我们的技术可能是大数据长期存储的首选,具有广阔的应用前景。特别是随着人工智能时代的来临,需要很多数据存下来用于训练,数据存储将是一个爆炸性增长的市场。假如产业投入充足的话,乐观估计,该技术有可能5年走向产业化。”



存储市场的现状和未来走向

IDC在2018年的一项研究中预测,到2025年,全球共将需要存储175 ZB的数据,年平均增长率为27%。但我们似乎正在加速达到甚至超过这一数量。根据Statista的估算,届时的数据总量,将超过180 ZB,再加上COVID-19疫情流行的全面影响,这一数字有可能会更高。

有这样几股力量,推动了数据量惊人的增长速度,包括众多的大数据计划、人工智能和机器学习程序、远程办公人数的增加、5G网络和物联网的日益普及。

在这一数据增长的过程中,即使面临有疫情和供应链的问题,存储制造商们通常还是可以跟上节奏的。尽管HDD继续领先于SSD,但两者之间的差距正在逐渐缩小。磁带驱动器和磁带步入了“文艺复兴”期。存储类内存正在缓慢且持续地被引入数据中心之中。每年,制造商们的出货量都会比前一年更多,而且这种情况很可能会一直持续下去。

然而,制造商们是否能够满足未来的数据存储需求,还有待商榷。虽然有一些很有前途的技术正在研发中,但距其可以实现商业化,还需要很多年。但尽管如此,许多业内人士仍然认为,考虑到制造商们过去能够满足存储需求的方式,他们将持续生产足够的存储空间以满足未来的需求:通过改进现有的技术,或是引入新技术。

不可否认的是,挑战始终存在。供应链依旧很容易受到成本上升、全球运输问题以及材料和劳动力短缺的影响。许多意外事件都可以很容易地破坏该链路中的任何的交付点。此外,制造存储设备及其支持系统的自然资源有可能会耗尽或变得非常昂贵,从而进一步地扰乱市场。

此外,有可能出现全新的数据使用场景,并导致更多数据的产生,颠覆增长预测曲线的基础,使得整个的世界存储空间变得不足。还有一些存储设备可能会达到其物理扩展的极限,这就意味着改进的空间已经不存在了,只能寄希望于新技术来处理未来的工作负载。



Baidu
map