(图片来源网络,侵删)
死亡是所有事物的终点,无论是人类、机器、还是文明。唯一令人感到些许慰藉的是,我们活着的时候学到的和发现的有意义的东西,都会通过信息和知识的形式长久地传递下去。但即使是知识也有寿命。文档会氧化破败,艺术会丢失不见,图书馆和收藏品都可能面临快速且意外的破坏。如今,我们正处于一个科技高速发展的阶段,因此我们可能会设计出一些方法,让知识永远可用和可访问。毕竟,数据存储的密度已经高得令人难以理解了。在不断增长的互联网博物馆里,人们可以找到詹姆斯·韦伯太空望远镜拍摄的图片,毕达哥拉斯音乐哲学的解释,以及蓝调吉他独奏的 YouTube 教程。你想要的全都有。但事实上,我们认为是永久的东西其实并不是永久的:一些数字存储系统可能会在三到五年内变得不可读。图书管理员和档案管理员竞相把以物理形式存在的东西复制成新的数字格式,但熵总是存在的。华盛顿大学信息学院副教授约瑟夫·简斯(Joseph Janes)说:“我们这一行经常试图通过各种技术尽可能延长(信息的)正常寿命,但大势不可逆。”更复杂的是,档案管理员现在正努力应对前所未有的信息泛滥。在过去,他们只需要解决材料稀缺和储存空间有限的问题。“现在我们有了截然相反的问题,”简斯说,“所有发生的一切都在被记录下来。”原则上,这可以帮助修正一个历史错误:几个世纪以来,无数人因为没有合适的文化、性别或社会经济阶层,导致他们的知识或工作没能够被发现、重视或保存。但数字世界的巨大规模,带来了一个独特的挑战。根据市场研究公司 IDC 去年的估计,公司、政府和个人在未来几年创造的数据量,将是自计算时代开始以来产生的所有数字数据总量的两倍。一些大学正在倾尽全力寻找更好的方法来保存他们手中的数据。例如,巴塞尔大学人文数据和服务中心一直在开发一个名为 Knora 的软件平台,不仅能存档人文工作的多种数据,还确保人们未来能够阅读和使用它们。(来源:JINHWA JANG)弗吉尼亚理工大学图书馆的助理院长和数据服务主任安德里亚·奥吉尔(Andrea Ogier)说:“你会做出最有根据的猜测并抱着最好的希望,但有些数据还是丢失了,因为没有人知道他们会有用。”对于保存信息这件事而言,我们从来都没有足够的人力和金钱来完成所有必要的工作,况且信息存在的方式一直在不断变化和增加。简斯解释说,“我们如何最好地分配资源来保护信息?因为预算只有这么多。在某些情况下,这意味着一些东西会被保存下来,但只是放在那里,未编目也未处理,因此几乎不可能被找到或访问。”在某些情况下,档案管理员最终会拒绝收集新的信息。用于存储数据的格式本身也是非永久性的。美国宇航局拥有大约 170 盘在阿波罗时代收集的月球尘埃数据带。当研究人员在 2000 年代中期打算使用这些磁带时,他们却无法读取数据,因为找不到诞生于 20 世纪 60 年代的 IBM 729 Mark 5 机器。在不断努力下,该团队最终在澳大利亚计算机博物馆的仓库里找到了一台状况不佳的机器。最终由几名志愿者帮助翻新了这台机器。软件也有寿命。奥吉尔回忆说,他曾试图查看一个旧的 Quattro Pro 电子表格文件,却发现没有软件可以读取它。人们已经尝试过一些“面向未来”的项目。一个是 2015 年开放的“虚拟执行镜像”档案库 Olive,该项目通过虚拟机运行许多旧软件和项目,包括 Chaste 3.1,一个 2013 年的生物和生理学研究项目,以及 1990 年 Mac 版的电脑游戏俄勒冈之旅。卡内基梅隆大学计算机科学教授马哈德夫·萨蒂亚那拉亚南(Mahadev Satyanarayanan)说,该项目仍在活跃中。但他说,扩大 Olive 的产品一直存在挑战:即使是未使用的软件也必须从拥有它的公司获得许可,而且通常没有简单的方法将新数据输入到档案库的研究应用程序中。其他帮助延长知识寿命的努力也取得了不同的结果。互联网档案馆(The Internet Archive)是“时光倒流机器(Wayback Machine)”的所在地,它拥有大量的数字化材料,包括软件、音乐和视频。但是,截至 2022 年夏天,它正在与多家出版商提起的版权侵权诉讼进行斗争。从更有希望的方面来看,文本编码倡议(Text Encoding Initiative)自 20 世纪 90 年代以来一直维持着机器可读文本编码的国际标准。十年前,美国科学技术政策办公室规定,申请联邦支持的研究必须提供数据管理计划,以保证数据将来可以被研究人员或公众使用。奥吉尔说:“我们已经走出了一步,几乎每个受资助的研究项目都必须把数据放在某个地方。但是,对于谁必须存储数据或必须保存多长时间,并没有强制要求。”不可避免地,许多思想、知识和人类创造的东西将不断消失。“我们不可能拯救一切。让所有东西变得可访问是不可能的。而且我们也无法找到所有的东西,”奥吉尔说,“但这不能成为我们不去尝试的理由。”支持:Ren原文:https://www.technologyreview.com/2022/10/26/1061308/death-of-information-digitization/
0 评论