第9章 跳舞小人(第2/4页)
这位中山大学的年轻副教授抱着这样复杂的愤怒,根据朋友的推荐,去见了房产律师。虽然律师事务所和学校间有公交直达并不远,他还是叫了出租车,双方签字盖章按手印的购房合同被他裹了一层又一层,放在双肩包里紧紧地抱在胸前,生怕出什么幺蛾子。
律师看完合同条款的第一句话是:“从你提供的资料看来,这么说吧,我们有很大把握能胜诉。简单地说是这样的,上个月深圳刚判了一个案子,跟你的情况基本一样,赢了。”
就在汪海成他走进律师事务所的同时,中科院联合中山大学搭好了信息破译小组的班子,开始破译那个连续几天都在深夜里化作怪物,把汪海成从梦中惊醒的60K黑体辐射信息。
戴森云是汪海成他们在FAST上的独立发现,但60K黑体辐射异常则被全球射电天文台观测到了——地球上每个天文台,不管当时天线在扫描哪个位置,都记录下了同样的异常辐射。这也是汇报之后破译小组加紧成立的原因:没有信息优势,就必须有效率优势。
为了大致搞清楚辐射信号的分析工作进展,白泓羽还专门恶补了密码学的基本知识。
早在几千年前,人类就开始使用密文来进行通信,借以掩饰所需传递的实际信息。根据考古资料记载,公元前古罗马恺撒大帝就已经开始使用被称为“恺撒密码”的加密方式和自己的朋友通信。直到二十世纪之前,准确地说,是两次世界大战之前,人类的加密方式都停留在恺撒密码的水平上。
这种最初级的加密方式又被称为古典加密法,也就是置换法——根据预先设定的特定规律,用特定的符号替换明文原文,生成一套无法直接辨别的密文。随着二十世纪初连续两次世界大战的爆发,战争双方通信和谍报需求暴涨,古典加密法就显得过于简单了。它只使用一套固定的加密算法和密码字典,密文本身虽然不知所云,但依然保持了加密前明文的语言规律。柯南·道尔的经典小说《福尔摩斯之跳舞的小人》非常完美地揭示了破解这种密码的办法:通过密文里出现的符号进行频率分析,再和语言规律进行对比,一步步确认密文可能对应的原文。只要有足够的密文样本来分析频率规律,总能把密码还原成原始语言。
相互监听和破译直接关系到战争的命运,而这时的古典加密法已经很容易被破解,为了满足战争的需要,更有效的加密方式应运而生。
一个思路是直接使用不为普通人所掌握的原始明文进行加密,比如二战期间美军曾利用印第安少数民族纳瓦霍人的语言作为战场密码——正是因为无法理解原始语言的规律,这一度成为日本军队无法破译的神秘密码。但是,当信息论和语言学被引入密码学之后,这样的手段失去了意义。不过,这倒产生了巨大的连带价值——大量曾经无法解读的考古文字被重新破译了。学者们发现人类毕竟还都是人类,不管他们使用什么样的文字,无论是象形还是注音,他们所要表达的意思内涵总是相同的,只要样本量足够大,总是能找到对应规律,通过频率分析找出答案。
频率分析手段面对自然语言几乎是无敌的,只要样本量够,一定有办法破解,所需要的只是足够的计算力而已。这直接导致了战争各方对运算能力的需求急速增长。从草稿纸到计算尺,再到电子打孔计算机,算力演进的军备竞赛成了决定战争胜负的重要因素。
在二战刚刚结束的1946年,算力的军备竞赛创造了一个伟大的成果,为破解德军密码而研发的ENIAC姗姗来迟。ENIAC,这个迟来的人类第一台计算机从此改变了我们文明的进程,地球走进了由恐怖运算能力构成的信息时代。
白泓羽这时才第一次意识到,密码学是人类二十世纪科技大爆炸的最重要肇因之一!
然而,她并没有意识到,人类文明已经再次站在因为密码而骤变的路口。
随着频率分析这个无敌武器的泛滥,加密方式终于不得不进行革新——用复杂密钥字典来代替简单密钥字典,以掩盖密文的频率规律。换句话说,原文的A在某些时候会被加密成X,在某些时候又会被加密成Z。密文字频与原文字频的联系被破坏,除非找到对应的加密字典,否则很可能永远无法解开密码。
二十世纪的冷战时期,间谍曾一度使用唯一的一次性密码字典:没有任何规律的解码字典所含的信息量已经远远超过了密文本身。除了发信人和收信人,任何人都无法破解密文的内容。但这种手法失败得出人意料:许多情报因为一次性密码字典丢失而变成了废纸。
冷战之后,随着计算机的普及,二进制数据代替自然语言成了通信的基本载体。语言频率分析法最终宣告失效——二进制数据文件有无数种可能的格式,要进行频率分析,第一步必须了解原文文件的编码规律——图像、语音等各种文件的频率复杂度远在语言文字之上。