第9章 跳舞小人(第4/4页)
搞出结果的是军区信息所的初级工程兵,叫赵侃。瘦高个子,尖嘴猴腮,一口武汉口音的塑料普通话。之所以派他过来,一是因为信息所就他一个人没有急活儿缠身,二是需要有人提前准备研究设备、保密网络、监控程序、沙盒数据库之类。等真正负责的专家来了,肯定还需要有人维护软硬件打打下手,解决点杂事儿,这也是他的工作。赵侃有权接触数据,但是谁也没指望他能独立开展什么有成效的工作。如果在企业里,他这样的人就是修电脑的网管,在互联网公司里则被称为“IT”。
因为知道专家短时间内还无法到位,而办公室保密网络既没有外网,更别提什么娱乐,赵侃实在闲得无聊,于是决定折腾点事儿。60K黑体辐射数据量很大,播放了大概有二十四小时,这些辐射有非常明显的峰谷波动。赵侃也不懂什么高级的数据处理算法,他用原始办法建了一个数据表,电磁波峰记录为1,平缓的波谷记录为0。这些数据他一个个手动输入,足足打了一个小时,直到记录了一大堆二进制数据之后,他终于觉得累了,这才停了下来。
赵侃的第一个想法,是可以当作摩斯码,把01当作点划来处理,看看能得到什么结果。这次翻译尝试以一堆乱码告终,但这让他发现二十四小时的播报实际是周期循环的,换句话说,有效的部分并不长,大约只有十来分钟的信息,然后这段信息不断重复了二十四个小时。
接下来,赵侃把连续峰值的部分都加了起来,用0作为间隔。111011010111101换成了302010401,这让他发现了一个基本但重要的事实,即连续的峰值最多重复四次,绝对没有出现过四个以上的连续波峰。如果去掉0这个明显的间隔符号,数据就变成了元素只有1到4的数列:32141……这时候,有效信息量已经变得非常小,只有几百比特,也就是不到1KB的量。
这个结果是很让人失望的,几百比特如果用字符来表达,只有短短几百个字。这个信息量小得太离谱,完全不足以用来分析其中的语意——如果这里面真有的话。对于赵侃来说,这倒谈不上多失望,因为他并不真正理解地外文明信息的意义。
以赵侃一个中专毕业,靠技术培训上岗的信息工程兵的水平,这些简单的信息处理已经是他能力的极限了。
随后他又花了一个多小时,把所有的60K黑体辐射信号按这个简单的编码方式处理成了数据。如果赵侃系统学习过数学,那他肯定知道这些数据符合四进制数据的规则。而他现在输入的记录本身违反四进制数据的记录方式——四进制的标准记录方式是使用0到3的数字,不是1到4。
可能只是出于好奇心,赵侃在结束自己的没事找事前做了一个违反操作规程的事情:他把这个数据丢进了信息所的爬虫天网。
爬虫天网是一个大型的分部式网络预警系统,通过不断过滤互联网数据里的信息进行自我学习,最终从网络热点中监控和预判各种可能出现的异常。毕竟互联网很早以前就已经代替了所有媒体,成了最重要的传播方式,在新的形势和挑战下,敌对势力为了达到对网络信息的利用和攻击,窃密早已是公开的秘密。要应对各式各样的渗透和攻击,光靠亡羊补牢是行不通的,爬虫天网就是以A.I.自进化学习的方式预判可能发生的信息攻击,提前堵住漏洞。
这套系统的建设和实验已经进行了很长时间,爬虫天网的数据触角早就渗透了QQ、微信、微博、论坛、网站后台等绝大多数常规网络数据,暗网的隐秘空间也被基本覆盖,但因为自我学习效率还不是很高,实际效果并不理想。反倒是信息收集效果意外地好,几乎可以说是无所不知,只是它还不知道该怎么利用和处理这些无所不包的信息。需要调查的特征观测数据被丢进爬虫天网之后,系统会查找爬虫触角所有的相关信息,去核对这个特征数据的可能模式。
两个小时之后,爬虫天网反馈了一个非常奇特的结果:来自南京大学模式动物研究所的非公开数据库。数据库的题头是“国家遗传工程:小鼠资源库”。
以赵侃的知识水平,他没法判断这其中可能隐含什么意义。因为这些操作多少都有点违规之嫌,他还犹豫了一下是应该上报,还是把这些结果都抹掉——这个结果看上去也没啥关联性,可能连巧合都算不上。
最后,这个信息工程兵还是老老实实把结果报给了自己的领导。
二十分钟之后,白泓羽被叫了过去。
这时的汪海成还在忙着准备材料,跟律师沟通如何起诉,为了在这个房价不断暴涨的时代维护自己的一点权益而努力挣扎。