第五十九章 软件与飞机

除了arXiv,王旭还搞了个知网,嗯,就是中文版的。arXiv的管理同样是交给了GIT的管理委员会,全世界各地都有分布式的景象站,其实这两个网站的后台支撑程序是非常类似的,只是展示层有所区别罢了。

而这种面向全世界的网站,王旭是不会自己攥在手上的,也不会让丑国完全把控,而是弄得跟联合国似的。

总的来说,那就是基本上没人可以彻底斩断arXiv与世界的联系,而且arXiv甚至专门开放了对外的访问自动化接口,可以付费去执行一些类似于爬虫任务之类的下载工作。

因为比较费机器和带宽,所以这个服务是要收费的。

而知网这东西,就比较麻烦了,因为他真的需要和各大版权机构去洽谈,国内的还好说,国际上的就很是有些麻烦,所以这东西至少也得是半商业化运行,否则,那成本可能真的没边了。

而这两个基础设施的建立,其实都是为了未来的人工智能时代做准备的。

王旭前世并没有经历过完整的人工智能时代,而这一世,他又在利用各种手段推进着人工智能时代的到来,这就让他有一些惶恐,前世的人工智能时代,华夏的落后是肉眼可见的。

当然也可能只是路线之争罢了,但国内大部分所谓的人工智能其实本质是人家开源的大模型罢了,王旭不能说了解所有,但确实好多都是如此。

王旭并没有把后世最流行的模型放出去,相反放了相对早期的内容,比如卷积神经网络的模型,现在就是王旭的实验室主要发论文的方向。

这东西其实说到底,更适合于图像识别的领域,这是什么车牌识别啊,手写识别啊,人脸识别之类的产品的基础,现在把理论铺平,再经过几年时间的推广和发酵,慢慢地就可以出现在实际的应用领域之中。

当然还有更适合人类语言的循环神经网络的模型,这个东西主要是用于语义分析的,可以分析文本的上下文什么的。

这两种神经网络就是二十一世纪的最初时间段里最热门的内容,王旭的实验室,现在正在慢慢地一点点出这方面的论文。

每年一两篇突破性论文,几篇扩展性论文的样子,已经算是回归到一个实验室正常的状态。现在在人工智能领域,算是一个比较有成果的实验室,在业界也有了些名气。

但说起来依旧都还是理论,由于华夏的硬件设备,软件设备,网络设备都还处于初始阶段,王旭有意识地压制了这方面的产出,真的没必要,做出来了,华夏也用不了。

倒是提供了一些给上面,让上面自己判断是否要用,毕竟神经网络学习也好,训练也罢,需要的数据资源都是海量的,需要的计算机计算资源更是几乎没有尽头。

王旭甚至提醒上面要重视数据的收集工作,这些东西未来将成为新的金矿,当然没必要为了收集而收集,而是在数字化、信息化的过程之中就需要进行了。

其实按照世界的科技发展,从八十年代到未来,大致可以分为五个阶段,数字化,信息化,自动化,无人化,智能化。

对了,这个数字化,和后世提倡的工业数字化不是一个概念,那是物联网时代全面数字化的概念,是包括了厂房、设备、加工过程到产品的全方位数字化。

而现在在搞的数字化,仅仅是针对产品和设计过程,甚至连生产过程都没有硬性的要求。

就好像国家前几年提出的“甩图板”工程,就是这个年代对工业设计数字化的一个尝试。

而其实同时还有一个没有大规模宣传的计划,那就是“甩信纸”的工程,这是华夏走向办公数字化的开端。

后世曾有人把这两项工程,叫做“双甩工程”,但因为使用的人不多,也逐渐被人遗忘。

甩图板工程其实是91年就开始的,但一直进展并不迅速,开始的时候仅在重点企业,以及大型加工制造企业里推广。

但太多条件的制约,让这个工程的进度一直都尽如人意,前世大概一直到97年前后,这个进度才逐渐加速推行了下去。

其中原因很多,但最核心的无外乎三点,缺钱,缺人,缺自主软件。