2021那些事|盘点信息技术四大领域
在人工智能领域,人工智能的语言模型、图形模型甚至多模态模型的基本能力都得到了充分的展现。比如,阿里达摩院公布了多模态大模型M6的最新进展,参数从万亿跃升至10万亿;鹏程实验室与百度联合发布全球首个千亿级知识增强模型——鹏程-百度文心,参数规模达2600亿。
不仅如此,人工智能与其他科学领域的交叉融合也擦出了火花。在《科学》杂志最近公布的2021年度科学突破榜单中,基于人工智能预测蛋白质结构的两项技术AlphaFold和RoseTTA-fold高居榜首。
在人机交互领域,当扎克伯格将脸书重新命名为“Meta”时,特斯拉和太空探索技术公司首席执行官埃隆·马斯克(elon musk)专注于脑机接口。马斯克认为,脑机接口设备将更有可能改变世界,帮助四肢瘫痪或身体缺陷的人更好地生活和工作。“复杂的脑机接口设备可以让你完全沉浸在虚拟现实中。”此外,今年5月,斯坦福大学开发了一种皮层内脑机接口系统,可以从运动皮层的神经活动中解码瘫痪患者想象的手写动作,并将其转换为文本。
在超算领域,最值得一提的是,今年6月5438+065438+10月,中国超算应用团队以“超大规模量子随机电路实时仿真”成果获得国际高性能计算应用领域最高奖“戈登·贝尔奖”。
开源方面,RISC-V开源指令集及其生态迅速崛起;由华为牵头,中科院软件所、麒麟软件参与的openEuler操作系统开源社区,聚集了7000名活跃开发者,完成了8000多个自维护开源软件包,催生了超过10个商业分发...
回望2021,资讯科技版邀请业内专家梳理上述四个领域的发展脉络,展望未来发展趋势。
作者张双虎
AlphaFold是2021人工智能(AI)领域的“一哥”。
近日,《科学》杂志公布了2021年度科学突破排行榜,基于人工智能的两项技术AlphaFold和RoseTTA-fold位列第一。
前几天,AlphaGo和AlphaFold还登上了《中国工程院学报》评选的“2021世界十大工程成就”榜单。
在接受《中国科学》采访时,几位专家在回顾今年人工智能领域取得的成就时,都谈到了AlphaFold。
“科学发现的AlphaFold和中国正在构建的人工智能发展生态不能说。”浙江大学人工智能研究所所长吴菲告诉《中国科学报》。
中科院自动化所模式识别国家重点实验室研究员王金桥提名了“用AI诊断新冠肺炎”、“AI for Science”、“三模态模型Zidong Taichu”。
在医学领域,人工智能长期以来一直被用于检测肺炎、哮喘和阿尔茨海默病等疾病。麻省理工学院的研究人员开发了一种人工智能模型,可以通过分析咳嗽记录来识别新冠肺炎患者。识别新冠肺炎患者咳嗽的准确率为98.5%,识别无症状感染者的准确率高达100%。最近,有报道称该模型已被用于鉴定奥米克隆病毒。
“紫东台初首次实现了图-文-声语义的统一表达,具有跨模态理解和生成能力。”王金桥表示,“目前,与新华社* * *发布的‘全媒体多模态大模型R&D计划’实现了全媒体数据理解和生成的统一建模,构建了全栈国内媒体人工智能平台,已探索性地应用于纺织行业、汽车行业质检等场景。”
2月7日,65438,官网,科技部发布支持哈尔滨、沈阳、郑州建设新一代国家人工智能创新发展试验区的三封信。迄今为止,我国已有18个新一代人工智能创新发展国家实验区,将引领我国人工智能创新发展。
“中国正在推动人工智能的生态化发展,建设良好的生态。”吴菲说,“目前,国家新一代人工智能发展创新平台15个,国家新一代人工智能创新发展试验区18个,人工智能创新应用试验区8个,高校设立的人工智能本科专业和跨学科人才培养载体。”
“一个是大模型,一个是人工智能和基础学科的结合。”孙茂松告诉《中国科学报》,“语言模型、图形模型乃至多模态模型的基础能力都得到了充分展现,其作为智能信息处理基础软设施的地位已经确定。同时也不是简单的扩大规模,而是挑战数字资源的整合能力和计算能力。虽然它的局限性是显而易见的,但它的一些‘奇特’性质(如小样本学习、深度双下降、基于提示的任务调整等。)引起了学者们对一个超大参数尺度或者一个质变的期待,从而为新的突破奠定了基础。”
今年人工智能领域从“提炼模型”走向“提炼模型”,从千亿量级走向万亿量级。在大模型领域,似乎没有最大,只有更大。
3月,北京致远人工智能研究院发布了中国首个超大规模人工智能模型“悟道1.0”。6月,致远改写自己的记录,发布启迪2.0,参数规模1.75万亿;9月,浪潮人工智能研究院推出庞大的中文语言模型——源1.0,参数2457亿;165438+10月,阿里达摩院公布了多模态大模型M6的最新进展,参数从万亿跃升至10万亿;65438+2月,鹏程实验室与百度联合发布全球首个千亿级知识增强模型——鹏程-百度文心,参数规模达2600亿。
相应的,最近Aauto Quicker和苏黎世联邦理工学院提出了一个新的推荐系统,波斯,最高可以支持100万亿参数的模型训练。
另一方面,人工智能在基础学科领域不断攻城略地。
7月,DeepMind的人工智能程序Alphafold2的研究成果达到了《自然》的巅峰。在结构生物学研究领域,人工智能可能引领生物学、医学、药学进入一个新的世界;11年6月,美国南加州大学的研究人员利用脑机连接装置,让猴子玩游戏和跑步机,从而对神经活动数据进行研究;65438年2月,DeepMind开发的机器学习框架已经帮助人们发现了纯数学领域的两个新猜想,并展示了机器学习支持数学研究的潜力。
“今年,人工智能在各行业的应用也大有作为。”孙茂松说,“人工智能与基础学科的结合已经显示出巨大的潜力,已经发表了很多顶级论文,已经呈现出很强的趋势,那就是‘人工智能+基础科学’大有可为。”
作者张双虎
脑机接口、AR眼镜、智能语音、肌电手环、远距离手势识别...2021人机交互领域从基础研究激增到应用。无论是智能健康、元宇宙,还是自动驾驶的蓬勃发展,似乎人机交互都站在了产业化的门口。
“我们研发的高通超柔性神经电极已经通过了科研和临床伦理的审批,即将进行脑机接口的人体临床试验。”中国科学院上海微系统研究所副所长、传感技术联合国家重点实验室副主任胡涛告诉中国科学报记者,“安全稳定地采集人脑的大规模神经元信号,并进行闭环调控,将实现患者感知和运动功能的恢复。"
脑机接口技术给患者带来越来越多的便利。今年5月,斯坦福大学的研究人员在《自然》杂志上发表了一篇封面论文,开发了一套大脑皮层内的脑机接口系统,可以从运动皮层的神经活动中解码瘫痪患者想象的手写动作,并转换成文本。在该系统的帮助下,受试者(因脊髓损伤而瘫痪)每分钟可以打出近100个字符,自动纠错后的离线准确率超过99%。
不久前,马斯克表示,他希望明年在人类身上使用Neuralink的微芯片设备。该芯片将用于治疗大脑疾病和神经系统疾病,如脊髓损伤和帕金森病。目前,相关技术正在等待美国美国食品药品监督管理局的批准。
“在脑机接口领域已经积累了相当的技术,有望成为解决脑部疾病的利器。”胡涛说,“每个人都在抓住临床应用的机会,明年可能会应用技术。预计两三年之内,中国将出现堪比马斯克Neuralink的独角兽企业。”
“人机交互将催生一个新的万亿美元市场。”福州大学著名教授颜群的这一判断也包含了超宇宙的巨大市场。
有人说2021是“元宇宙元年”,也有人认为这只是“旧瓶装新酒”。但无论如何,元宇宙已经成为今年人机交互领域不可回避的话题。
“超宇宙是虚拟现实、增强现实和混合现实的综合体,其实没什么新鲜的。”北京邮电大学人机交互与认知工程实验室主任刘伟告诉《中国科学报》,“超宇宙是现实世界和虚拟世界未来的发展方向,但还有一些技术问题没有很好地解决。”
在现实世界中,人机交互的问题和人机环境系统的混合问题一直没有得到很好的解决。在现实世界的人机交互中,无论是在输入、处理还是输出的过程中,客观数据、主观信息和知识仍然没有完美融合。
刘伟认为,无论是现实世界还是虚拟世界,人和机器的决策都有“快决策”和“慢决策”的过程。人类的决策有时更依赖逻辑决策,有时更依赖直觉决策。这种“混合决策”是不断变化的,很难找到变化的规律。这方面的机器决策问题还没有解决。
“超宇宙还处于画饼的早期阶段。”刘伟说,“因为它的底层机制还没有解决——人在现实世界中无法完美解决人机交互的问题,在元宇宙中也无法解决。”
说到人机交互,刘伟认为第二个不可忽视的问题是“复杂场”。
“今年的诺贝尔物理学奖也授予了预测气候变化的复杂系统模型的支持者。”刘伟说,“人机交互也是一个复杂的系统,既有重复性的问题,也有杂乱无章、跨领域的协同问题。”
刘伟认为,从智能的角度来看,复杂系统包括三个重要组成部分,一是人,二是设备(人造的东西),三是环境。这其实是一个很多事物相互作用、交织、重叠的“人机环系统”问题。
“在人机交互中,机器擅长处理‘复杂’的问题,人擅长管理‘杂’的东西——跨领域协作、事物之间的平衡等。因为人们还没有找到复杂事物的简单运行规律,所以要解决智能产品和智能系统的所有问题,就要从人、机、环境的系统中找到它们的结合点、整合点和交互点。而且,人必须在这个系统中处于主导地位。”
在人机交互领域引起刘伟关注的第三个现象是“人工智能帮助数学家发现了一些规律”。“最近,DeepMind开发了一个机器学习框架,可以帮助数学家发现新的猜想和定理。”刘伟说,“人工智能是一个基本的数学工具,同时数学也反映了一些基本规律。如果人工智能可以帮助数学家处理一些数学问题,那么人们将更好地理解复杂系统的简单规律,并可能在人机交互方面取得新的突破。”
作者张云泉(中国科学院计算技术研究所研究员)
今年是中国超级计算应用的丰收年。
165438+10月中旬在美国举行的全球超级计算大会(SC21)上,中国超级计算应用团队凭借基于全新神威系统的量子电路开创性模拟,获得国际高性能计算应用领域最高学术奖项“戈登·贝尔奖”。
同时,在SC 21大学生超算竞赛决赛中,清华大学超算队再次夺冠,实现SC竞赛四连冠。这些大型应用软件在可扩展性和性能调优方面取得的成就表明,我国并行软件的发展方兴未艾。
回顾超级计算推动的行业,我们应该重温一下“计算经济”这个术语。早在2018,我们就提出了“计算经济”的概念,认为以超级计算为核心的计算经济将成为衡量一个地方数字经济发展程度的代表性指标和新旧动能转换的主要手段。
基于近年来的发展趋势,我们认为,当前高性能计算的发展趋势已经充分说明,随着超级计算、云计算、大数据和AI的融合创新,计算力已经成为整个数字信息社会发展的关键,计算力经济已经进入历史舞台。
通过对2021年我国高性能计算机发展现状的综合分析,可以得出当前高性能计算正呈现以下特点。
首先,高性能计算和云计算已经深度融合。高性能计算通常基于MPI、高效通信、异构计算等技术,倾向于独占运行。云计算具有灵活部署和容错的能力,支持虚拟化、统一资源调度和灵活的系统配置。
随着技术的发展,超级计算和容器云正在融合创新,高性能云成为新的产品服务。AWS、阿里云、腾讯、百度以及商用超级计算的代表“北龙超云”都推出了基于超级计算和云计算技术的高性能云服务和产品。
其次,超级计算的应用已经从过去的高精度向越来越广的方向发展。随着超级计算机的发展,特别是使用成本的下降,其应用领域也从具有国家战略意义的精密研究、信息安全、石油勘探、航空航天和“高冷”科学计算领域,迅速扩展到更广泛的国民经济主战场,如制药、基因测序、动画渲染、数字电影、数据挖掘、金融分析和互联网服务等,可以说已经渗透到国民经济的各行各业。
从近年来中国高性能计算100强(HPC TOP100)榜单来看,超算系统过去主要集中在科学计算、政府、能源、电力、气象等领域。近五年来,互联网公司部署的超级计算系统占据了相当大的比重,其主要应用是云计算、机器学习、人工智能、大数据分析和短视频。这些领域对计算需求的急剧增长表明,超级计算正在与互联网技术融合。
从HPC TOP100榜单的Linpack性能份额来看,计算服务以46%占据第一;超算中心占比24%,排名第二;人工智能、云计算和短视频分别以9%、5%和4%紧随其后。
可见,人工智能占比的持续提升,与机器学习等算法和应用的快速崛起,以及深度学习算法在大数据中的广泛应用密切相关。互联网公司通过深度学习算法重新发现了超级计算机,尤其是GPU加速的异构超级计算机的价值,并投入巨资构建新系统。
整体来看,当前计算服务、超级计算中心、人工智能、科学计算等领域是高性能计算的主要用户,互联网、大数据尤其是AI领域增长强劲。
第三,国家层面制定了战略性计算力布局规划。今年5月,国家发改委等四部门联合发布《国家综合大数据中心协同创新体系计算枢纽实施方案》,提出在京津冀、长三角、粤港澳大湾区、成渝、贵州、内蒙古、甘肃、宁夏建设国家计算枢纽节点,启动实施“东电西算”工程,督促东部数据送西部存储计算,在西部建立计算节点,改善数字基础设施布局不均衡问题。
最后,人工智能的计算能力需求成为计算能力发展的主要驱动力。机器学习和深度学习等算法创新,通过物联网、传感器、智能手机、智能设备和互联网技术收集的大数据,以及超级计算机和云计算组成的超级计算能力,被公认为人工智能时代的“三驾马车”,* * *掀起了最新一轮人工智能革命。
在人工智能蓬勃发展的背景下,虚拟化云计算已经演化为高性能容器云计算,大数据、并行计算、机器学习的融合创新成为产业发展的最新方向。
此外,在智能计算评测方面,我国提出了包括AIPerf 500在内的多项基准测试方案,是对传统Linpack测试标准的有力补充。
这些发展表明,超级计算技术对行业的渗透正在加速,我们已经进入了一个依靠计算能力的人工智能时代,这也是未来发展的必然趋势之一。随着用户对计算能力需求的不断增加,计算能力经济必将在未来社会发展中占据重要地位。
作者吴岩峻(中国科学院软件研究所研究员)
开源的发展是显著的,不仅仅是今年。近年来,开源领域发生了许多重要的事情。
比如RISC-V开源指令集及其生态的迅速崛起。这和90年代初Linux的诞生是一样的。当时UNIX和Windows是主流,很少有人能预料到今天以Linux为内核的操作系统已经遍布人们的生活。
现在人们日常使用的80%以上的app都运行在以Linux为内核的Android操作系统上,支撑其业务的后端服务器上运行的操作系统也是Linux发行版。
所以今天的RISC-V可能也是被低估了,认为它不成熟,难以与ARM和X86抗衡。但或许在未来,RISC-V会像Linux一样,最终成为世界主流的指令集生态,产品覆盖方方面面。
仅在2020年,RISC-V国际(RVI,RISC-V基金会迁至瑞士后的新名称)的会员数量就增加了1.33%。事实上,RVI移居瑞士本身也具有重要意义。是开源领域在大国竞争面前保持不“选边站”初心的经典案例,值得全球其他开源基金会借鉴。
在国内,2019年底,由华为牵头,中科院软件所、麒麟软件参与的openEuler操作系统开源社区正式成立。短短两年,社区聚集了7000名活跃开发者,完成了8000多个自维护开源软件包,诞生了10多个厂商的商业分发。
这是中国基础软件领域第一个真正的“根社区”。虽然与拥有20多年历史的Debian和Fedora还有差距,但已经迈出了重要的一步。对于学术研究、技术研发、产业创新,终于有了一个中国主导的、可以长期积累的新平台。
同时,华为在安卓操作系统GMS(谷歌移动服务)海外供应被切断后推出了鸿蒙系统操作系统鸿蒙系统,并在开放原子开源基金会下启动了开源项目OpenHarmony。
目前OpenHarmony已经在短时间内吸引了众多国内厂商参与,这也反映了国内业界对新一代万物互联操作系统的强烈需求。虽然在生态规模和技术完整性上,它和Android还有差距,但已经迈出了构建自己生态的第一步。
这相当于为源代码的合理使用划定了一个边界,即合理使用仅限于接口,一旦深入到接口的实现代码,就需要遵守相关的许可。这对开源知识产权的法律界定具有重要的借鉴意义。
今年5月,中国开源发展蓝皮书2021发布。不仅系统梳理了我国开源人才、项目、社区、组织、教育、业务现状,给出发展建议,还为国家政府相关管理部门制定开源政策、布局开源战略提供参考,为科研院所、科技企业、开源从业者提供更多案例参考和数据支持。
无论是开源软件正朝着围绕开放指令集的开源软硬件生态发展,还是开源有着严格的法律边界约束,抑或是国内龙头企业正试图通过开源探索解决“卡脖子”问题,并取得了一定成效...很多案例都指向一个方向——开源趋势不可阻挡。因为它源于人类分享知识、协作创造的天性,也是数字时代人类文明代代相传的重要模式。
当然,不可否认的是,开源还存在很多问题,比如,开源软件供应链的安全问题。这里的安全不仅有传统意义上的软件质量和安全漏洞的问题,还有开源软件无法持续有效维护的问题(比如HeartBleed出现问题时OpenSSL只有两个兼职维护人员,log4j出现问题时只有三个兼职维护人员),还有大国竞争导致的“供应失效”的问题(比如GitHub曾经限制伊朗开发者的准入)。
随着开源软件向GitHub等商业平台集中,这个问题会更加突出,甚至成为一大风险。开源软件这一本应属于全人类的智力资产,却可能成为实施“长臂管辖”的利器为了避免这一问题,开源代码托管平台、开源软件建设与发布平台等公共基础设施需要“去中心化”。这个世界需要多个开源软件基础设施,最大程度上消除政治势力对开源社区的威胁。
对于中国来说,随着开源软件成为科研、产业等诸多重大基础设施的重要支撑部分,开源软件本身也应该具备代码托管、编译、构建、测试、发布、运维等功能的基础设施,以保证开源软件供给的安全性和连续性,进一步增强各行各业使用开源软件的信心。
未来,核心技术创新和开源贡献将成为国内企业发展的新动力,或将中国开源事业推向又一个高潮。