引言
当前,新一轮科技革命和产业变革突飞猛进,随着人工智能技术的爆炸式发展,GPT-4、Sora等大模型相继横空出世,对操作系统迭代产生了深远影响,进一步拓展了操作系统的应用空间。国际上,以微软、RedHat等为代表的主流操作系统企业,已积极拥抱人工智能技术发展。其中,微软前后投资OpenAI超过100亿美元,推出了一系列人工智能产品和解决方案,如通过AI技术赋能Office套件、Bing搜索等核心产品。RedHat和Ubuntu等Linux操作系统企业则通过提供相应的驱动程序支持以及定期更新和维护,保证了与CUDA和NVIDIA GPU的完全兼容性,并支持主流机器学习和深度学习框架、库和工具,如TensorFlow、PyTorch等。但国内暂时还没有出现与人工智能大模型发展相适应,相对成熟、完善的智算操作系统解决方案。此外,国产化算力平台存在的生态碎片化、架构差异化、软件不完备等现状也正在成为制约国内人工智能发展的主要瓶颈。
为解决上述问题,提出打造通用服务器操作系统(具备AI增强功能)+智算平台(包含异构资源调度器和AI编程框架)的智算操作系统,通过灵活调度智算集群算力、兼容各类训推框架、支持典型大模型在主流和国产GPU集群上的训练和推理,满足我国人工智能技术发展对于算力的迫切需求,并为构建自主创新的算力底座提供坚实支撑。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006170
作者信息:
石里男1,2,韩乃平1,齐璇1,刘乙钧3
(1.麒麟软件有限公司,天津 300450;
2.天津市操作系统重点实验室,天津 300450;
3.国际关系学院 国际政治系,北京 100091)