设计应用

智算操作系统发展路径研究

作者:石里男1,2,韩乃平1,齐璇1,刘乙钧3
发布日期:2024-10-12
来源:电子技术应用

引言

当前,新一轮科技革命和产业变革突飞猛进,随着人工智能技术的爆炸式发展,GPT-4、Sora等大模型相继横空出世,对操作系统迭代产生了深远影响,进一步拓展了操作系统的应用空间。国际上,以微软、RedHat等为代表的主流操作系统企业,已积极拥抱人工智能技术发展。其中,微软前后投资OpenAI超过100亿美元,推出了一系列人工智能产品和解决方案,如通过AI技术赋能Office套件、Bing搜索等核心产品。RedHat和Ubuntu等Linux操作系统企业则通过提供相应的驱动程序支持以及定期更新和维护,保证了与CUDA和NVIDIA GPU的完全兼容性,并支持主流机器学习和深度学习框架、库和工具,如TensorFlow、PyTorch等。但国内暂时还没有出现与人工智能大模型发展相适应,相对成熟、完善的智算操作系统解决方案。此外,国产化算力平台存在的生态碎片化、架构差异化、软件不完备等现状也正在成为制约国内人工智能发展的主要瓶颈。

为解决上述问题,提出打造通用服务器操作系统(具备AI增强功能)+智算平台(包含异构资源调度器AI编程框架)的智算操作系统,通过灵活调度智算集群算力、兼容各类训推框架、支持典型大模型在主流和国产GPU集群上的训练和推理,满足我国人工智能技术发展对于算力的迫切需求,并为构建自主创新的算力底座提供坚实支撑。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006170


作者信息:

石里男1,2,韩乃平1,齐璇1,刘乙钧3

(1.麒麟软件有限公司,天津 300450;

2.天津市操作系统重点实验室,天津 300450;

3.国际关系学院 国际政治系,北京 100091)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
智算操作系统 算力 异构资源调度器 AI编程框架 服务器操作系统