设计应用

针对VLIW DSP编译器弊端及异常处理方案

作者：韦凯，洪泽

发布日期：2026-01-14

来源：电子技术应用

引言

随着高性能处理器的飞速发展，在处理器内核并行等方面也出现了VLIW（超长指令字）和超标量等多种架构[1]，其中编译器如何高效发挥处理器性能也成了重重之重。其中高性能DSP通常采用VLIW构架开发[2-4]。目前许多公司和机构开始研发新型高性能DSP，如TI公司的C6678 DSP、Tensilica公司的ConnX545CK8-MAC处理器、CEVA的SensPro专用处理器[5-7]等。VLIW构架利用编译器可以将多条互相独立的指令进行打包（Pack）达到指令级别并行（ILP），而超标量架构需要增加乱序设计等硬件复杂度来保证指令的并行性。因此VLIW构架的处理器对编译器的性能要求更高。

VLIW架构硬件设计简单，但是编译器的工作量大大增加。编译器需要实现静态调度、流水优化去找到N条互相独立的指令组成指令包，进而实现应用程序并行化优化[8]。程序并行优化主要有循环展开、软件流水等手段。而循环展开因子过小会导致部分硬件资源被闲置无法效率最大化，循环展开因子过大又可能会导致资源冲突等问题[9]。

针对VLIW程序并行优化问题，目前很多人提出了很多方法，例如：贺春林等人[10]提出的正确性粗细粒度差异化分析技术，可快速准确定位出测试用例的关键优化选项；池昊宇等人[11]提出的基于机器学习的编译优化方法，提升程序性能；赵宵磊等人[12]实现的面向飞腾迈创数字处理器代码自动生成框架，可提高代码并行度。这些方法虽然有效，但依然不能完全保证编译器编出的正确性。

本文将以TMS320C6000系列DSP为例进行分析，针对VLIW编译器的弊端提出一种结合内核异常处理方案，在提升代码优化的同时保证运行的正确性。其中TMS320C6000系列DSP采用VLIW构架进行设计，具有8个并行操作的功能单元（L1、S1、D1、M1、L2、S2、D2、M2），最高可以完成单周期八指令并行运算。

本文详细内容请下载：

http://www.chinaaet.com/resource/share/2000006919

作者信息：

韦凯，洪泽

（中国电子科技集团公司第五十八研究所，江苏无锡 214035）

官方订阅.jpg

原创声明：此内容为AET网站原创，未经授权禁止转载。

VLIW 编译器资源冲突 C6000 异常处理

点击进入忆阻器二极管/三极管/场效应管测试专题

进入了解AET工业互联网专题

点击查看ChinaAET RISC-V专题

欢迎查看AET双碳专题

进入订阅《电子技术应用》杂志