ABB PM864AK01 3BSE018161R1
由于超快的CPU内核与相对慢的存储器之间的速度差距在日渐增大,存储器系统可能成为当前制约系统性能的主要瓶颈。此外,低功耗是另一个重要的设计考虑,尤其在电池供电设备与日俱增的情况下更是如此。低功耗意味着更长的电池续航时间和设备使用时间。在常见的应用场合,存储器功耗通常占了应用处理器功耗相当大的一部分,而且,随着存储器设计日益复杂、容量增大、分层增多,存储器功耗往往会迅速增加。因此,降低存储器功耗非常有利于延长电池续航时间。为了更好地了解各种应用的固有行为,有必要探究存储器的特性、建立存储器模型,以判断应用是否涉及频繁的存储器存取操作,甚至帮助预测应用的性能。
本文提供了一种简单、经济的方法,能以可接受的***度动态地表征应用的计算及存储器的构成。
描述存储器特性的方法
如果不涉及存储器操作,那么CPU利用率应该随着CPU内核的频率呈线性关系,而应用成本(定义为CPU利用率和CPU频率的乘积)应该保持恒定。但在考虑存储器存取以后,CPU利用率就不再随内核频率呈线性关系了。在频率较高时,存储器对性能的影响往往更大,因为CPU要用更多的CPU周期等待存储器的响应(这里我们假定,存储器频率不随CPU频率而变)。从这种意义上,应用可以分为两种类型:计算限定型和存储器限定型。
接下来,我们来讲述如何用三种不同的方法表征存储器特性,并帮助确定应用的CPU利用率。在此,硬件性能信息是通过查看性能监视单元(PerformanceMonitoringUnit,简称PMU)来收集的。因此,Marvell的方法仅适用于有PMU硬件支持的系统。
1.整体数据缓存失效率:直觉上,较高的数据缓存失效率意味着更大的存储器流量。为了获得数据缓存失效率的数值,我们需要监视一级数据缓存和二级数据缓存(如果有的话)的存取操作和失效总数。
2.主存储器访问率:外部存储器控制器的占用率直接表明了存储器的利用率。为了得到主存储器访问率数值,必须收集两种PMU信息:存储器控制器被占用的周期总数;监视窗口中的周期总数。
3.数据停顿率:流水线停顿主要由数据相关性引起,而数据不可用的原因是存储器存取速度远比CPU速度低。因此,流水线的停顿次数反映了存储器的流量情况。此外,流水线停顿次数还表明了存储器存取的重要性。并不是每次存储器存取都对***终性能有关键影响,因此,持续跟踪因数据相关性对性能造成影响的存储器存取操作,是相当有用的。使用这种方法,可以监视由数据相关性引起停顿的事件情况。此外,必须记录总的周期数,以计算每个窗口中的数据停顿率。
这些不同的方法从不同角度反映出存储器的特性。我们能以合理的开销使用一种方法或组合使用多种方法,以更有效地进行性能分析、做出更准确的预测。
在测试中,我们使用了Marvell的应用处理器,运行基于Linux的操作系统,采用QVGALCD显示器作为测试平台。该应用处理器包括两级缓存。在本次研究中,我们专注于MP3、AAC+和H.264***器。
图1显示了对三种不同方法进行比较的结果。每张图都包括两条曲线:一条是启动了二级(L2)缓存的情况;另一条则是禁用了二级缓存的情况。测试了三个CPU频率。
FI20685 AMAT
AX8550-14312-16BV MKS
AX8560-3020 AX8560-3020
0190-36233 APPLIED MATERIALS
0190-09437 MKS
AX8200F ASTEX
AX8200F APPLIED MATERIALS
0190-24854 APPLIED MATERIALS
OPT-100Z-00 MKS
19-00227-1 MKS
J2-100-AM-225-CNKL6A-24D MKS
0190-34542 MKS
FI20160-1 ASTEX
652D-BB MKS
253B-2-50-2 MKS
146C-AAAAO-1 MKS
253A-3-80-2 MKS
153D-60-63-1 MKS