指令集并行动态分支预测与推断执行
更新时间:2023-07-18 10:34:01 阅读量: 实用文档 文档下载
- 指令集并行方式推荐度:
- 相关推荐
指令集并行动态分支预测与推断执行
指令集并行——动态分支预测与推断执行
实验目的:
1) 了解动态分支预测的基本技术 2) 了解推断执行的基本过程 3) 比较各种分支预测技术的性能
实验环境:
linux平台下SimpleScalar仿真器,详见SimpleScalar使用说明
实验原理:SimpleScalar分支预测的实现方法。
流程:先进行分支方向探测,即是否采取分支(当然跳转指令和调用返回指令不用作这一步),接着是生成分支地址,对于调返指令,直接在RAS上作相关操作,普通分支指令则要利用BTB来进行地址探测,命中则生成地址。然后对两步综合,地址命中且分支预测为采取,返回分支目标地址;地址不命中且分支预测为采取,返回1;只要分支预测为不采取,就返回0。重点分析针对条件分支指令的方向探测方法,主要有6种,三种静态:taken,not tanken,perfect;三种动态:bimod,2-level,comb。静态的方法顾名思义,只是perfect这种,按它的原薏是不预测,直接把真正采取的下一条指令填入npc,而且它确实不需要调用pred-lookup函数,但据有人说,这种方法有时性能不如bimod,另外在sim-pred中好象也没加入这种方法,只是在sim-outorder中有实现。对于三种动态方法,分别说明如下:bimod是最普通的,即采用一个2bit宽的分支方向预测表,按分支地址查找,2bit分支预测器的判断和更新与课本上的一致。这种方式只有一个参数,就是分支预测表的长度。2-level要复杂一些,它采用两级表格式,第一级是分支历史表,存放各组分支历史寄存器的值,第二级是全局/局部分支模式表,(全局或局部应是由表长相对于分支历史寄存器的长决定),它存放各分支历史模式的2bit预测器。在判断时用当前分支指令对应的历史寄存器值去索引二级表得到相应预测器值。更新时,把当前分支的方向左移入历史寄存器,并对使用过的2bit预测器作更新。它有四个参数,前三个是一级表长度,二级表长度,历史寄存器宽度,最后一个是异或标志。如果为1,则将历史寄存器的值与当前分支指令地址异或,用其结果再去索引二级模式表。而comb方式则组合了以上两种方法,它再加入了一个meta表,这个表类似bimod的预测表,只是它预测的是采取bimod还是2-level,也采用2-bit预测器,被采取的预测方法被定为第一方向,未被采取的定为第二方向。更新时,如果第一方向与第二方向不同则更新meta表,否则只更新两种方法各自的表即可。它共有三组参数,前两组即bimod和two-level的参数,第三组是关于meta表长度的说明。至于BTB的更新与cache的更新方式相同。
实验步骤:
1) 在Windows环境下运行VMware虚拟机。 2) 在VMware虚拟机上运行Linux的命令行模式。
3) 进入SimpleScalar目录(/home/fwang/tixijiegou/simplesim-3.0/) 。
4) 用sim-pred仿真器运行提供的三个benchmark程序,分别采用五种不同的分支预测方
法,即bimod方式,two-level adaptive方式,always taken方式,always not taken方式,comb方式,并对前两种分别使用下表中两种参数配置:分析仿真器输出的关于分支预
INFOLAB
1 共 3 页
指令集并行动态分支预测与推断执行
测的统计参数集,填写表格,并对各仿真器的能力给出相应说明。
说明:以上表格与参数配置仅供参考,实验时可略做调整。
5) 命令格式为: ./sim-bpred {-option} executable_benchmark -argument
其中executable_benchmark放在tixijiegou/benchmark/目录下面, -argument 输入集在tixijiegou/input下面。
三个benchmark程序的具体输入情况举例如下:
GCC :../benchmark/cc1_base.pisa_little ../input/smred.c-iterate.i –o ../input/ smred.c-iterate.c
Mcf :../benchmark/mcf_base.pisa_little ../input/smred.in Gzip:../benchmark/ gzip_peak.pisa.little ../input/mdred.log 1
INFOLAB
2 共 3 页
指令集并行动态分支预测与推断执行
实验报告:包括在仿真器上运行的三个程序的结果统计数据表格,以及对各种分支预测方法的对比分
析。
备注:1)仿真器的参数输入可以采用配置文件的方法,即修改提供的cfgfile文件中相应参数,并把
这个文件作为仿真器的-config参数,省去输入长指令的麻烦。
2) 给仿真器的-redir:sim参数填一个文件,它能够记录所有输出的统计信息,供分析结果所
INFOLAB 用。
3) 统计参数的意义详见SimpleScalar使用说明。
3 共 3 页
正在阅读:
指令集并行动态分支预测与推断执行07-18
农村小学校本课程开发的实验研究结题报告11-04
人口素质研究报告(1)08-12
2017会计继续教育《合同法》练习题01-05
给分手后女朋友的祝福短信02-24
紧急情况处理措施、预案以及抵抗风险的措施09-07
进化生物学试题10-09
第十八讲,老子智慧与人际交往的境界02-16
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 并行
- 推断
- 分支
- 指令
- 执行
- 预测
- 动态
- SOR-2011-22 Flammability
- 2015中山大学864反应堆物理考研真题
- 论企业会计信息失真的表现、成因及对策
- 广告策划与营销亮点
- word排版技巧及报纸版面制作
- 生物化学课程论文题目及写作要求
- 中心小学六年级下学期数学计算专题试卷201003
- 23-基于动态利率期限结构模型的定价技术
- 新德标、欧盟标准、国际标准与旧德标对照表
- 老年人上消化道出血48例胃镜分析
- 十六.民航、铁路、航运、交通doc
- 2010年小学三年级班主任家长会发言稿
- 单井采油动态成本核算的探索与实践
- 浅议山东省地下水合理开发利用与保护
- 德国威能壁挂炉使用说明
- 《新编地图学教程》(第二版)电子教案使用说明
- 【写作宝典】小学作文34个要点
- 水利、环境和公共设施管理业上市公司2014年内部控制报告(简版)
- 代际流动的模式_理论理想型与中国现实
- 4第四章、络合滴定法