第四章-向量处理机 - 代码天地

第四章-向量处理机

其他 2018-09-14 10:18:58 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zongza/article/details/82355316

1 向量处理机相对标量处理机的优势

向量处理机的实质是用一条指令(向量指令)发起对整个向量中的所有元素的访存操作并流水化处理这些元素(因为他们需要进行的操作相同),从而减少指令获取和解码的带宽

对于向量A=[1,2,3]
用

A+A

代替循环

for i in len(A):
    Ai+Ai

减少了很多显式指令的获取和解码,同时后者每次+都要访问一次主存得到向量的一个元素,而向量指令访存操作是为向量中的所有元素发起的,相对于访问 cache 而言更高的访问主存的延迟被均摊了

2 向量的处理方式和对应的处理机结构

对于只包含一个运算符的向量计算(如:A+B) 纵向和横向方式没有区别
对于包含多个运算符的向量计算(如:A*(B+C)) 纵向明显比横向有优势,如减少数据相关

例如计算 A*(B-C)
1 横向 - 在标量处理机中使用

//以元素为单位 整体计算A*(B-C)
for i in len(A):
    bi-ci->qi
    ai*qi->di
//每次循环都存在数据相关

2 纵向 - 在向量处理机中使用 存储器存储器结构

//先计算B-C(只有一个运算符,纵向和横向没区别,相当于以元素为单位整体计算B-C)
for i in len(B):
    qi <-bi-ci
//再计算A*Q
for i in len(A):
    ai*qi->di
-----表示成向量指令就是---------
B-C->Q
A*Q->D
//由于先算出整体q,避免了数据相关

3 纵横向 - 在向量处理机中使用 寄存器寄存器结构

int 分段数 =2;
for k in 分段数:
    for m in len(B)/分段数:
        i = m+k*len(B)/分段数
        qi <-bi-ci
    for n in len(A)/分段数:
        i = n+k*len(B)/分段数
        ai*qi->di

3 提高向量处理机性能的常用技术

设置多个功能部件
采用链接技术,加快一串指令的执行速度(实质相当于变纵向为横向)
循环开采(分段)
多处理机

链接使用条件:

没有功能部件冲突和寄存器冲突
链接只能发生在上一条指令的结果送入向量寄存器的那个周期
前向链接了好几个结果时,这些结果的送入寄存器的时刻必须相同

4 向量处理机性能评价

5 参考

向量处理器
 百度百科

猜你喜欢

转载自blog.csdn.net/zongza/article/details/82355316

第四章-向量处理机

操作系统-期末复习-第四章处理机调度

第四章支持向量机详解

第四章: Spring Boot 异常处理机制

支持向量机(SVM)第四章---支持向量回归

第四章：异常处理

第四章 1. 向量空间

第四章

第四章。

《OpenCV图像处理》第四章处理颜色

第四章-虚拟机性能监控与故障处理工具

第四章：虚拟机监控工具

[机试]第四章字符串

第四章:异常处理的学习

第四章，数据处理--学习笔记

第四章批处理中的变量

第四章 pl/sql 异常处理游标

Go Web编程第四章--处理请求

第四章异常捕获与处理

语音信号处理第四章：

第四章python异常处理

深入理解Java虚拟机----第四章：虚拟机性能监控与故障处理

《深入理解JVM》第四章虚拟机性能监控&&故障处理工具

线代复习——第四章向量组的线性相关

凸优化第四章凸优化问题 4.7向量优化

线性代数第四章--向量组的线性相关性

编译原理——第四章

第四章4

第四章继承

第四章3

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)