Verilog RTL 代码设计新手上路

1.      做一个4选1的mux,并且进行波形仿真 和2选1的mux对比,观察资源消耗的变化:

实验分析:4选1的mux实际上就是在2选1的mux上进行拓展,选用2位的控制信号控制4位输入信号的选择输出

实验代码设计如下:

RTL视图如下:

波形仿真结果如下:

资源消耗变化如下:

4选1的mux

2选1的mux

2.      编写一个4X4路交叉开关的RTL,然后编译,看RTL View 比较2x2与4x4之间消耗资源的区别。通过对比资源,你有什么结论?

实验分析: 2X2路的交叉开关核心思想就是使用2个输出分别对应1个1位的控制信号,选择该输出哪一个输入信号。根据该思想设计4X4路的交叉开关,则每个输出对应一个2位的控制信号,从四个输入信号中选择一个进行输出,然后并联输出。

实验代码设计如下:

RTL视图如下:

波形仿真结果如下:

资源消耗对比如下:

4X4的交叉开关

2X2的交叉开关

可见4X4的交叉开关消耗资源成倍的增长了。

3.      编写一个8输入的优先编码器,然后编译,看RTL View:

实验分析:4输入的优先编码器本质就是一个4位输入的信号对输出进行控制,当对应为输入1时,输出与位数对应的数值,且高位输入控制优先。编写8输入的优先编码器实际上就是对4输入的位数进行一个简单拓展。

实验代码设计如下:

RTL视图如下:

波形仿真结果如下:



4.      编写一个4-16的译码器,编译;和3-8译码器对比资源开销;看RTL View:

实验分析:3-8译码器即3位输入的2进制值对应相应位置的输出位输出1。编写4-16译码器本质上是对3-8译码器输入、输出位数的一个拓展。

实验代码设计如下:


RTL视图如下:


波形仿真结果如下:


资源消耗变化如下:

3-8译码器

4-16译码器

输入多了一位、输出多了八位的情况下资源消耗几乎多了一倍,可见资源消耗主要与输出位数正相关。

5.      (1)把加法器的输出信号改成4比特位宽,编译,波形仿真。观察输出结果,说出输出和输入的对应关系。

(2)把加法器的输入信号改成8比特位宽,编译,波形仿真。观察加法器的输出延迟,和4比特输入位宽的情况对比,你有什么结论,为什么?

实验分析:例子程序给出无符号加法器是一个4位输入5位输出的加法器,即两个0~15的数相加,其结果范围应该在0~30。当输入仍为4位而输出改为4位时,输出结果范围仅为0~15,当两位输入相加结果大于15后输出结果会出现错误,仅能输出正确结果的后四位;而输入改为8位而输出仍为5位时,两个0~127的数相加,可结果范围只能为0~31,这时只能输出正确结果的后5位,然而加法器仍然要运算正确结果的前3位,所以输出延时应该要大于4输入-5输出的加法器。

实验代码设计如下:

4输入-4输出无符号加法器

8输入-5输出无符号加法器

波形仿真结果如下:

4输入-4输出无符号加法器

可见当正确结果大于15后只能输出正确结果的后4位。

8输入-5输出无符号加法器

可见其输出时延稍大于4输入的无符号加法器。

 

6.      把加法器的输出信号改成4比特位宽,编译,波形仿真。观察输出结果,观察输出结果在什么时候是正确的?。 把加法器的输入信号改成8比特位宽,编译,波形仿真。观察加法器的输出延迟,和4比特输入位宽的情况对比,你有什么结论,为什么?

实验分析:其基本原理与上面无符号加法器相同,只不过其运算法则变为补码运算。对于组合逻辑门的层面来说,主要是“Signed”关键字生成的。

实验代码设计如下:

4输入-4输出补码加法器

8输入-5输出补码加法器

波形仿真结果如下:

4输入-4输出补码加法器

8输入-5输出补码加法器

7.      不改变流水线的级数,把加法器的输入信号改成8比特位宽,编译,波形仿真,和不带流水线的情况对比一下,你有什么结论? 在8比特输入位宽的情况下,在输入上再添加一级流水线,观察编译和仿真的结果,你有什么结论?

实验分析:与不加流水线的加法器相比,带流水线的加法器即在加法器的输入与输出都连接了D触发器,有效的减少了组合逻辑的竞争与冒险,从而明显减少了“毛刺”的长度。而流水线的级数越高,毛刺也随之越短,但输出的时延也会相应的对一个时钟周期。

实验代码设计如下:

8输入-5输出带流水线加法器

4输入-5输出2级流水线加法器

RTL视图如下:

8输入-5输出带流水线加法器

 

4输入-5输出2级流水线加法器

波形仿真结果如下:

8输入-5输出带流水线加法器

4输入-5输出2级流水线加法器

8.      (1)改变乘法器的输入位宽为8比特,编译,波形仿真,观察信号毛刺的时间长度。

(2)选一款没有硬件乘法器的FPGA芯片(例如Cyclone EP1C6)对比8比特的乘法器和加法器两者编译之后的资源开销(Logic Cell的数目)

(3)编写一个输入和输出都有D触发器的流水线乘法器代码,编译后波形仿真,观察组合逻辑延迟和毛刺的时间,和不带流水线的情况下对比。

实验代码设计如下:

8输入-8输出无符号乘法器

无硬件乘法器芯片的8输入-8输出无符号乘法器

4输入-8输出带流水线乘法器

波形仿真结果如下:

8输入-8输出无符号乘法器

可见相较4输入的无符号乘法器“毛刺”时间变短。

无硬件乘法器芯片的8输入-8输出无符号乘法器

可见无硬件乘法器的无符号乘法器“毛刺”时间大大变长。

4输入-8输出带流水线乘法器

可见相较4输入-8输出无流水线乘法器,其毛刺时间相较更短,但输出延时更长(多了一个时间周期)。

资源消耗如下:

8输入-8输出无符号乘法器

无硬件乘法器芯片的8输入-8输出无符号乘法器

可见无硬件乘法器芯片的无符号乘法器硬件资源消耗非常巨大。

9.      (1)设计一个最简单的计数器,只有一个CLK输入和一个OVerflow输出,当计数到最大值的时钟周期CLK输出1

(2)设计复杂的计数器,和本例相似,带有多种信号,其中同步清零CLR的优先级最高,使能EN次之,LOAD最低。

实验分析:(1)中所要求的即不再考虑清零信号、使能信号、置数信号,当计数器还没到达最大值时,每个时间周期内计数加1,当达到计数最大值时,输出信号置1、计数置0即可;(2)即改变三个额外输入信号的优先级,只要CLR为1则执行清零,否则判断EN是否为1,为1则执行最基本的技术功能,否则执行置数功能。

实验代码设计:

只有CLK和Overflow信号的简单计数器

改变三种信号优先级的计数器

RTL视图如下:

只有CLK和Overflow信号的简单计数器

改变三种信号优先级的计数器

波形仿真结果如下:

只有CLK和Overflow信号的简单计数器

改变三种信号优先级的计数器

10.   设计一个用于识别2进制序列“1011”的状态机

(1)    基本要求:电路每个时钟周期输入1比特数据,当捕获到1011的时钟周期,电路输出1,否则输出0;使用序列101011010作为输出的测试序列;

(2)    扩展要求:给你的电路添加输入使能端口,只有输入使能EN为1的时钟周期,才从输入的数据端口向内部获取1比特序列数据。

实验分析:因为要捕获的是“1011”序列,从最低位开始进行匹配,匹配成功跳转到下一状态匹配更高一位,只要有一位匹配错误就应该跳转至状态0重新开始。而加上使能信号后,只有EN为1才从输入端读入输入数据进行匹配。

实验代码设计如下:

基本要求的状态机

带使能信号的状态机

状态转移图及表达式如下:

波形仿真结果如下:

基本要求的状态机

带使能信号的状态机

11.   设计一个如本节“电路描述”部分的“带加载使能和移位使能的并入串出”的移位寄存器,电路的RTL结构图如“电路描述”部分的RTL结构图所示。

实验分析:所谓“串入并出”的移位寄存器,及输入一个1位输入信号,移位寄存器将这个一位数据存入第0位,并将原本的后3位一同前移1位,最后从高到低并行输出四位数据。而“并入串出”的移位寄存器是指,输入一个4位输入信号,存入移位寄存器,若移位使能有效,则将最高位输出,移位寄存器后三3同时前移1位,最低位存入0;若加载时能有效,则从输入端重新读入4位数据。

实验代码设计如下:

RTL视图如下:

波形仿真结果如下:


实验小结:

本次实验共分为11个小的实验,通过Verilog代码模拟了各种逻辑组合电路的基本原理。通过例子实验和自主进行的实验可以发现,任何一个复杂的组合电路都可以拆分成许多简单的基本电路,通过熟练这些基本电路的Verilog代码编写,并在每次实验前都先对要完成的项目进行拆分与简化,重视RTL视图,就可以实现各类大型项目的编写。

同时,在实验过程中自己也检验了对Verilog代码的使用熟练度与理解,如[3:0]即声明一个最高位为第三位最低位为第零位的变量、if...else语句最好使用begin...end括起来,以及一些其他的代码规范。这些都对之后的开发仿真工作有极大的提示帮助。


猜你喜欢

转载自blog.csdn.net/weixin_41033536/article/details/78760573