s5pv210开发与学习:1.6之裸机关看门狗、设置栈(使用C语言)、开关iCache

目录

 

1.实例程序源码

2.数据手册查阅及分析

3.参考资料


1.实例程序源码

1.1、start.S和led.c文件

/*
 * 文件名:	led.s	
 * 描述:	演示汇编开关icache
 */

#define WTCON		0xE2700000

#define SVC_STACK	0xd0037d80

#define PS_HOLD_CONTROL     0xE010E81C

.global _start			        // 把_start链接属性改为外部,这样其他文件就可以看见_start了
_start:
    //给开发板置锁,5V电源使能
    ldr r0,=PS_HOLD_CONTROL
    ldr r1,[r0]
    orr r1,r1,#0x300
    orr r1,r1,#0x1
    str r1,[r0]

    // 第1步:关看门狗(向WTCON的bit5写入0即可)
    ldr r0, =WTCON
    ldr r1, =0x0
    str r1, [r0]
	
    // 第2步:设置SVC栈
    ldr sp, =SVC_STACK
	
    // 第3步:开/关icache
    mrc p15,0,r0,c1,c0,0;			// 读出cp15的c1到r0中
    //bic r0, r0, #(1<<12)			// bit12 置0  关icache
    orr r0, r0, #(1<<12)			// bit12 置1  开icache
    mcr p15,0,r0,c1,c0,0;
	
    // 从这里之后就可以开始调用C程序了
    bl led_blink				    // led_blink是C语言实现的一个函数
	
    // 汇编最后的这个死循环不能丢
	b .
#define GPJ0CON		0xE0200240
#define GPJ0DAT		0xE0200244

#define rGPJ0CON	*((volatile unsigned int *)GPJ0CON)
#define rGPJ0DAT	*((volatile unsigned int *)GPJ0DAT)

#define GPD0CON     0xE02000A0
#define GPD0DAT     0xE02000A4

#define rGPD0CON	*((volatile unsigned int *)GPD0CON)
#define rGPD0DAT	*((volatile unsigned int *)GPD0DAT)

void delay(void);

// 该函数要实现led闪烁效果
void led_blink(void)
{
	// led初始化,也就是把GPJ0CON中设置为输出模式
	//volatile unsigned int *p = (unsigned int *)GPJ0CON;
	//volatile unsigned int *p1 = (unsigned int *)GPJ0DAT;
	rGPJ0CON = 0x11111111;
	rGPD0CON = 0x00000010;

	while (1) {
		// led亮
		rGPJ0DAT = ((0<<3) | (0<<4) | (0<<5));
		rGPD0DAT = (0<<1);
		// 延时
		delay();
		// led灭
		rGPJ0DAT = ((1<<3) | (1<<4) | (1<<5));
		rGPD0DAT = (1<<1);
		// 延时
		delay();
	}
}


void delay(void)
{
	volatile unsigned int i = 900000;		// volatile 让编译器不要优化,这样才能真正的减
	while (i--);							// 才能消耗时间,实现delay
}

1.3、Makefile文件

#File:Makefile
led.bin: start.o led.o
	arm-linux-ld -Ttext 0x0 -o led.elf $^
	arm-linux-objcopy -O binary led.elf led.bin
	arm-linux-objdump -D led.elf > led_elf.dis
	gcc mkv210_image.c -o mkx210
	./mkx210 led.bin 210.bin
	
%.o : %.S
	arm-linux-gcc -o $@ $< -c -nostdlib

%.o : %.c
	arm-linux-gcc -o $@ $< -c -nostdlib

clean:
	rm *.o *.elf *.bin *.dis mkx210 -f

mkv210_image.c和write2sd文件详见链接文章              mkv210_image.c和writesd代码

2.数据手册查阅及分析


2.1、查阅可知:WTCON(0xE2700000)为看门狗的控制寄存器,其中bit5是看门狗的开关:0代表关,1代表开
在S5PV210内部的iROM代码(BL0)中,其实已经关过看门狗了。所以我们的启动代码实际上是不用去关也没事的,
也就是说今天写的关闭看门狗的代码运行后没有任何现象(没有现象就是正常现象).
很多CPU内部是没有BL0的,因此也没人给你关看门狗,都要在启动代码前段自己写代码关看门狗。
一旦看门狗启动,就要去喂狗;


2.2、汇编写启动代码之设置栈和调用C语言1
2.2.1、C语言运行时需要和栈的意义
    “C语言运行时(runtime)”需要一定的条件,这些条件由汇编来提供。C语言运行时主要是需要栈
    C语言与栈的关系:C语言中的局部变量都是用栈来实现的。如果我们汇编部分没有给C部分预先设置合理合法的栈地址,
    那么C代码中定义的局部变量就会落空,整个程序就死掉了。
    我们平时在编写单片机程序(譬如51单片机)或者编写应用程序时并没有去设置栈,但是C程序还是可以运行的。
    原因是:在单片机中由硬件初始化时提供了一个默认可用的栈,在应用程序中我们编写的C程序其实并不是全部,编译器
    (gcc)在链接的时候会帮我们自动添加一个头,这个头就是一段引导我们的C程序能够执行的一段汇编实现的代码,这个
    代码中就帮我们的C程序设置了栈及其他的运行时需要。
2.2.2、CPU模式和各种模式下的栈
    在ARM中37个寄存器中,每种模式下都有自己的独立的SP寄存器(r13),为什么这么设计?
    如果各种模式都使用同一个SP,那么就意味着整个程序(操作系统内核程序、用户自己编写的应用程序)都是用一个栈的。
    你的应用程序如果一旦出错(譬如栈溢出),就会连累操作系统的栈也损坏,整个操作系统的程序就会崩溃。这样的操作系
    统设计是非常脆弱的,不合理的。解决方案就是各种模式下用不同的栈。我的操作系统内核使用自己的栈,每个应用程序也
    使用自己独立的栈,这样各是各的,一个损坏不会连累其他人。我们现在要设置栈,不可能也懒的而且也没有必要去设置所
    有的栈,我们先要找到自己的模式,然后设置自己的模式下的栈到合理合法的位置,即可。
    注意:系统在复位后默认是进入SVC模式的
    我们如何访问SVC模式下的SP呢?很简单,先把模式设置为SVC,再直接操作SP。但是因为我们复位后就已经是SVC模式了,所以直接设置SP即可。
2.2.3、查阅文档并设置栈指针至合法位置
    栈必须是当前一段可用的内存(可用的意思是这个地方必须有被初始化过可以访问的内存,而且这个内存只会被我们用作栈,
    不会被其他程序征用)
    当前CPU刚复位(刚启动),外部的DRRAM尚未初始化,目前可用的内存只有内部的SRAM(因为它不需初始化即可使用)。因此 我们只能在SRAM中找一段内存来作为SVC的栈。
    栈有四种:满减栈 满增栈 空减栈 空增栈
    满栈:进栈:先移动指针再存; 出栈:先出数据再移动指针
    空栈:xxx
    减栈:进栈:指针向下移动;     出栈:指针向上移动
    增栈:xxx
    在ARM中,ATPCS(ARM关于程序应该怎么实现的一个规范)要求使用满减栈,所以不出意外都是用满减栈
    结合iROM_application_note中的memory map,可知SVC栈应该设置为0xd0037D80


2.3、汇编写启动代码之开iCache
2.3.1、什么是cache,有什么用:cache是一种内存,叫高速缓存。
    从容量来说:CPU < 寄存器 < cache < DDR;从速度来说:CPU >  寄存器 > cache > DDR;
    cache的存在,是因为寄存器和ddr之间速度差异太大,ddr的速度远不能满足寄存器的需要(不能满足cpu的需要,所以没有
    cache会拉低整个系统的整体速度)整个系统中CPU的供应链由:寄存器+cache+DDR+硬盘/flash四阶组成,这是综合考虑了
    性能、成本后得到的妥协的结果。210内部有32KB icache和32kb dcache。icache是用来缓存指令的;dcache是用来缓存数据
    的。cache的意义:指令平时是放在硬盘/flash中的,运行时读取到DDR中,再从DDR中读给寄存器,再由寄存器送给cpu。但
    是DDR的速度和寄存器(代表的就是CPU)相差太大,如果CPU运行完一句再去DDR读取下一句,那么CPU的速度完全就被DDR给
    拖慢了。解决方案就是icache。icache工作时,会把我们CPU正在运行的指令的旁边几句指令事先给读取到icache中(CPU设
    计有一个基本原理:代码执行时,下一句执行当前一句代码旁边代码的可能性要大很多)。当下一句CPU要指令时,cache首
    先检查自己事先准备的缓存指令中有没这句,如果有就直接拿给CPU,如果没有则需要从DDR中重新去读取拿给CPU,并同时
    做一系列的动作:清缓存、重新缓存。

2.3.2、iROM中BL0对cache的操作
    首先,icache的一切动作都是自动的,不需人为干预。我们所需要做的就是打开/关闭icache。
    其次,在210的iROM中BL0已经打开了icache。所以之前看到的现象都是icache打开时的现象。
    
2.3.3、汇编代码读写cp15以开关icache
    mrc p15,0,r0,c1,c0,0;            // 读出cp15的c1到r0中
    bic r0, r0, #(1<<12)            // bit12 置0  关icache
    orr r0, r0, #(1<<12)            // bit12 置1  开icache
    mcr p15,0,r0,c1,c0,0;
    
2.3.4、实验验证
    我们来看三种情况下的实验现象:1 直接使用BL0中对icache的操作;2 关icache;3 开icache;
    实验结果分析:结论1:irom中确实是打开了icache的。
                  结论2:icache关闭确实比icache打开时led闪烁变慢,说明指令执行速度变慢。

3.参考资料

1.ARM汇编指令MCR/MRC学习

2.协处理器CP15介绍—MCR/MRC指令(6)

3.make: 警告:检测到时钟错误。您的创建可能是不完整的。

4.volatile_百度百科

5.C语言中volatile关键字

发布了56 篇原创文章 · 获赞 12 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/I_feige/article/details/102792710