读书笔记-Effective C++中文版-4对象被使用前已被初始化+extern关键字

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/aaron1996123456/article/details/102721660

读书笔记-Effective C++中文版-4对象被使用前已被初始化

确定对象被使用前已被初始化

读取未初始化的值会导致不明确的行为,在某些平台,可能程序会终止,可能读入一些半随机的值,污染了正在读取动作的对象,导致不可预知的程序行为。

永远在使用对象之前先将其进行初始化,对于无任何内置类型,手工完成此事。

int x = 0;									//对int进行手工初始化
const char* text = "A C-style string";		//对指针进行手工初始化
double d;					
std::cin >> d								//以读取input stream的方式完成初始化

不要混淆赋值和初始化,下面是一个类:

class PhoneNumber {};
class ABEntry {
public:
	ABEntry(const std::string& name, const std::string& address, 
			const std::list<PhoneNumber>& phones)

private:
	std::string theName;
	std::string theAdress;
	std::list<PhoneNumber> thePhones;
	int  numTimesConsulted;
};

ABEntry::ABEntry(const std::string name, const std::string& address,
	const std::list<PhoneNumber>& phones)
{
    //这里时赋值,而非初始化
	theName = name;
	theAdress = address;
	thePhones = phones;
	numTimesConsulted = 0;
}

C++规定:对象的成员变量的初始化发生在进入构造函数本体之前。

class PhoneNumber {};
class ABEntry {
public:
	ABEntry(const std::string& name, const std::string& address,
		const std::list<PhoneNumber>& phones)
		:theName(name),
		 theAdress(address),
		 thePhones(phones),
		 numTimesConsulted(0)
	{}

private:
	std::string theName;
	std::string theAdress;
	std::list<PhoneNumber> thePhones;
	int  numTimesConsulted;
};

后面的初始化会更高效,前面需要调用一次default构造函数,在copy assignment操作符进行赋值。第二个版本:成员初始列中的针对各个成员变量而设的实参,被拿去作为各个成员变量构造函数的实参。只调用一次copy构造函数。对于内置对象numTimesConsulted,其初始化和赋值成本是相同的,为了维护一致性,也采用初始化。

使用default(默认)构造函数时,也可以使用成员初始列,只要把初始化实参设为无物。

ABEntry::ABEntry()
	:theName(),
	 theAdress(),
	 thePhones(),
	 numTimesConsulted(0)
	 {}

编译器会调用default(默认)构造函数,最好在初始列中列出所有成员变量,以免忘记那些成员变量仍要设定初值。

有些情况,成员变量即使是内置类型(初始化和赋值相同)也一定要使用初始列。const和reference必须要初值,不能被赋值。

最简单做法:总是使用成员变量城市列。

许多class有多个构造函数,每个构造函数都有自己的成员初始列,就会产生重复。这种就可以采用遗漏那些”赋值表现和初始化一样好的“成员变量,改用他们的赋值操作,并将这些赋值操作迁移到某个函数(通常是private)供构造函数使用。在”成员变量的初值有文件或者数据库读入”特别有用“

C++有着十分固定”成员初始化次序“,base class早于derived class, class的成员变量总是以其声明次序被初始化。在成员初始列条列各个成员最好总是以声明次序为次序。两个成员变量初始化带有次序性。例如:初始化数组必须指定大小,因此代表数组大小的成员变量必须先有初值。

扫描二维码关注公众号,回复: 7602030 查看本文章

non-local static 对象

static对象,寿命从被构造出来,到程序借宿为止,不是stack和heap-beased对象。包括global对象,定义域namespace作用域内的对象,在class内,在函数内,以及在file作用域内别声明为static的对象。

函数内的static对象被称为local static对象,其他的对象称为non-local static对象。他们的析构函数在main()结束时自动调用。

编译单元是指产出单一目标文件的那些源码,基本上是单一源码加上其所含的其所含入的头文件。

现在的问题是,涉及到至少两个源码文件,每个至少内含一个non-local static对象。如果某个编译单元内的某个初始化动作使用另一个编译单元的某个non-local static对象,这个对象尚未被初始化。原因是:C++对”定义域不同编译的那元内的non-local static对象“的初始化次序并无明确定义。

例子,有一个FileSystem class,其让互联网上的的文件看起来好像位于本机。你可能产生一个特殊对象位于global或者namespace作用域中,象征单一文件系统。

class FileSystem
{
public:
	std::size_t numDisks() const;

};
extern FileSystem tfs;

现在客户建立一个class 用来处理文件系统中的目录(directories)

class Directory
{
public:
	Directory(params);
};

Directory::Directory(params)
{
	std::size_t disks = tfs.numDisks();
}

Directory tempDir(params);

现在初始化的顺序显现出来了,tfs在tempDir之后初始化,tempDir就会调用尚未初始化tfs。

C++对”定义域不同编译的那元内的non-local static对象“的初始化次序并无明确定义。多个编译单元内的non-local static对象经由”模板隐式具现化,implicit template instantiations“形成。不但不可以决定正确的顺序,甚至往往不值得寻找”可决定正确的次序“特殊情况。

解决方法:将每个non-local static对象搬到自己的专属函数内(该对象再次函数内被声明为static)。这些函数返回一个reference只想它所含的对象,用户调用这些函数,而不直接涉及这些对象。这样non-local static被local static对象替换了。

该解决方案的基础在于:C++保证,函数内的local static对象惠子啊”该函数被调用期间“”首次遇上该对象的定义式“时被初始化。所以”函数调用“替换直接访问对象,保证获得reference指向历经初始化的对象。而且从未调用non-local static对象的”仿真函数“,不会引发析构函数成本。

class FileSystem
{
public:
	std::size_t numDisks() const;

};

/*这个函数替换原来的tfs对象,他在FileSystem class可能是一个static
定义并初始化一个local static对象, 
返回一个reference(引用)指向上述对象*/
FileSystem& tfs()
{
	static FileSystem fs;
	return fs;
}


class Directory
{
public:
	Directory(params);
};

Directory::Directory(params)
{
	std::size_t disks = tfs.numDisks();
}


/*这个函数替换原来的tempDir对象,他在Dorectory class可能是一个static
定义并初始化一个local static对象,
返回一个reference(引用)指向上述对象*/
Directory& tempDir()
{
	static Directory td;
	return td
}

这样的reference-returning函数十分简单:第一行定义并初始化对象,第二行返回,可以被用作inline内联函数。但是在多线程情况下:无论local还是non-local对象都会有麻烦。解决途径,在程序单线程启动时,手动调用所有的reference-returning函数。

运用reference-returning函数,前提是防止”初始化次序问题“,其中有着一个对对象而言合理的初始化次序。防止死锁,A初始化调用B,B初始化diaoyongA。

remember:

  1. 为内置型对象进行手工初始化, 因为C++不保证初始化它们。
  2. 构造函数最好使用成员出之列(member initialization list), 不要在构造函数本体内使用赋值操作。厨师列列出成员变量,其排列次序应该和他们在class中的声明相同。、
  3. 为免除”跨编译单元的初始化次序“问题,轻易local static对象替换non-local static对象

在上面有一个extern关键字,当时对其的具体用法不甚了解。下面是一篇有关的博客,供参考:

C/C++中extern关键字详解

https://www.cnblogs.com/yuxingli/p/7821102.html

1 基本解释

extern可以置于变量或者函数前,以标示变量或者函数的定义在别的文件中,提示编译器遇到此变量和函数时在其他模块中寻找其定义。此外extern也可用来进行链接指定。

也就是说extern有两个作用:

  1. 当它与"C"一起连用时,如: extern “C” void fun(int a, int b);则告诉编译器在编译fun这个函数名时按着C的规则去翻译相应的函数名而不是C++的,C++的规则在翻译这个函数名时会把fun这个名字变得面目全非,可能是fun@aBc_int_int#%$也可能是别的,这要看编译器的"脾气"了(不同的编译器采用的方法不一样),为什么这么做呢,因为C++支持函数的重载啊,在这里不去过多的论述这个问题,如果你有兴趣可以去网上搜索,相信你可以得到满意的解
  2. 当extern不与"C"在一起修饰变量或函数时,如在头文件中: extern int g_Int; 它的作用就是声明函数或全局变量的作用范围的关键字,其声明的函数和变量可以在本模块活其他模块中使用,记住它是一个声明不是定义!也就是说B模块(编译单元)要是引用模块(编译单元)A中定义的全局变量或函数时,它只要包含A模块的头文件即可,在编译阶段,模块B虽然找不到该函数或变量,但它不会报错,它会在连接时从模块A生成的目标代码中找到此函数。

2 问题:extern 变量

在一个源文件里定义了一个数组:char a[6];
  在另外一个文件里用下列语句进行了声明:extern char a;
  请问,这样可以吗?
  答案与分析:
  1)、不可以,程序运行时会告诉你非法访问。原因在于,指向类型T的指针并不等价于类型T的数组。extern char *a声明的是一个指针变量而不是字符数组,因此与实际的定义不同,从而造成运行时非法访问。应该将声明改为extern char a[ ]
  2)、例子分析如下,如果a[] = “abcd”,则外部变量a=0x61626364 (abcd的ASCII码值),a显然没有意义
  显然a指向的空间(0x61626364)没有意义,易出现非法内存访问。
  3)、这提示我们,在使用extern时候要严格对应声明时的格式,在实际编程中,这样的错误屡见不鲜。
  4)、extern用在变量声明中常常有这样一个作用,你在
.c文件中声明了一个全局的变量,这个全局的变量如果要被引用,就放在
.h中并用extern来声明。

3 问题:当单方面修改extern 函数原型

当函数提供方单方面修改函数原型时,如果使用方不知情继续沿用原来的extern申明,这样编译时编译器不会报错。但是在运行过程中,因为少了或者多了输入参数,往往会照成系统错误,这种情况应该如何解决?
  答案与分析:
  目前业界针对这种情况的处理没有一个很完美的方案,通常的做法是提供方在自己的xxx_pub.h中提供对外部接口的声明,然后调用方include该头文件,从而省去extern这一步。以避免这种错误。
  宝剑有双锋,对extern的应用,不同的场合应该选择不同的做法。

4 问题:extern “C”

在C++环境下使用C函数的时候,常常会出现编译器无法找到obj模块中的C函数定义,从而导致链接失败的情况,应该如何解决这种情况呢?

答案与分析:
  C++语言在编译的时候为了解决函数的多态问题,会将函数名和参数联合起来生成一个中间的函数名称,而C语言则不会,因此会造成链接时找不到对应函数的情况,此时C函数就需要用extern “C”进行链接指定,这告诉编译器,请保持我的名称,不要给我生成用于链接的中间函数名。
  下面是一个标准的写法:

//在.h文件的头上
#ifdef __cplusplus
#if __cplusplus
extern "C"{
 #endif
 #endif /* __cplusplus */ 
 …
 …
 //.h文件结束的地方
 #ifdef __cplusplus
 #if __cplusplus
}
#endif
#endif /* __cplusplus */ 

5 问题:extern 函数声明

常常见extern放在函数的前面成为函数声明的一部分,那么,C语言的关键字extern在函数的声明中起什么作用?
  答案与分析:
  如果函数的声明中带有关键字extern,仅仅是暗示这个函数可能在别的源文件里定义,没有其它作用。即下述两个函数声明没有明显的区别:
extern int f(); 和int f();
  当然,这样的用处还是有的,就是在程序中取代include “*.h”来声明函数,在一些复杂的项目中,我比较习惯在所有的函数声明前添加extern修饰。关于这样做的原因和利弊可见下面的这个例子:“用extern修饰的全局变量”

(1) 在test1.h中有下列声明:

#ifndef TEST1H
#define TEST1H
extern char g_str[]; 						// 声明全局变量g_str
void fun1();
#endif

(3) 以上是test1模块, 它的编译和连接都可以通过,如果我们还有test2模块也想使用g_str,只需要在原文件中引用就可以了

#include "test1.h"

void fun2()    { cout << g_str << endl;    }

以上test1和test2可以同时编译连接通过,如果你感兴趣的话可以用ultraEdit打开test1.obj,你可以在里面找到"123456"这个字符串,但是你却不能在test2.obj里面找到,这是因为g_str是整个工程的全局变量,在内存中只存在一份,test2.obj这个编译单元不需要再有一份了,不然会在连接时报告重复定义这个错误!

(4) 有些人喜欢把全局变量的声明和定义放在一起,这样可以防止忘记了定义,如把上面test1.h改为

extern char g_str[] = "123456"; // 这个时候相当于没有extern

然后把test1.cpp中的g_str的定义去掉,这个时候再编译连接test1和test2两个模块时,会报连接错误,这是因为你把全局变量g_str的定义放在了头文件之后,test1.cpp这个模块包含了test1.h,所以定义了一次g_str,而test2.cpp也包含了test1.h,所以再一次定义了g_str,这个时候连接器在连接test1和test2时发现两个g_str。如果你非要把g_str的定义放在test1.h中的话,那么就把test2的代码中#include "test1.h"去掉 换成:

extern char g_str[];
void fun2()   {  cout << g_str << endl;   }

这个时候编译器就知道g_str是引自于外部的一个编译模块了,不会在本模块中再重复定义一个出来,但是我想说这样做非常糟糕,因为你由于无法在test2.cpp中使用#include “test1.h”,那么test1.h中声明的其他函数你也无法使用了,除非也用都用extern修饰,这样的话你光声明的函数就要一大串,而且头文件的作用就是要给外部提供接口使用的,所以 请记住, 只在头文件中做声明,真理总是这么简单

6. extern 和 static

(1) extern 表明该变量在别的地方已经定义过了,在这里要使用那个变量。

(2) static 表示静态的变量,分配内存的时候, 存储在静态区,不存储在栈上面。

static 作用范围是内部连接的关系, 和extern有点相反.它和对象本身是分开存储的,extern也是分开存储的,但是extern可以被其他的对象用extern 引用,而static 不可以,只允许对象本身用它. 具体差别首先,static与extern是一对“水火不容”的家伙,也就是说extern和static不能同时修饰一个变量;其次,static修饰的全局变量声明与定义同时进行,也就是说当你在头文件中使用static声明了全局变量后,它也同时被定义了;最后,static修饰全局变量的作用域只能是本身的编译单元,也就是说它的“全局”只对本编译单元有效,其他编译单元则看不到它,如:

//(1) test1.h:
#ifndef TEST1H
#define TEST1H
static char g_str[] = "123456"; 
void fun1();
#endif

//(2) test1.cpp:
#include "test1.h"
void fun1()  {   cout << g_str << endl;  }
//(3) test2.cpp
#include "test1.h"
void fun2()  {   cout << g_str << endl;  }

以上两个编译单元可以连接成功, 当你打开test1.obj时,你可以在它里面找到字符串"123456",同时你也可以在test2.obj中找到它们,它们之所以可以连接成功而没有报重复定义的错误是因为虽然它们有相同的内容,但是存储的物理地址并不一样,就像是两个不同变量赋了相同的值一样,而这两个变量分别作用于它们各自的编译单元。 也许你比较较真,自己偷偷的跟踪调试上面的代码,结果你发现两个编译单元(test1,test2)的g_str的内存地址相同,于是你下结论static修饰的变量也可以作用于其他模块,但是我要告诉你,那是你的编译器在欺骗你,大多数编译器都对代码都有优化功能,以达到生成的目标程序更节省内存,执行效率更高,当编译器在连接各个编译单元的时候,它会把相同内容的内存只拷贝一份,比如上面的"123456", 位于两个编译单元中的变量都是同样的内容,那么在连接的时候它在内存中就只会存在一份了,如果你把上面的代码改成下面的样子,你马上就可以拆穿编译器的谎言:

//(1) test1.cpp:
#include "test1.h"
void fun1()
{
	g_str[0] = ''a'';
	cout << g_str << endl;
}

//(2) test2.cpp
#include "test1.h"
void fun2()  {  cout << g_str << endl;  }

void main()     
{
	fun1(); // a23456
    fun2(); // 123456
​}

这个时候你在跟踪代码时,就会发现两个编译单元中的g_str地址并不相同,因为你在一处修改了它,所以编译器被强行的恢复内存的原貌,在内存中存在了两份拷贝给两个模块中的变量使用。正是因为static有以上的特性,所以一般定义static全局变量时,都把它放在原文件中而不是头文件,这样就不会给其他模块造成不必要的信息污染,同样记住这个原则吧!

7. extern 和const

C++中const修饰的全局常量据有跟static相同的特性,即它们只能作用于本编译模块中,但是const可以与extern连用来声明该常量可以作用于其他编译模块中, 如extern const char g_str[];
然后在原文件中别忘了定义:

const char g_str[] = "123456"; 

所以当const单独使用时它就与static相同,而当与extern一起合作的时候,它的特性就跟extern的一样了!所以对const我没有什么可以过多的描述,我只是想提醒你,const char* g_str = “123456” 与 const char g_str[] ="123465"是不同的, 前面那个const 修饰的是char 而不是g_str,它的g_str并不是常量,它被看做是一个定义了的全局变量(可以被其他编译单元使用), 所以如果你像让charg_str遵守const的全局常量的规则,最好这么定义const char* const g_str=“123456”.

猜你喜欢

转载自blog.csdn.net/aaron1996123456/article/details/102721660
今日推荐