Google、Mozilla、Qt、LLVM 这几家的规范是明确禁用异常的

作者:陈硕
链接:https://www.zhihu.com/question/22889420/answer/22975569
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

整个 C++ exception 的行为在常见语言中是最奇葩的, 因为这个语言特性与 C++ 其他 feature(特别是确定性析构) 格格不入。在 C++ 中全面铺开使用异常会遇到其他语言中不存在的问题。

从网上容易找到一些公司/组织的C++编码规范,其中至少 Google、Mozilla、Qt、LLVM 这几家的规范是明确禁用异常的。前面三家或许可以用代码历史包袱、程序员C++水平参差不齐、保证可移植性等理由来解释,但是 LLVM 却不同。首先,LLVM 在 2003 年才发布第一版,是个21世纪的新项目,没什么历史包袱;更重要的是,LLVM 的作者同时也开发了 clang 这个 C++ 编译器,用 C++ 写 C++ 编译器的程序员恐怕是 C++ 程序员里对语言掌握得最好的那一批,如果他们都在项目中明确地禁用异常,这意味着什么呢?注意到 clang 源码已经用上了 C++11,那么“考虑移植性照顾老host编译器”这条理由似乎也不成立了。

C++ 引入异常的原因之一是为了能让构造函数报错(析构函数不能抛异常这是大家都知道的常识),毕竟构造函数没有返回值,没有异常的话调用方如何得知对象构造是否成功呢?但是编译器/标准库为了让构造函数能抛异常却是麻烦重重:
  1. 数组元素构造时抛异常,前面已经构造好的元素要析构,还没有构造的元素不能析构。
  2. 构造函数的初始化列表里抛异常,前面已经构造好的成员和基类子对象要析构,还没有构造的成员则不能析构。而且这个异常捕获之后必须重新抛出(编译器强制),因为C++不允许“半吊子”构造的对象存在。
  3. 多继承中某个基类的构造函数抛异常,那么已经构造好的基类子对象要析构,还没有构造的基类子对象则不能析构。虚拟继承,虚基类只能析构一次,你慢慢想吧。
  4. 函数实参对象构造时抛异常,那么多个实参中已经构造好的实参对象要析构,尚未构造的实参对象不能析构。
  5. std::vector 在 resizing 的时候某个元素的拷贝发生异常,那么前面已经拷贝的元素要析构,尚未拷贝的元素则不必也不能析构,去看 gcc vector::_M_insert_aux 的代码有多麻烦。

(注脚:C++ 引入异常的另一个原因是让 dynamic_cast<Derived&>(baseReference) 能报错,因为没有 null reference。还有一个原因是让 overloaded operator 能报错,毕竟 operator 的返回类型往往无法包含 error code,例如 operator=() 返回的是 Type&。C++ 也是唯一一个变量赋值有可能会抛异常的语言,例如 Person s; s = getPersonById(someId);,那么即便 getPersonById() 不抛异常也不能保证上一句赋值不抛异常。)
(注脚2:C++ 引入异常的政治原因是 Ada 支持异常,而 Ada 是 DoD 的指定官方语言,如果 C++ 不支持异常,那么 AT&T 贝尔实验室就不能拿 C++ 做 DoD 的项目。)

C++ 编译器要随时提防调用某个函数 foo 会抛异常,这会阻止一些优化,也会产生很多累赘的代码(随时准备析构那些调用 foo 函数前已经构造好的栈上对象)。因此 C++11 的 noexcept 应该大力推广。

C++ 的 exception specification 也很鸡肋,它不像 Java 那样在编译期检查(Java 似乎也流行使用 unchecked exception 了),而是在运行期检查,而且违反的后果是直接终止程序,那谁敢用啊?还不如用代码注释呢。有的编译器干脆就只支持语法而不实现功能(Exception Specifications)。C# 也不支持 exception specification,可见这是一项无用的语言特性,算是编程语言发展历史上走的弯路吧,可惜 Java/C++ 掉坑里了。

其他支持异常的语言几乎都有 GC,抛异常就抛了,不用担心析构,反正GC管着。只有 C++ 才有 exception safety 需要考虑,其他支持异常的语言都没有这一概念。

而且 Java 的 try-with-resource,C# 的 using,Python 的 with 在管理 function local scope 对象的生命期(资源、lock 释放)方面不比 RAII 麻烦。Go defer 要差一些,它是 function 级,不是 block 级,只能对付 return。 不过反正 Go 也没异常,有点小坑罢了,把函数写短点就能绕过。

RAII 的优势在于将对象的生命期管理与其他资源(锁、文件、网络连接等等)的管理整合,然后通过 smart pointers 一并解决了,这是 C++ 独一无二的优势。

如果写递归下降的 parser,那么内部用异常来报错似乎是合理的,对外返回一个 error code 即可。

猜你喜欢

转载自www.cnblogs.com/findumars/p/9265470.html