More Effective C++ 条款22

    技术2022-05-11  82

    条款22:考虑用运算符的赋值形式(op=)取代其单独形式(op)

    大多数程序员认为如果他们能这样写代码:

    x = x + y;                    x = x - y;

    那他们也能这样写:

    x += y;                       x -= y;

    如果xy是用户定义的类型(user-defined type),就不能确保这样。就C++来说,operator+、operator=和operator+=之间没有任何关系,因此如果你想让这三个operator同时存在并具有你所期望的关系,就必须自己实现它们。同理operator -, *, /, 等等也一样。

    确保operator的赋值形式(assignment version)(例如operator+=)与一个operator的单独形式(stand-alone(例如 operator+ )之间存在正常的关系,一种好方法是后者(指operator+  译者注)根据前者(指operator+=  译者注)来实现(参见条款6)。这很容易:

    class Rational {

    public:

      ...

      Rational& operator+=(const Rational& rhs);

      Rational& operator-=(const Rational& rhs);

    };

     

    // operator+ 根据operator+=实现;

    //有关为什么返回值是const的解释,

    //参见Effective C++条款21 109页 的有关实现的警告

    const Rational operator+(const Rational& lhs,

                             const Rational& rhs)

    {

      return Rational(lhs) += rhs;

    }

     

    // operator- 根据 operator -= 来实现

    const Rational operator-(const Rational& lhs,

                             const Rational& rhs)

    {

      return Rational(lhs) -= rhs;

    }

    在这个例子里,从零开始实现operator+=-=,而operator+ operator- 则是通过调用前述的函数来提供自己的功能。使用这种设计方法,只用维护operator的赋值形式就行了。而且如果假设operator赋值形式在类的public接口里,这就不用让operator的单独形式成为类的友元(参见Effective C++ 条款19)。

    如果你不介意把所有的operator的单独形式放在全局域里,那就可以使用模板来替代单独形式的函数的编写:

    template<class T>

    const T operator+(const T& lhs, const T& rhs)

    {

      return T(lhs) += rhs;                     // 参见下面的讨论

    }

     

    template<class T>

    const T operator-(const T& lhs, const T& rhs)

    {

      return T(lhs) -= rhs;                      // 参见下面的讨论

    }

     

    ...

    使用这些模板,只要为operator赋值形式定义某种类型,一旦需要,其对应的operator单独形式就会被自动生成。

    这样编写确实不错,但是到目前为止,我们还没有考虑效率问题,效率毕竟是本章的主题。在这里值得指出的是三个效率方面的问题。第一、总的来说operator的赋值形式比其单独形式效率更高,因为单独形式要返回一个新对象,从而在临时对象的构造和释放上有一些开销(参见条款19和条款20,还有Effective C++条款23)。operator的赋值形式把结果写到左边的参数里,因此不需要生成临时对象来容纳operator的返回值。

    第二、提供operator的赋值形式的同时也要提供其标准形式,允许类的客户端在便利与效率上做出折衷选择。也就是说,客户端可以决定是这样编写:

    Rational a, b, c, d, result;

    ...

    result = a + b + c + d;            // 可能用了3个临时对象

                                       // 每个operator+ 调用使用1

     

    还是这样编写

    result = a;                                  //不用临时对象

    result += b;                                 // 不用临时对象

    result += c;                                 //不用临时对象

    result += d;                                 //不用临时对象

    前者比较容易编写、debug和维护,并且在80%的时间里它的性能是可以被接受的(参见条款16)。后者具有更高的效率,估计这对于汇编语言程序员来说会更直观一些。通过提供两种方案,你可以让客户端开发人员用更容易阅读的单独形式的operator来开发和debug代码,同时保留用效率更高的operator赋值形式替代单独形式的权力。而且根据operator的赋值形式实现其单独形式,这样你能确保当客户端从一种形式切换到另一种形式时,操作的语义可以保持不变。

    最后一点,涉及到operator单独形式的实现。再看看operator+ 的实现:

    template<class T>

    const T operator+(const T& lhs, const T& rhs)

    { return T(lhs) += rhs; }

    表达式T(lhs)调用了T的拷贝构造函数。它建立一个临时对象,其值与lhs一样。这个临时对象用来与rhs一起调用operator+= ,操作的结果被从operator+.返回。这个代码好像不用写得这么隐密。这样写不是更好么?

    template<class T>

    const T operator+(const T& lhs, const T& rhs)

    {

      T result(lhs);                        // 拷贝lhs result

      return result += rhs;                 // rhs与它相加并返回结果

    }

    这个模板几乎与前面的程序相同,但是它们之间还是存在重要的差别。第二个模板包含一个命名对象,result。这个命名对象意味着不能在operator+ 里使用返回值优化(参见条款20)。第一种实现方法总可以使用返回值优化,所以编译器为其生成优化代码的可能就会更大。

    广告中的事实迫使我指出表达式:

    return T(lhs) += rhs;

    比大多数编译器希望进行的返回值优化更复杂。上面第一个函数实现也有这样的临时对象开销,就象你为使用命名对象result而耗费的开销一样。然而未命名的对象在历史上比命名对象更容易清除,因此当我们面对在命名对象和临时对象间进行选择时,用临时对象更好一些。它使你耗费的开销不会比命名的对象还多,特别是使用老编译器时,它的耗费会更少。

     

    这里谈论的命名对象、未命名对象和编译优化是很有趣的,但是主要的一点是operator的赋值形式(operator+=)比单独形式(operator+)效率更高。做为一个库程序设计者,应该两者都提供,做为一个应用程序的开发者,在优先考虑性能时你应该考虑考虑用operator赋值形式代替单独形式。


    最新回复(0)