GotW #18 Iterators
著者:Herb Sutter
翻译:K ][ N G of @rk™
[声明]:本文内容取自www.gotw.ca网站上的Guru of the Week栏目,其著作权归原著者本人所有。译者kingofark在未经原著者本人同意的情况下翻译本文。本翻译内容仅供自学和参考用,请所有阅读过本文的人不要擅自转载、传播本翻译内容;下载本翻译内容的人请在阅读浏览后,立即删除其备份。译者kingofark对违反上述两条原则的人不负任何责任。特此声明。
Revision 1.0
Guru of the Week 条款18:Iterators(迭代子)
难度:7 / 10
(每一个使用标准程序库的程序员都必须注意如下这些常见或罕见的iterator错误。你能从中找出多少错误?)
[问题]
如下的程序包含至少4个与iterator有关的问题。你能找出多少个?
int main( int, char*[] ) { vector<Date> e; copy( istream_iterator<Date>( cin ), istream_iterator<Date>(), back_inserter( e ) ); vector<Date>::iterator first = find( e.begin(), e.end(), "01/01/95" ); vector<Date>::iterator last = find( e.begin(), e.end(), "12/31/95" ); *last = "12/30/95"; copy( first, last, ostream_iterator<Date>( cout, "/n" ) ); e.insert( --e.end(), TodaysDate() ); copy( first, last, ostream_iterator<Date>( cout, "/n" ) ); }
[解答]
如下的程序包含至少4个与iterator有关的问题。你能找出多少个?
int main( int, char*[] ) { vector<Date> e; copy( istream_iterator<Date>( cin ), istream_iterator<Date>(), back_inserter( e ) );到目前为止程序还算不赖。Date class的编写者以signature operator>>(istream&,Date&)提供了一个extractor function,istream_iterator<Date>使它从cin stream读取Date值。copy算法只是把读到的Date信息放入vector。
vector<Date>::iterator first = find( e.begin(), e.end(), "01/01/95" ); vector<Date>::iterator last = find( e.begin(), e.end(), "12/31/95" ); *last = "12/30/95";错误:这可能是非法的,因为’last’有可能是e.end(),而此时其是一个不可被施行提领操作的(dereferenceable)iterator。
如果没有找到指定的值,find算法就会返回其第二个引数(argument)(即范围内最末端的iterator)。在这里,如果”12/31/95”并不在e之中,那么’last’将等于e.end(),其指向container中最末端的下一个位置,并不是一个有效的iterator。
copy( first, last, ostream_iterator<Date>( cout, "/n" ) );错误:这可能是非法的,因为’first’有可能位于’last’之后。
如果在e中不能找到”01/01/95”而能够找到”12/31/95”,那么此时iterator ‘last’将指向集合中先于「iterator ‘first’所指位置(在这里即是末端之后的那个位置)」的某个位置(即等于”12/31/95”的那个Date对象)。然而,copy算法要求’first’必须指向同一集合中先于’last’的位置——这既是说,[first,last ]必须是一个有效范围。
除非你使用一个支持这类检查的标准程序库,否则上述情况的发生将导致在copy算法执行期或执行之后产生core dump,且很难对此进行诊断。
e.insert( --e.end(), TodaysDate() );错误:表达式”--e.end()”是非法的。
其原因即便是有些隐讳,也是很简单的:vector<Date>::iterator只是一个Date*,这不允许你修改内建型别的临时对象。例如,下面这样一段平常的代码也是非法的:
Date* f(); // 该函数返回Date* p = --f(); // 错误;"f() - 1"才是可行的幸运的是,可以写出如下(稍微)正确一点的代码且不损失任何效率:
e.insert( e.end() - 1, TodaysDate() );错误:其实这里也还是有其它错误——如果e是空的,那么e.end()-1就不是一个有效的iterator了。
copy( first, last, ostream_iterator<Date>( cout, "/n" ) ); }错误:’first’和’last’此时有可能不再是有效的iterators。
vector是在所谓”chunks”中增长的,这样每次你向其中插入的时候,vector都不必重新分配缓冲区。然而,vector有时还是会被填满,此时再对其进行添加便会引发重新分配。这里,插入操作完成后,vector可能增长也可能不增长。如果增长了,那便会使我们现存的iterators失效,于是接下来的copy将会导致一个很难诊断的core dump。
[小结]
在使用iterator时,注意如下四个主要问题:
1. 有效的值:可以对iterator施行提领操作(dereferenceable)吗?例如,”*e.end()”总是一个逻辑错误。
2. 有效的生存期:iterator在被使用的时候仍是有效的吗?我们得到它时,它是否已经由于某些操作的施行而成为无效的了?
3. 有效的范围:一对iterators能形成一个合法的范围吗?’first’确实位于’last’之前或等于’last’吗?这对iterator确实指向同一个container内部吗?
4. 非法的内建操纵。例如上述的”--e.end()”,它企图修改一个内建型别的临时对象(幸运的是,编译器会替你注意并发现这个问题;而且对于class型别的iterators,程序库的编写者经常会出于语法便利的考虑而允许这类情况出现)。
(完)