Terrylee,2005年12月25日
概述
String在任何语言中,都有它的特殊性,在.NET中也是如此。它属于基本数据类型,也是基本数据类型中唯一的引用类型。字符串可以声明为常量,但是它却放在了堆中。希望通过本文能够使大家对.NET中的String有一个深入的了解。
不可改变对象
在.NET中String是不可改变对象,一旦创建了一个String对象并为它赋值,它就不可能再改变,也就是你不可能改变一个字符串的值。这句话初听起来似乎有些不可思议,大家也许马上会想到字符串的连接操作,我们不也可以改变字符串吗?看下面这段代码:
1 using System; 2 3 namespace Demo1 4 { 5 /**//// <summary> 6 /// String连接测试 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 Console.WriteLine(a);1415 a += "5678";16 Console.WriteLine(a);17 Console.ReadLine();18 }19 }20} 21 1 using System; 2 3 namespace Demo1 4 { 5 /**//// <summary> 6 /// String连接测试 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 Console.WriteLine(a);1415 a += "5678";16 Console.WriteLine(a);17 Console.ReadLine();18 }19 }20} 21
运行的结果:
1234 12345678看起来我们似乎已经把MyStr的值从“1234”改为了“12345678”。事实是这样的吗?实际上并没有改变。在第5行代码中创建了一个String对象它的值是“1234”,MyStr指向了它在内存中的地址;第七行代码中创建了一个新的String对象它的值是“12345678”,MyStr指向了新的内存地址。这时在堆中其实存在着两个字符串对象,尽管我们只引用了它们中的一个,但是字符串“1234”仍然在内存中驻留。
1234 12345678看起来我们似乎已经把MyStr的值从“1234”改为了“12345678”。事实是这样的吗?实际上并没有改变。在第5行代码中创建了一个String对象它的值是“1234”,MyStr指向了它在内存中的地址;第七行代码中创建了一个新的String对象它的值是“12345678”,MyStr指向了新的内存地址。这时在堆中其实存在着两个字符串对象,尽管我们只引用了它们中的一个,但是字符串“1234”仍然在内存中驻留。
引用类型
前面说过String是引用类型,这就是如果我们创建很多个相同值的字符串对象,它在内存中的指向地址应该是一样的。也就是说,当我们创建了字符串对象a,它的值是“1234”,当我们再创建一个值为“1234”的字符串对象b时它不会再去分配一块内存空间,而是直接指向了a在内存中的地址。这样可以确保内存的有效利用。看下面的代码:
1 using System; 2 3 namespace Demo2 4 { 5 /**//// <summary> 6 /// String引用类型测试 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";1314 Console.WriteLine(a);1516 Test.Change(a);1718 Console.WriteLine(a);19 Console.ReadLine();20 }2122 public static void Change(string s)23 {24 s = "5678";25 }26 }27} 运行结果: 1234 1234 做一个小改动,注意Change(ref string s) 1 using System; 2 3 namespace Demo2 4 { 5 /**//// <summary> 6 /// String引用类型测试 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";1314 Console.WriteLine(a);1516 Test.Change(ref a);1718 Console.WriteLine(a);19 Console.ReadLine();20 }2122 public static void Change(ref string s)23 {24 s = "5678";25 }26 }27} 28 运行结果: 1234 5678 1 using System; 2 3 namespace Demo2 4 { 5 /**//// <summary> 6 /// String引用类型测试 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";1314 Console.WriteLine(a);1516 Test.Change(a);1718 Console.WriteLine(a);19 Console.ReadLine();20 }2122 public static void Change(string s)23 {24 s = "5678";25 }26 }27} 运行结果: 1234 1234 做一个小改动,注意Change(ref string s) 1 using System; 2 3 namespace Demo2 4 { 5 /**//// <summary> 6 /// String引用类型测试 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";1314 Console.WriteLine(a);1516 Test.Change(ref a);1718 Console.WriteLine(a);19 Console.ReadLine();20 }2122 public static void Change(ref string s)23 {24 s = "5678";25 }26 }27} 28 运行结果: 1234 5678
字符串的比较
在.NET中,对字符串的比较操作并不仅仅是简单的比较二者的值,= =操作首先比较两个字符串的引用,如果引用相同,就直接返回True;如果不同再去比较它们的值。所以如果两个值相同的字符串的比较相对于引用相同的字符串的比较要慢,中间多了一步判断引用是否相同。看下面这段代码:
1 using System; 2 3 namespace Demo3 4 { 5 /**//// <summary> 6 /// String类型的比较 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 string b = "1234";14 string c = "123";15 c += "4";1617 int times = 1000000000;18 int start,end;19 20 /**////测试引用相同所用的实际时间21 start = Environment.TickCount;22 for(int i=0;i<times;i++)23 {24 if(a==b)25 {}26 }27 end = Environment.TickCount;28 Console.WriteLine((end-start));29 30 /**////测试引用不同而值相同所用的实际时间31 start = Environment.TickCount;32 for(int i=0;i<times;i++)33 {34 if(a==c)35 {}36 }37 end = Environment.TickCount;38 Console.WriteLine((end-start));3940 Console.ReadLine();41 }42 }43} 44
执行的结果(运行的结果可能有些不同):
1 using System; 2 3 namespace Demo3 4 { 5 /**//// <summary> 6 /// String类型的比较 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 string b = "1234";14 string c = "123";15 c += "4";1617 int times = 1000000000;18 int start,end;19 20 /**////测试引用相同所用的实际时间21 start = Environment.TickCount;22 for(int i=0;i<times;i++)23 {24 if(a==b)25 {}26 }27 end = Environment.TickCount;28 Console.WriteLine((end-start));29 30 /**////测试引用不同而值相同所用的实际时间31 start = Environment.TickCount;32 for(int i=0;i<times;i++)33 {34 if(a==c)35 {}36 }37 end = Environment.TickCount;38 Console.WriteLine((end-start));3940 Console.ReadLine();41 }42 }43} 44执行的结果(运行的结果可能有些不同):
1671 4172由此我们看出值相同时的比较用= =比引用相同时的比较慢了好多。那如果用Equals()呢?再来看一下Equals()比较时的执行速度:
1 using System; 2 3 namespace Demo3 4 { 5 /**//// <summary> 6 /// String类型的比较 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 string b = "1234";14 string c = "123";15 c += "4";1617 int times = 1000000000;18 int start,end;19 20 /**////测试引用相同所用的实际时间21 start = Environment.TickCount;22 for(int i=0;i<times;i++)23 {24 if(a.Equals(b))25 {}26 }27 end = Environment.TickCount;28 Console.WriteLine((end-start));29 30 /**////测试引用不同而值相同所用的实际时间31 start = Environment.TickCount;32 for(int i=0;i<times;i++)33 {34 if(a.Equals(c))35 {}36 }37 end = Environment.TickCount;38 Console.WriteLine((end-start));3940 Console.ReadLine();41 }42 }43} 44 1 using System; 2 3 namespace Demo3 4 { 5 /**//// <summary> 6 /// String类型的比较 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 string b = "1234";14 string c = "123";15 c += "4";1617 int times = 1000000000;18 int start,end;19 20 /**////测试引用相同所用的实际时间21 start = Environment.TickCount;22 for(int i=0;i<times;i++)23 {24 if(a.Equals(b))25 {}26 }27 end = Environment.TickCount;28 Console.WriteLine((end-start));29 30 /**////测试引用不同而值相同所用的实际时间31 start = Environment.TickCount;32 for(int i=0;i<times;i++)33 {34 if(a.Equals(c))35 {}36 }37 end = Environment.TickCount;38 Console.WriteLine((end-start));3940 Console.ReadLine();41 }42 }43} 44
执行结果:
2656 2469这时看到用Equals()时值相同的反而比引用相同的执行速度要快。同时也可以看出,用Equals()作字符串的比较执行速度比引用相同时用= =慢,但是比值相同时用= =快。所以比较两个字符串到底用= = 还是用Equals()就要视具体情况而定了。
2656 2469这时看到用Equals()时值相同的反而比引用相同的执行速度要快。同时也可以看出,用Equals()作字符串的比较执行速度比引用相同时用= =慢,但是比值相同时用= =快。所以比较两个字符串到底用= = 还是用Equals()就要视具体情况而定了。
字符串驻留
看一下这段代码:
1 using System; 2 3 namespace Demo4 4 { 5 /**//// <summary> 6 /// String的驻留 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 string s = "123";14 s += "4";1516 string b = s;17 string c = String.Intern(s);1819 Console.WriteLine((object)a == (object)b);20 Console.WriteLine((object)a == (object)c);21 Console.ReadLine();22 }23 }24} 25 1 using System; 2 3 namespace Demo4 4 { 5 /**//// <summary> 6 /// String的驻留 7 /// </summary> 8 public class Test 9 {10 public static void Main(string[] args)11 {12 string a = "1234";13 string s = "123";14 s += "4";1516 string b = s;17 string c = String.Intern(s);1819 Console.WriteLine((object)a == (object)b);20 Console.WriteLine((object)a == (object)c);21 Console.ReadLine();22 }23 }24} 25
执行的结果:
FalseTrue在这段代码中,比较这两个对象发现它的引用并不是一样的。如果要想是它们的引用相同,可以用Intern()函数来进行字符串的驻留(如果有这样的值存在)。
FalseTrue在这段代码中,比较这两个对象发现它的引用并不是一样的。如果要想是它们的引用相同,可以用Intern()函数来进行字符串的驻留(如果有这样的值存在)。
StringBuilder对象
通过上面的分析可以看出,String类型在做字符串的连接操作时,效率是相当低的,并且由于每做一个连接操作,都会在内存中创建一个新的对象,占用了大量的内存空间。这样就引出StringBuilder对象,StringBuilder对象在做字符串连接操作时是在原来的字符串上进行修改,改善了性能。这一点我们平时使用中也许都知道,连接操作频繁的时候,使用StringBuilder对象。但是这两者之间的差别到底有多大呢?来做一个测试:
1 using System; 2 using System.Text; 3 4 namespace Demo5 5 { 6 /**//// <summary> 7 /// String和StringBulider比较 8 /// </summary> 9 public class Test10 {11 public static void Main(string[] args)12 {13 string a = "";14 StringBuilder s = new StringBuilder();1516 int times = 10000;17 int start,end;18 19 /**////测试String所用的时间20 start = Environment.TickCount;21 for(int i=0;i<times;i++)22 {23 a += i.ToString();24 }25 end = Environment.TickCount;26 Console.WriteLine((end-start));27 28 /**////测试StringBuilder所用的时间29 start = Environment.TickCount;30 for(int i=0;i<times;i++)31 {32 s.Append(i.ToString());33 }34 end = Environment.TickCount;35 Console.WriteLine((end-start));3637 Console.ReadLine();38 }39 }40} 41 运行结果: 884 0 1 using System; 2 using System.Text; 3 4 namespace Demo5 5 { 6 /**//// <summary> 7 /// String和StringBulider比较 8 /// </summary> 9 public class Test10 {11 public static void Main(string[] args)12 {13 string a = "";14 StringBuilder s = new StringBuilder();1516 int times = 10000;17 int start,end;18 19 /**////测试String所用的时间20 start = Environment.TickCount;21 for(int i=0;i<times;i++)22 {23 a += i.ToString();24 }25 end = Environment.TickCount;26 Console.WriteLine((end-start));27 28 /**////测试StringBuilder所用的时间29 start = Environment.TickCount;30 for(int i=0;i<times;i++)31 {32 s.Append(i.ToString());33 }34 end = Environment.TickCount;35 Console.WriteLine((end-start));3637 Console.ReadLine();38 }39 }40} 41 运行结果: 884 0
通过上面的分析,可以看出用String来做字符串的连接时效率非常低,但并不是所任何情况下都要用StringBuilder,当我们连接很少的字符串时可以用String,但当做大量的或频繁的字符串连接操作时,就一定要用StringBuilder。