C语言 字符数组 和 字符串 详解
用来存放字符的数组称为字符数组,例如:
char a[10]; //一维字符数组
char b[5][10]; //二维字符数组
char c[20]={'c', ' ', 'p', 'r', 'o', 'g', 'r', 'a','m'}; // 给部分数组元素赋值
char d[]={'c', ' ', 'p', 'r', 'o', 'g', 'r', 'a', 'm' }; //对全体元素赋值时可以省去长度
字符数组实际上是一系列字符的集合,也就是字符串(String)。在C语言中,没有专门的字符串变量,通常就用一个字符数组来存放一个字符串。
C语言规定,可以将字符串直接赋值给字符数组,例如:
char str[30] = {"c.biancheng.net"};
char str[30] = "c.biancheng.net"; //这种形式更加简洁,实际开发中常用
char str[] = {"c.biancheng.net"};
char str[] = "c.biancheng.net"; //这种形式更加简洁,实际开发中常用
这里需要留意一个坑,字符数组只有在定义时才能将整个字符串一次性地赋值给它,一旦定义完了,就只能一个字符一个字符地赋值了。请看下面的例子:
char str[7];
str = "abc123"; //错误
//正确如下
str[0] = 'a'; str[1] = 'b'; str[2] = 'c';
str[3] = '1'; str[4] = '2'; str[5] = '3';
字符串结束标志
在C语言中,字符串总是以’\0’作为结尾,所以’\0’也被称为字符串结束符。 '\0'
是 ASCII 码表中的第 0 个字符,称为“空字符”。该字符既不能显示,也没有控制功能,它在C语言中唯一的作用就是作为字符串结束标志。
C语言在处理字符串时,会从前往后逐个扫描字符,一旦遇到'\0'
就认为到达了字符串的末尾,就结束处理。
由" "
包围的字符串会自动在末尾添加'\0'
。例如,"abc123"从表面看起来只包含了 6 个字符,其实C语言会在最后隐式地添加一个’\0’
需要注意,逐个字符地给数组赋值并不会自动添加’\0’,例如:
char str[] = {'a', 'b', 'c'};//数组 str 的长度为 3,而不是 4,因为最后没有'\0'。
当用字符数组存储字符串时,要为’\0’留个位置;这意味着,字符数组的长度至少要比字符串的长度大 1。请看下面的例子:
char str[7] = "abc123";
而且,当字符串长度大于数组长度时,有些较老或者不严格的编译器并不会报错。
有些时候,程序的逻辑要求我们必须逐个字符地为数组赋值,这个时候就很容易遗忘字符串结束标志’\0’。下面的代码中,我们将 26 个大写英文字符存入字符数组,并以字符串的形式输出:
#include <stdio.h>
int main(){char str[30];char c;int i;for(c=65,i=0; c<=90; c++,i++)str[i] = c;printf("%s\n", str);return 0;
}
在 VS下的运行结果:
ABCDEFGHIJKLMNOPQRSTUVWXYZ口口口口i口口0 ?//口表示无法显示的特殊字符。
在很多编译器下,局部变量的初始值是随机的,而不是我们通常认为的“零”值。局部数组(在函数内部定义的数组,本例中的 str 数组就是在 main() 函数内部定义的)也有这个问题,很多编译器并不会把局部数组的内存都初始化为“零”值,而是放任不管,所以它们的值也是没有意义的。
在函数内部定义的变量、数组、结构体、共用体等都称为局部数据。在很多编译器下,局部数据的初始值都是随机的,这一点非常重要,一定要谨记,否则后面会遇到很多奇葩的错误。
本例中的 str 数组在定义完成以后并没有立即初始化,所以它所包含的元素的值都是随机的,只有很小的概率会是“零”值。循环结束以后,str 的前 26 个元素被赋值了,剩下的 4 个元素的值依然是随机的。
printf() 输出字符串时,会从第 0 个元素开始往后检索,直到遇见’\0’才停止,然后把’\0’前面的字符全部输出。本例中我们使用 printf() 输出 str,按理说到了第 26 个元素就能检索到’\0’,然而事实却不是这样,由于我们并未对最后 4 个元素赋值,所以第 26 个元素不是’\0’,第 27 个也不是,第 28 个也不是……可能到了第 50 个元素才遇到’\0’,printf() 把这 50 个字符全部输出出来,就是上面的样子,多出来的字符毫无意义,甚至不能显示。
数组总共才 30 个元素,到了第 50 个元素不早就超出数组范围了吗?
是的,的确超出范围了!然而,数组后面依然有其它的数据,printf() 也会将这些数据作为字符串输出。
要想避免这些问题也很容易,在字符串的最后手动添加’\0’即可。修改上面的代码,在循环结束后添加’\0’:
#include <stdio.h>
int main(){char str[30];char c;int i;for(c=65,i=0; c<=90; c++,i++)str[i] = c;str[i] = 0; //此处为添加的代码,也可以写作 str[i] = '\0';printf("%s\n", str);return 0;
}
更加专业的做法是将数组的所有元素都初始化为“零”值。再次修改上面的代码:
#include <stdio.h>
int main(){char str[30] = {0}; //将所有元素都初始化为 0,或者说 '\0'char c;int i;for(c=65,i=0; c<=90; c++,i++)str[i] = c;printf("%s\n", str);return 0;
}
字符串长度
所谓字符串长度,就是字符串包含了多少个字符(不包括最后的结束符’\0’)。例如"abc"的长度是 3,而不是 4。
在C语言中,我们使用string.h头文件中的 strlen() 函数来求字符串的长度,它的用法为:
length strlen(strname);
strname 是字符串的名字,或者字符数组的名字;length 是使用 strlen() 后得到的字符串长度,是一个整数。
下面是一个完整的例子:
#include <stdio.h>
#include <string.h> //记得引入该头文件
int main(){char str[] = "http://c.biancheng.net/c/";long len = strlen(str);printf("The lenth of the string is %ld.\n", len);return 0;}
运行结果:
The lenth of the string is 25.
字符串的输出
在C语言中,有两个函数可以在控制台(显示器)上输出字符串,它们分别是:
puts():输出字符串并自动换行,该函数只能输出字符串。
printf():通过格式控制符%s输出字符串,不能自动换行。
这里再演示一下,请看下面的代码:
#include <stdio.h>
int main(){char str[] = "http://c.biancheng.net";printf("%s\n", str); //通过字符串名字输出printf("%s\n", "http://c.biancheng.net"); //直接输出puts(str); //通过字符串名字输出puts("http://c.biancheng.net"); //直接输出return 0;
}
运行结果:
http://c.biancheng.net
http://c.biancheng.net
http://c.biancheng.net
http://c.biancheng.net
注意:输出字符串时只需要给出名字,不能带后边的[ ],例如,下面的两种写法都是错误的:
printf("%s\n", str[]);
puts(str[10]);
字符串的输入
在C语言中,有两个函数可以让用户从键盘上输入字符串,它们分别是:
scanf():通过格式控制符%s输入字符串。
gets():直接输入字符串,并且只能输入字符串。
区别:
scanf()
读取字符串时以空格为分隔,遇到空格就认为当前字符串结束了,所以无法读取含有空格的字符串。
gets()
认为空格也是字符串的一部分,只有遇到回车键时才认为字符串输入结束。
请看下面的例子:
#include <stdio.h>int main(){char str1[30] = {0};char str2[30] = {0};char str3[30] = {0};//gets() 用法printf("Input a string: ");gets(str1);//scanf() 用法printf("Input a string: ");scanf("%s", str2);scanf("%s", str3);printf("\nstr1: %s\n", str1);printf("str2: %s\n", str2);printf("str3: %s\n", str3);return 0;}
运行结果:
//输入
Input a string: C C++ Java Python↙
Input a string: PHP JavaScript↙
//输出
str1: C C++ Java Python
str2: PHP
str3: JavaScript
第一次输入的字符串被 gets() 全部读取,并存入 str1 中。
第二次输入的字符串,前半部分被第一个 scanf() 读取并存入 str2 中,后半部分被第二个 scanf() 读取并存入 str3 中。
注意:scanf() 在读取数据时需要的是数据的地址,这一点是恒定不变的,所以对于 int、char、float 等类型的变量都要在前边添加&以获取它们的地址。但是因为字符串名字或者数组名字在使用的过程中一般都会转换为地址,所以再添加&就是多此一举了。
就目前学到的知识而言,int、char、float 等类型的变量用于 scanf() 时都要在前面添加&,而数组或者字符串用于 scanf() 时不用添加&,
其实scanf()也有一些高级的用法,可以读入空白字符,如果有兴趣可以了解一下scanf的高级用法