目录
概述
定义
字符串就是零个或多个排在一起的字符,放在单引号或双引号之中。
'abc'
"abc"
- 交替
单引号字符串的内部,可以使用双引号。双引号字符串的内部,可以使用单引号。
'key = "value"'
"It's a long journey"
- 转义
如果要在单引号字符串的内部,使用单引号,就必须在内部的单引号前面加上反斜杠,用来转义。双引号字符串内部使用双引号,也是如此。
'Did she say \'Hello\'?'
// "Did she say 'Hello'?"
"Did she say \"Hello\"?"
// "Did she say "Hello"?"
多行拆分
- 如果长字符串必须分成多行,可以在每一行的尾部使用反斜杠。
var longString = 'Long \
long \
long \
string';
longString
// "Long long long string"
- 连接运算符(
+
)可以连接多个单行字符串,将长字符串拆成多行书写,输出的时候也是单行。
var longString = 'Long '
+ 'long '
+ 'long '
+ 'string';
转义
反斜杠(\
)在字符串内有特殊含义,用来表示一些特殊字符,所以又称为转义符。
转义 | 说明 |
---|---|
\0 |
null |
\b |
后退键 |
\f |
换页符 |
\n |
换行符 |
\r |
回车键 |
\t |
制表符表符 |
\v |
垂直制 |
\' |
单引号 |
\" |
双引号 |
\\ |
反斜杠 |
字符串与数组
字符串可以被视为字符数组,因此可以使用数组的方括号运算符,用来返回某个位置的字符(位置编号从0开始)。
var s = 'hello';
s[0] // "h"
s[1] // "e"
s[4] // "o"
// 直接对字符串使用方括号运算符
'hello'[1] // "e"
- 特出情况
如果方括号中的数字超过字符串的长度,或者方括号中根本不是数字,则返回 undefined
。
'abc'[3] // undefined
'abc'[-1] // undefined
'abc'['x'] // undefined
- 区别
但是,字符串与数组的相似性仅此而已。实际上,无法改变字符串之中的单个字符。
var s = 'hello';
delete s[0];
s // "hello"
s[1] = 'a';
s // "hello"
s[5] = '!';
s // "hello"
上面代码表示,字符串内部的单个字符无法改变和增删,这些操作会默默地失败。
length 属性
length属性返回字符串的长度,该属性也是无法改变的。
当修改时无法生效,但是不会报错。
var s = 'hello';
s.length // 5
s.length = 3;
s.length // 5
s.length = 7;
s.length // 5
字符集
JavaScript 使用 Unicode 字符集。还允许直接在程序中使用 Unicode 码点表示字符。
> '\u00A9'
'©'
输出给用户的时候,所有字符都会转成字面形式。
var f\u006F\u006F = 'abc';
foo // "abc"
JavaScript 对 UTF-16 的支持是不完整的,由于历史原因,只支持两字节的字符,不支持四字节的字符。
这是因为 JavaScript 第一版发布的时候,Unicode 的码点只编到U+FFFF,因此两字节足够表示了。
后来,Unicode 纳入的字符越来越多,出现了四字节的编码。但是,JavaScript 的标准此时已经定型了,统一将字符长度限制在两字节,导致无法识别四字节的字符。
Base64 转码
有时,文本里面包含一些不可打印的符号,比如 ASCII 码0到31的符号都无法打印出来,这时可以使用 Base64 编码,将它们转成可以打印的字符。
另一个场景是,有时需要以文本格式传递二进制数据,那么也可以使用 Base64 编码。
使用它的主要目的,不是为了加密,而是为了不出现特殊字符,简化程序的处理。
方法
JavaScript 原生提供两个 Base64 相关的方法。
btoa():任意 ASCII 码的字符转为 Base64 编码
atob():Base64 编码转为原来的 ASCII 码的字符
var string = 'Hello World!';
btoa(string) // "SGVsbG8gV29ybGQh"
atob('SGVsbG8gV29ybGQh') // "Hello World!"
- 非 ascii 编码的问题
btoa('你好') // 报错
要将非 ASCII 码字符转为 Base64 编码,必须中间插入一个转码环节,再使用这两个方法。
function b64Encode(str) {
return btoa(encodeURIComponent(str));
}
function b64Decode(str) {
return decodeURIComponent(atob(str));
}
b64Encode('你好') // "JUU0JUJEJUEwJUU1JUE1JUJE"
b64Decode('JUU0JUJEJUEwJUU1JUE1JUJE') // "你好"
原文地址
本教程采用知识共享 署名-相同方式共享 3.0协议