什么是Base64算法

A:为什么在进行Http传输的时候,需要把Byte数组进行Base64编码呢?

B:这很简单呀,因为Http协议是文本协议,不同于二进制协议(如Thrift)那样直接进行二进制传输。

A:那么,直接把Byte数组转换成String不就行了吗?类似newString(bytes)这样。为什么非要用Base64呢?

B:首先,Base64是一种编码算法。为什么叫左Base64呢?因为这种算法只支持64个【可打印字符】

Value Char Value Char Value Char Value Char
0 A 16 Q 32 g 48 w
1 B 17 R 33 h 49 x
2 C 18 S 34 i 50 y
3 D 19 T 35 j 51 z
4 E 20 U 36 k 52 0
5 F 21 V 37 l 53 1
6 G 22 W 38 m 54 2
7 H 23 X 39 n 55 3
8 I 24 Y 40 o 56 4
9 J 25 Z 41 p 57 5
10 K 26 a 42 q 58 6
11 L 27 b 43 r 59 7
12 M 28 c 44 s 60 8
13 N 29 d 45 t 61 9
14 O 30 e 46 u 62 +
15 P 31 f 47 v 63 /

A:为什么只能支持64个字符呢,多了不是更好吗?可打印字符又是什么意思?

B:这就涉及到ASCII码的知识了。ASCII码的范围是0-127,其中0-31和127这33个字符属于控制字符(Controlcharacters)。剩下32-126这95个字符属于可打印字符(Printable characters),包含数字、大小写字母、常用符号。在这里我只列举其中的一部分:

 

B:早起的一些传输协议,例如传输邮件的SMTP协议,只能传输可打印的ASCII字符。导致原本8Bit的字节码(范围0-255)超过了可用的范围。比如当邮件传输图片资源的时候,某一个Byte值是10111011B,对应十进制187不属于ASCII码范围,因此无法被传输。这个时候,Base64编码应用而生了,它利用6bit字符表达了原本的8bit字符。Base64可以把原本ASCII码的控制字符甚至ASCII码之外的字符都转换成可打印的6big字符。

A:可是原本的字节码8bit,Base64怎么能够用6big来容纳8bit的内容呢?

B:既然单一字符的位数有限,我们可以增加字符的数量。8和6的最小公倍数是24,这就意味着我们可以用4个Base64字符来表示3个传统的8bit字符。

B:像表格中这样,8Bit X 3的字符串可以每6个bit分成一组,每一组bit对应一个十进制的index,每一个index值又对应了Base64的字符。最终,8bit的字符串[Man]编码成了Base64的[TWFu]。相比8bit的字符编码,Base64编码会多占用三分之一的字节长度,以此为代价实现了更好的兼容性。

A:那么如果原本的8Bit字符串长度不是3的倍数,比如长度是13,多余的那一个字符怎么编码呢?

B:很好解决,多余的8bit中,前6bit做为一个Base64字符,剩下的2bit做为第二个Base64字符的前两位,后面的四位补0即可。至于第三第四个Base64字符,没有匹配的8bit字符,则使用[=]字符填充(Padding)。如下图把8bit的[M]编码成Base64的[TQ==]。

A:明白啦。那么一个经过Base64编码的字符串,如何进行解码呢?

B:解码也是同样道理,6bit X 4的字符串可以每8bit分成一组,共3组。每一组转换成一个8位的Byte字节。

A:OK,最后一个问题,Base64是否可以用来对重要信息做加密呢?

B:不行的。Base64只是一种编码算法,而非加密算法。任何人都可以将Base64的编码结果解码成唯一的原文。真正的加密算法有很多,包括MD5,SHA,ASE,RSA等等,
--------------------- 
作者:HelloWorld搬运工 
来源:CSDN 
原文:https://blog.csdn.net/wufaliang003/article/details/79573512 
版权声明:本文为博主原创文章,转载请附上博文链接!

猜你喜欢

转载自blog.csdn.net/qq_40452317/article/details/90144390