!!!!!!!!! 什么是Base64算法 !!!!!!!!!

A:为什么在进行Http传输的时候,需要把Byte数组进行Base64编码呢?

B:这很简单呀,因为Http协议是文本协议,不同于二进制协议(如Thrift)那样直接进行二进制传输。

A:那么,直接把Byte数组转换成String不就行了吗?类似newString(bytes)这样。为什么非要用Base64呢?

B:首先,Base64是一种编码算法。为什么叫左Base64呢?因为这种算法只支持64个【可打印字符】。

Value

Char

Value

Char

Value

Char

Value

Char

0

A

16

Q

32

g

48

w

1

B

17

R

33

h

49

x

2

C

18

S

34

i

50

y

3

D

19

T

35

j

51

z

4

E

20

U

36

k

52

0

5

F

21

V

37

l

53

1

6

G

22

W

38

m

54

2

7

H

23

X

39

n

55

3

8

I

24

Y

40

o

56

4

9

J

25

Z

41

p

57

5

10

K

26

a

42

q

58

6

11

L

27

b

43

r

59

7

12

M

28

c

44

s

60

8

13

N

29

d

45

t

61

9

14

O

30

e

46

u

62

+

15

P

31

f

47

v

63

/


A:为什么只能支持64个字符呢,多了不是更好吗?可打印字符又是什么意思?

B:这就涉及到ASCII码的知识了。ASCII码的范围是0-127,其中0-31和127这33个字符属于控制字符(Controlcharacters)。剩下32-126这95个字符属于可打印字符(Printable characters),包含数字、大小写字母、常用符号。在这里我只列举其中的一部分:

控制字符:

可打印字符:

B:早起的一些传输协议,例如传输邮件的SMTP协议,只能传输可打印的ASCII字符。导致原本8Bit的字节码(范围0-255)超过了可用的范围。比如当邮件传输图片资源的时候,某一个Byte值是10111011B,对应十进制187不属于ASCII码范围,因此无法被传输。这个时候,Base64编码应用而生了,它利用6bit字符表达了原本的8bit字符。Base64可以把原本ASCII码的控制字符甚至ASCII码之外的字符都转换成可打印的6big字符。

A:可是原本的字节码8bit,Base64怎么能够用6big来容纳8bit的内容呢?

B:既然单一字符的位数有限,我们可以增加字符的数量。8和6的最小公倍数是24,这就意味着我们可以用4个Base64字符来表示3个传统的8bit字符。

B:像表格中这样,8Bit X 3的字符串可以每6个bit分成一组,每一组bit对应一个十进制的index,每一个index值又对应了Base64的字符。最终,8bit的字符串[Man]编码成了Base64的[TWFu]。相比8bit的字符编码,Base64编码会多占用三分之一的字节长度,以此为代价实现了更好的兼容性。

A:那么如果原本的8Bit字符串长度不是3的倍数,比如长度是13,多余的那一个字符怎么编码呢?

B:很好解决,多余的8bit中,前6bit做为一个Base64字符,剩下的2bit做为第二个Base64字符的前两位,后面的四位补0即可。至于第三第四个Base64字符,没有匹配的8bit字符,则使用[=]字符填充(Padding)。如下图把8bit的[M]编码成Base64的[TQ==]。

A:明白啦。那么一个经过Base64编码的字符串,如何进行解码呢?

B:解码也是同样道理,6bit X 4的字符串可以每8bit分成一组,共3组。每一组转换成一个8位的Byte字节。

A:OK,最后一个问题,Base64是否可以用来对重要信息做加密呢?

B:不行的。Base64只是一种编码算法,而非加密算法。任何人都可以将Base64的编码结果解码成唯一的原文。真正的加密算法有很多,包括MD5,SHA,ASE,RSA等等,有时间的话会一一介绍。

https://blog.csdn.net/wufaliang003/article/details/79573512

猜你喜欢

转载自blog.csdn.net/m0_37477061/article/details/88945999