《统计学习方法(第2版)》李航 第21章 PageRank算法 思维导图笔记 及 课后全部习题答案

思维导图:
在这里插入图片描述

21.1

假设方阵A是随机矩阵,即其每个元素非负,每列元素之和为1,证明 A k A^{k} Ak仍然是随机矩阵,其中 k k k是自然数。

证明:
A A A左乘一个维度匹配的全1行向量 1 ⃗ \vec{1} 1 ,由于 A A A的每列和为1,很容易得到:
1 ⃗ A = 1 ⃗ \vec{1}A=\vec{1} 1 A=1
对上式左右两边同时右乘 A A A
1 ⃗ A A = 1 ⃗ A = 1 ⃗ \vec{1}AA=\vec{1}A=\vec{1} 1 AA=1 A=1
继续右乘可以得到:
1 ⃗ A A ⋯ A = 1 ⃗ A k = 1 ⃗ \vec{1}AA\cdots A=\vec{1}A^{k}=\vec{1} 1 AAA=1 Ak=1
所以可知, A k A^{k} Ak的列和仍为1,且由于 A A A矩阵元非负,则 A k A^{k} Ak矩阵元也非负,从而 A k A^{k} Ak仍然是随机矩阵。

21.2

21.1中,以不同的初始分布向量 R 0 R_{0} R0进行迭代,仍然得到同样的极限向量R,即PageRank。请验证。

import numpy as np

# 转移矩阵
M = np.array([[0, 1/2, 1, 0],
              [1/3, 0, 0, 1/2],
              [1/3, 0, 0, 1/2],
              [1/3, 1/2, 0, 0]])
for i in range(10):
    # 初始分布
    R = np.random.rand(4)
    R = R/R.sum()
    R = R.reshape(-1, 1)
    R0 = R.copy()
    # 随机游走至平稳分布
    for it in range(50):
        R = M @ R
    print(f'initial distribution: {
      
      R0.flatten()}; \nstable distribution: {
      
      R.flatten()}')
initial distribution: [0.24697151 0.26575696 0.2898751  0.19739643]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.39485346 0.34551297 0.22141822 0.03821535]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.3387591  0.19579477 0.4138945  0.05155163]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.14250389 0.13229843 0.30052453 0.42467315]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.30121191 0.20229278 0.26254228 0.23395303]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.39822858 0.16880009 0.37616601 0.05680532]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.42321595 0.20045165 0.1557964  0.22053601]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.54996468 0.14861743 0.07831592 0.22310196]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.05029815 0.75301906 0.05574401 0.14093879]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]
initial distribution: [0.00441943 0.44599523 0.21180946 0.33777588]; 
stable distribution: [0.33333333 0.22222222 0.22222222 0.22222222]

可以发现平稳分布都是相同的。

21.3

证明PageRank一般定义中的马尔可夫链具有平稳分布,即式(21.11)成立。

这个太数学了感觉,就说一下图像理解得了。一般定义的转移矩阵一定存在唯一的,特征值为1的特征向量,即平稳分布。

21.4

证明随机矩阵的最大特征值为1。

对于一个矩阵作用到一个向量,比如某个特征向量,如果其本征值大于1,表明几何上这个向量被拉伸/放大了,而随机矩阵列和为1,决定了其矩阵元素不超过1,且其非负,这都无法使一个随机矩阵有物理意义上的放大/拉伸能力。

猜你喜欢

转载自blog.csdn.net/qq_26928055/article/details/125143728