目录
任务一:影响粤港澳大湾区经济发展的因素分析
通过分析历史经济数据、人口统计数据、科技投入、物流基础设施等数据,识别对区域经济发展的关键影响因素。我们使用主成分分析(PCA)和回归分析来确定这些因素对经济的贡献。
1.1 主成分分析 (PCA)
主成分分析能减少高维数据的复杂性,提取出对经济影响较大的主要因素。假设我们有粤港澳大湾区的经济、人口和科技等相关数据。
import pandas as pd
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
# 加载数据,包含GDP、人口、科技投入等列
data = pd.read_csv("gdp_population_tech.csv")
features = data.columns[1:] # 选取特征列
# 数据标准化
scaler = StandardScaler()
scaled_data = scaler.fit_transform(data[features])
# PCA模型构建,提取出2个主成分
pca = PCA(n_components=2)
prin