数据清洗报告

  1、根据数据库单位名称,利用百度地图API查询,可以将地址转换为经纬度,然后根据经纬度,通过百度地图提供的逆地理编码服务,将坐标转换为对应位置信息。

  2、学习了机器算法初级知识,大体了解了sklearn的字典特征抽取、文本特征抽取。重点了解了TF-IDF特征抽取,以及了解了归一化和标准化相关公式,还有低方差特征过滤。唯一不好的一点——以上方法,都是到什么时候用呢?怎样结合起来用?用了会导致什么后果呢?还有很多没有理解的地方,现在只是在机械的模仿,甚至跳出样例数据,就不知道该如何写了。

猜你喜欢

转载自www.cnblogs.com/YXSZ/p/12483628.html