第三次作业——词频统计

一、编程环境

版本:python2.7

二、程序分析

  1、读文件到缓冲区

2、处理文件,统计词频

3、输出TOP10的单词

4、主函数,进行处理

扫描二维码关注公众号,回复: 3501840 查看本文章

三、代码风格

1、python3与2不同:在print函数时:python3用print(),python3用print""。

2、python与C不同没有用到分号。

3、每一条可执行语句为一行

四、程序运行命令、运行结果截图

词频统计运行截图

五、性能分析结果及改进

1、运行总耗时

2、执行次数最多


3、 运行时间最长

六、可视化操作

下载转换 dot 的 python 代码gprof2dot 官方下载,下载完了,解压缩,将『gprof2dot.py』 copy 到当前分析文件的路径,或者你系统 PATH 环境变量设置过的路径。

(1) 性能分析:``` python -m cProfile -o result.out -s cumulative word_freq.py Gone_with_the_wind.txt``` ;分析结果保存到 result.out 文件;

(2)转换为图形;gprof2dot 将 result.out 转换为 dot 格式;再由 graphvix 转换为 png 图形格式。 命令:```python gprof2dot.py -f pstats result.out | dot -Tpng -o result.png```

转换得到图如下:

 

猜你喜欢

转载自www.cnblogs.com/tw1356961332/p/9762296.html
今日推荐