禁止转载,原文:https://blog.csdn.net/qq_45801887/article/details/140088365
参考教程:B站视频讲解——https://space.bilibili.com/3546616042621301
- 有帮助麻烦点个赞 ~ ~
Python123题库
2024政府工作报告数据提取
附件中文件为2024政府工作报告.txt
,本题要求将报告中所有包含数字字符的短句(*)进行提取。
短句:将中文标点符号替换为英文空格,然后将报告数据按英文空格进行分割得到的列表中的字符串。
['"', '#', '$', '%', '&', ''', '(', ')', '*', '+', ',', '-', '/', ':', ';', '<', '=', '>', '@', '[', '\', ']', '^', '_', '`', '{', '|', '}', '~', '⦅', '⦆', '「', '」', '、', '\u3000', '、', '〃', '〈', '〉', '《', '》', '「', '」', '『', '』', '【', '】', '〔', '〕', '〖', '〗', '〘', '〙', '〚', '〛', '〜', '〝', '〞', '〟', '〰', '〾', '〿', '–', '—', '‘', '’', '‛', '“', '”', '„', '‟', '…', '‧', '﹏', '﹑', '﹔', '·', '.', '!', '?', '。', '。']
本题使用上述中文标点符号集
编程要求
输入一个关键词key
。
- 如果该关键词key在报告中出现,则统计输出该关键字key在报告中出现的次数,并按照报告中出现顺序依次输出包含该关键词key所有短 句,以换行间隔。
- 如果输入的关键词key为数字短句,则输出所有包含数字的短句,以换行间隔。
- 除以上情况外如果输入的关键词在报告中没有出现过,则输出未找到关键词
测试说明 根据关键词查询的结果,必须按照报告中出现顺序输出。
格式示例:
输入1:
卫生
输出1:
5
医药卫生
提高医疗卫生服务能力
扩大基层医疗卫生机构慢性病
精神卫生
深入开展健康中国行动和爱国卫生运动
输入2:
数字短句
输出2:(要求输出所有数字短句,此示例仅展示部分数据)
2024年3月5日在第十四届全国人民代表大会第二次会议上
2023年工作回顾国内生产总值超过126万亿元
增长5.2%
... ...
输入3:
湖北
输出3:
未找到关键词