从《牛津高阶英汉词典》中提取单词（1） - 代码天地

从《牛津高阶英汉词典》中提取单词（1）

其他 2018-10-06 23:30:17 阅读次数: 0

网上下载了一部《牛津高阶英汉词典》，想把其中单词提取出来，形成一个单词表。目的是查找有部分组合相同的单词，如“one”和“bone”、“cone”中有“one”组合相同。相同部分可以在单词前面部分，也可以是后面部分、中间部分。目的是通过正则表达式提取这样的单词，便于进行单词记忆。然而网上下载的这部词典是以多个txt文件保存在不同目录中的，需要一点一点研究从多个目录多个文件中提取单词表。就以此为目标来研究正则表达式吧。

从单个文件中提取单词表

import re

#编译正则表达式
#查找一个单词为一行且有2-50个字符的单词
p=re.compile(r"^[-a-zA-Z]{2,50}$")
f=open("B-a.txt")
result=[]
for line in f.readlines():
    if(re.match(p,line)!=None):
        result.append(line)

#查看有多少单词
print(len(result))
#显示结果
print(result)

#将数组转化为字符串
str="".join(result)

#写入"thewords.txt"中
f1=open("thewords.txt","w")
f1.write(str)
f1.close()

后续还要做很多事情。下面就要研究，如何打开多个文件夹中多个文件提取单词表。

猜你喜欢

转载自blog.csdn.net/acflair/article/details/82874155

从《牛津高阶英汉词典》中提取单词（1）

从《牛津高阶英汉词典》中提取单词（2）

利用python从《牛津高阶英汉词典》里提取单词列表

终于填了一个大坑：Python中如何处理《牛津高阶英汉词典》编码通不过问题（解决“UnicodeEncodeError”错误）

《牛津高阶英汉双解词典(第7版)-带书签》高清pdf下载链接

为ubuntu添加英汉词典

PubMed（丁香）英汉词典爬取

用java实现的英汉词典

C小项目简易英汉词典

Python中用正则表达式搜索本地英汉词典，找到具有某种pattern的单词

Python中用正则表达式搜索本地英汉词典，找到具有某种pattern的单词（2）

通过一本英汉词典理解HashMap原理

将英汉词典数据库放入MySQL数据库中，并将数据库中“以A开头的单词”显示在JSP网页上

Python C/S 网络编程（二）之 UDP 实现英汉词典查询小程序

Java实现英汉词典API初版发布在Maven 2018-09-06

浏览器插件-离线英汉词典 2018-10-12

Visual Studio Code插件-英汉词典初版发布 2018-11-06

VS Code英汉词典插件v0.0.7-尝试词性搭配 2018-12-03

2018-10-12 浏览器插件-离线英汉词典

2018-09-06 Java实现英汉词典API初版发布在Maven

搜索引擎：获取并处理mdx英汉词典文件为数据库

Python基础笔记_Day14_Python图形化界面、Python GUI、tkinter、Python英汉词典

VS Code英汉词典v0.0.8: 批量翻译文件部分命名 2018-12-25

VS Code英汉词典插件v0.0.6-改为TS实现, 加测试 2018-11-29

VS Code英汉词典进化效果演示: 翻译文件所有命名 2018-12-16

VS Code英汉词典插件v0.0.4-驼峰下划线命名 2018-11-09

2018-11-29 VS Code英汉词典插件v0.0.6-改为TS实现, 加测试

2018-11-09 VS Code英汉词典插件v0.0.4-驼峰下划线命名

吴裕雄--天生自然python学习笔记：python 用firebase实现英汉词典进阶版

设计一个小英汉词典，其中英文单词的个数为30（单词可自己任选），从键盘输入单词，程序将单词的中文解释输出，若没有找到，则输出：not found in our dictionary！

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

如何在ORACLE CLOUD中创建和访问容器集群丨内附官方文档链接

大数据从何而来?不得不知的7个数据源供应平台

mybatis抽取基类BaseMapper

[IJKPLAYER]初识

TREE KERNELS IN SVM-LIGHT---在svm-light中树核的使用（翻译）

UVa 11825 - Hackers' Crackdown DP, 枚举子集substa = (substa - 1)&sta 难度: 2

微信页面通过LocalID预览图片,getlocallmgdata

敏捷测试中的Web测试优秀实践

Spring MVC中日期转换的错误

【转】你真的了解延时队列吗

每日归档

更多

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)