一个简单的筛选代码,将txt文本内的内容进行筛选,筛选出特定数字,文字,去掉重复的6位数字编码

import re
import pandas as pd

# 读取txt文件
with open('完整内容.txt', 'r', encoding='utf-8') as file:
    text = file.read()

# 提取商品编码
pattern = r'\b\d{6}\b'  # 匹配6位数字的单词
codes = re.findall(pattern, text)

# 去除重复的编码
unique_codes = list(set(codes))

# 创建DataFrame对象
df = pd.DataFrame(unique_codes, columns=['编码'])

# 保存到Excel文件
df.to_excel('筛选后的.xlsx', index=False)

一个简单的筛选代码,将txt文本内的内容进行筛选,筛选出特定数字,文字,去掉重复的6位数字编码

2023.06.07

猜你喜欢

转载自blog.csdn.net/weixin_55008315/article/details/131084782