[python] python-dateutil分词得到日期时间

识别日期:
可以使用Python中的dateutil库来解析日期字符串,以下是示例代码:

from dateutil.parser import parse

text = "2022年3月30号"
date = parse(text, fuzzy=True)

print(date)
输出结果为:

2022-03-30 00:00:00
python如何分词,得到日用Python中的分词库和日期时间库。

分词:
常用的分词库有jieba、thulac、pkuseg等。以下是使用jieba分词的示例代码:

import jieba

text = "2022年3月30号是个好日子,今天是3月30号,明天就是月末了。"
words = jieba.lcut(text)

print(words)
输出结果为:

['2022', '年', '3', '月', '30', '号', '是', '个', '好', '日子', ',', '今天', '是', '3', '月', '30', '号', ',', '明天', '就', '是', '月末', '了', '。']
此外,也可以使用Python中的re模块(正则表达式)来匹配日期字符串。

识别“今天”、“月末”等特殊词汇:
可以使用Python中的datetime库来处理日期。以下是示例代码:

from datetime import datetime, date, timedelta

# 今天
today = date.today()

# 月末
last_day_of_month = date(today.year, today.month, 1) + timedelta(days=32) - timedelta(days=1)

print(today)
print(last_day_of_month)
输出结果为:

2023-03-30
2023

猜你喜欢

转载自blog.csdn.net/Trance95/article/details/129857759
今日推荐