NLP“正则匹配分词“什么意思 - 代码天地

NLP“正则匹配分词“什么意思

企业开发 2023-07-25 17:47:53 阅读次数: 0

今天在看NLP代码的时候，有一段代码没有看懂：

    def _regex_match(self, smiles):
        tokenized = []
        for smi in smiles:
            tokens = self.prog.findall(smi)
            tokenized.append(tokens)

        return tokenized

tokens = self._regex_match(sents1)

通过正则匹配对第一个句子（sents1）进行分词，得到tokens。

正则匹配分词是将输入的序列按照特定的规则进行分割和标记的过程（其实就是将句子拆分成多个token的过程）。正则表达式是一种用于匹配字符串的表达式，通过定义一系列模式来描述要匹配的字符串的规则。在这段代码中，"_regex_match"方法使用了一个正则表达式引擎（self.prog）来对输入的SMILES序列进行正则匹配的操作。

具体而言，该方法将遍历输入的SMILES序列，并对每个SMILES字符串进行正则匹配操作。匹配的结果是根据预定义的正则表达式模式，提取出符合规则的子字符串作为分词结果。这些分词结果将被存储在一个列表 tokenized = [] 中，并作为方法的返回值。

通过正则匹配分词，可以将输入的SMILES序列拆分成一组符号和操作符，以便进一步处理和分析分子的结构和属性。

猜你喜欢

转载自blog.csdn.net/weixin_43135178/article/details/131881384

NLP“正则匹配分词“什么意思

正则匹配分组

最大正向匹配分词

最大匹配分词算法

正则表达式的多行匹配是什么意思

分词学习(1)--正向最大匹配分词

正则表达式 /\{\{(.+?)\}\}/g是什么意思

关于正则的符号，获取控制都代表什么意思？

正则表达式：(?=a)是什么意思？

"?:"在正则表达式中什么意思

正则表达式中的“\.“表示什么意思

bash什么意思

@@trancount什么意思

++是什么意思？

Forbidden什么意思

带宽什么意思？

XHR什么意思?

if(a)是什么意思

ORM是什么意思

var $this = $(this)是什么意思？

href="#" 是什么意思？

directx是什么意思？

renderCommnet是什么意思

tar zxvf 什么意思?

[Ruby]$: 是什么意思

myeclipse emacs什么意思

doctype html 什么意思

SP是什么意思

oracle 冒号什么意思

seosem是什么意思？

今日推荐

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

Spring Boot 3.0：未来企业应用开发的基石

Java 的 AI 前景光明

国内首个智能体生态大会！2024百度万象大会定档5月30日

开源一周年，青语言新版发布

深入浅出：大型语言模型（LLM）的全面解读

顶会ICLR2024论文Time-LLM：基于大语言模型的时间序列预测

周排行

学习笔记(01):Python入门教程-计算机如何区分数字和字符

命令行提示符_颜色

五步轻松搞定Linux下的文件同步(备份)

Visio 2010，如何打开多个窗口

西安新起点|MBA考研十大热门城市

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

【蓝桥杯】ADV-73 数组输出

[DeeplearningAI笔记]卷积神经网络4.11一维和三维卷积

Java 逻辑运算符

Python爬虫入门——2. 5 利用正则表达式爬取豆瓣电影 Top 250

每日归档

更多

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)