一、题目描述
小华负责公司知识图谱产品,现在要通过新词挖掘完善知识图谱。
新词挖掘: 给出一个待挖掘文本内容字符串Content和一个词的字符串word,找到content中所有word的新词。
新词:使用词word的字符排列形成的字符串。
请帮小华实现新词挖掘,返回发现的新词的数量。
二、输入描述
第一行输入为待挖掘的文本内容content
第二行输入为词word
三、输出描述
在中找到的所有word的新词的数量
四、解题思路
- 首先读取输入的待挖掘的文本内容 content 和词 word;
- 将词 word 转换为字符数组,并对字符数组进行排序,得到排好序的字符串 wordStr;
- 获取词 word 的长度 len;
- 初始化变量 count 为 0,用于记录新词的数量;
- 如果待挖掘文本内容的长度小于词的长度,则直接输出 count,表示没有新词;
- 使用循环从 0 到 line.length()-len,依次截取与词长度相等的子串进行处理:
- 计算子串的结束位置 j;
- 将子串转换为字符数组,并对字符数组进行排序,得到排好序的字符串 str2;
- 如果 str2 与 wordStr 相等,则说明找到了一个新词ÿ