187. 重复的DNA序列
所有 DNA 都由一系列缩写为 ‘A’,‘C’,‘G’ 和 ‘T’ 的核苷酸组成,例如:“ACGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。
示例 1:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:
输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
提示:
0 <= s.length <= 105
s[i] 为 'A'、'C'、'G' 或 'T'
题解:
本题就是让你去找出所有长度为10的出现一次以上的连续子串。
- 由于我们找的是子串必定是连续的,因此可以使用
滑动窗口
的思想来得到所有组合的子串。接着在遍历子串的过程中,对于每次拿到的子串我们都放进map
中,每次放入后我们要
查询一下map
中一个键值是否已经有两个value
了,一旦有则将该子串存入list
中,最后返回list
即可;
注意的是map
的getOrDefault(k,v)
方法是获得map
中键值为k
的v
,如果在map
中没有找到该键值k
的话则拿到0;
代码 :
class Solution {
public List<String> findRepeatedDnaSequences(String s) {
int L = 10;
Map<String,Integer> map = new HashMap<>();
List<String> list = new ArrayList<>();
for(int i=0;i<=s.length()-L;i++){
String subs = s.substring(i, i + L);
map.put(subs,map.getOrDefault(subs,0)+1); //按照k,v放置,v在第一次设置时设置为1,后续随着出现相同的k时增加v
if(map.get(subs)==2){
list.add(subs);
}
}
return list;
}
}