Leetcode.187. 重复的DNA序列---哈希+ 滑动窗口

187. 重复的DNA序列

所有 DNA 都由一系列缩写为 ‘A’,‘C’,‘G’ 和 ‘T’ 的核苷酸组成,例如:“ACGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。

示例 1:

输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]
示例 2:

输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]
 

提示:

0 <= s.length <= 105
s[i] 为 'A'、'C'、'G' 或 'T'

题解:

本题就是让你去找出所有长度为10的出现一次以上的连续子串。

  • 由于我们找的是子串必定是连续的,因此可以使用滑动窗口的思想来得到所有组合的子串。接着在遍历子串的过程中,对于每次拿到的子串我们都放进map中,每次放入后我们要
    查询一下map中一个键值是否已经有两个value了,一旦有则将该子串存入list中,最后返回list即可;

注意的是mapgetOrDefault(k,v)方法是获得map中键值为kv,如果在map中没有找到该键值k的话则拿到0;

代码 :

class Solution {
    
    
    public List<String> findRepeatedDnaSequences(String s) {
    
    
        int L = 10;
        Map<String,Integer> map = new HashMap<>();
        List<String> list = new ArrayList<>();

        for(int i=0;i<=s.length()-L;i++){
    
    
            String subs = s.substring(i, i + L);
            map.put(subs,map.getOrDefault(subs,0)+1); //按照k,v放置,v在第一次设置时设置为1,后续随着出现相同的k时增加v
            if(map.get(subs)==2){
    
    
                list.add(subs);
            }
            
        }

        return list;
    }
}

猜你喜欢

转载自blog.csdn.net/xiangguang_fight/article/details/120670649