栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > C/C++/C#

1008 lc.187 hash 滑动窗口 位运算

C/C++/C# 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

1008 lc.187 hash 滑动窗口 位运算

lc.187 重复的DNA序列

所有 DNA 都由一系列缩写为 ‘A’,‘C’,‘G’ 和 ‘T’ 的核苷酸组成,例如:“ACGAATTCCG”。在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。
编写一个函数来找出所有目标子串,目标子串的长度为 10,且在 DNA 字符串 s 中出现次数超过一次。

  • C++ hash
class Solution {
    const int L=10;
public:
    vector findRepeatedDnaSequences(string s) {
        vector ans;
        unordered_map cnt;
        int n=s.size();
        for(int i=0;i<=n-L;i++)
        {
            string sub = s.substr(i,L);
            if(++cnt[sub]==2)
            {
                ans.push_back(sub);
            }
        } 

        return ans;

    }
};

注意到:···int n=s.size(); for(int i=0;i<=n-L;i++){ ···

写为:···for(int i=0;i<=s.size()-L;i++){ ···

测试用例:“AA”

报错:terminate called after throwing an instance of ‘std::out_of_range’
what(): basic_string::substr: __pos (which is 3) > this->size() (which is 2)

错误来自于。.size() .length() 的返回值,类型为string::size_name 是 unsigned int ,需要说明。原代码可以写为:···for(int i=0;i<=(int)s.size()-L;i++){···

  • C++ hash 滑动窗口 位运算
class Solution {
    const int L = 10;
    unordered_map bin = {{'A', 0}, {'C', 1}, {'G', 2}, {'T', 3}};
public:
    vector findRepeatedDnaSequences(string s) {
        vector ans;
        int n = s.length();
        if (n <= L) {
            return ans;
        }
        int x = 0;
        for (int i = 0; i < L - 1; ++i) {
            x = (x << 2) | bin[s[i]];
        }                                     //初始化第一个10位整数
        unordered_map cnt;
        for (int i = 0; i <= n - L; ++i) {
            x = ((x << 2) | bin[s[i + L - 1]]) & ((1 << (L * 2)) - 1);
            if (++cnt[x] == 2) {
                ans.push_back(s.substr(i, L));
            }
        }
        return ans;
    }
};
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/304042.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号