栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

【算法】重复的DNA序列

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

【算法】重复的DNA序列

概述:

        第一次写博客,记录一下算法的解析过程,以后也会不定期更新一些算法

        解决方案主要为java

        以下算法题目来源于力扣

        本题连接:力扣https://leetcode-cn.com/problems/repeated-dna-sequences/


问题描述

题目:

DNA序列 由一系列核苷酸组成,缩写为 'A', 'C', 'G' 和 'T'.。

例如,"ACGAATTCCG" 是一个 DNA序列 。
在研究 DNA 时,识别 DNA 中的重复序列非常有用。

给定一个表示 DNA序列 的字符串 s ,返回所有在 DNA 分子中出现不止一次的 长度为 10 的序列(子字符串)。你可以按 任意顺序 返回答案。

示例 1:

输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC","CCCCCAAAAA"]

示例 2:

输入:s = "AAAAAAAAAAAAA"
输出:["AAAAAAAAAA"]

题目分析:

 想法:使用滑动窗口 窗口大小设置为 10 ,从左至右依次处理字符串s,每次得到窗口的为s[i]-10为开头,s[i]-1为结尾的字符串(substring()方法含头不含尾,所以代码中不需要-1),依次放入到map中使用getOrDefault()方法,获取每次当前窗口的字符串为key的值,不存在则用默认值,存在则保存到新的list中并返回 


解决方案:
 public static List findRepeatedDnaSequences(String s) {
        int len = s.length();
        if (len < 10) return new ArrayList<>();
        Map map = new HashMap<>();
        List list = new ArrayList();
        for (int i = 10; i <= len; i++) {
            String sub = s.substring(i - 10, i);
            Integer orDefault = map.getOrDefault(sub, 0);//当前map如果有此key则用对应的value值,没有则用默认值
            if (orDefault >= 1) {//如果大于1证明不是第一次出现
                list.add(sub);
            }
            map.put(sub,orDefault+1);
        }
        return list;
    }

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/825216.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号