栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

2021春实习系列 ------字节跳动

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

2021春实习系列 ------字节跳动

字节朝夕光年游戏部门:强化学习算法工程师

投了了字节,还在准备就收到了面试邀约,然后就挂了 T_T,进大厂还是得好好准备一下

面试问题:

  1. 自我介绍
  2. 项目细节
  3. 项目中智能体如何感知环境
  4. DDPG算法细节以及一些关键的伪代码
  5. DDPG改进算法
  6. Soft Actor-Critic算法?
    1. Soft Actor-Critic (SAC)是面向Maximum Entropy Reinforcement learning 开发的一种off policy算法,和DDPG相比,Soft Actor-Critic使用的是随机策略stochastic policy,相比确定性策略具有一定的优势

    2.  

编程题

 岛屿问题

class Solution:

    def dfs(self, grid, r, c):

        grid[r][c] = 0

        nr, nc = len(grid), len(grid[0])

        for x, y in [(r+1, c), (r-1, c), (r, c+1), (r, c-1)]:

            if 0 <= x < nr and 0 <= y < nc and grid[x][y] == '1':

                self.dfs(grid, x, y)

    def numIslands(self, grid: List[List[str]]) -> int:

        nr = len(grid)

        if nr == 0:

            return 0

        nc = len(grid[0])

        numIslands = 0

        for r in range(nr):

            for c in range(nc):

                if grid[r][c] == '1':

                    numIslands += 1

                    self.dfs(grid, r, c)

        return numIslands

 

 

转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/284237.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号