栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 前沿技术 > 大数据 > 大数据系统

2021唯品会秋招数据开发岗笔试题

2021唯品会秋招数据开发岗笔试题

2021唯品会秋招数据开发岗笔试题
    • 题型分布
    • 单选题
    • 多选题
    • 问答题
    • 简答题

由于过了一段时间才写这篇博客,有些题目已经记不清了,同时也没有找到相同的题目,因此只能简单描述,多见谅。

题型分布

单选题X10
不定项选择题X2
问答题X5
简答题X1

单选题
  1. Hadoop HDFS Client端上传文件到HDFS上的时候下列正确的是
    A. 数据经过NameNode传递给DataNode
    B. 数据副本将以管道的方式依次传递
    C. Client将数据写到一台DataNode上,并由Client负责完成Block复制工作
    D. 当某个DataNode失败,客户端不会继续传给其它的DataNode

  2. 在Java多线程中,下面哪种方式不会使线程进入阻塞状态()
    A. sleep()
    B. Suspend()
    C. yield()
    D. wait()

  3. 下列说法正确的有
    A. class中的constructor不可省略
    B. constructor必须与class同名,但方法不能与class同名
    C. constructor在一个对象被new时执行
    D. 一个class只能定义一个constructor

  4. mapper, partitioner, combiner, shuffle的执行顺序

  5. 以下哪个不是Spark的组件
    A. DAG Scheduler
    B. Multi Scheduler
    C. Task Scheduler
    D. Spark Context

  6. 下列结构中,插入性能最高的是
    A. ArrayList
    B. linkedlist
    C. tor
    D. Collection

  7. 以下哪些继承自 Collection 接口()
    A. List
    B. Set
    C. Map
    D. Array

  8. abstract方法

  9. 不能保证线程安全的是 volatile

  10. 下面哪个不属于Reducer阶段
    A. Shuffle
    B. Sort
    C. Map
    D. Reduce

多选题
  1. SparkContext可以从哪些位置读取数据
    A. 本地磁盘
    B. web
    C. hdfs
    D. 内存

  2. Scala语言中,一个函数可以定义在
    A. Class
    B. Object
    C. Main
    D. 构造函数

问答题
  1. 快速从数组中查找第K大元素
  2. 用MapReduce和Spark实现wordcount
  3. namenode HA配置
  4. spark中数据倾斜的问题
  5. spark on yarn作业执行情况,yarn-client和yarn cluster有什么区别?
简答题
  1. 什么是过拟合?过拟合的解决方法?过拟合在训练集和测试集中的表现。
  2. 简述产生过拟合的原因
  3. 有什么减轻过拟合的方法?
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/582470.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号