Spark动态DataFrame实现

大数据系统更新时间：2026-04-08 00:12:27 发布时间：1518天前 IT归档最新发布模块sitemap 名妆网法律咨询聚返吧英语巴士网伯小乐网商动力

在Spark中如何实现在运行中，如何动态修改Dataframe表结构呢？
您可以参照以下，动态添加gender，address的方式

test("动态Dataframe测试"){
    val frame = spark.table("app_offline.task_table_zhihuiya")
    val schema: StructType = frame.schema
      .add("gender", StringType)
      .add("address", StringType)
    frame
      .map(row=>{
        // 得到Row中的数据并往其中添加我们要新增的字段值
        val buffer = Row.unapplySeq(row).get.toBuffer
        buffer.append("男") //增加一个性别
        buffer.append("北京") //增肌一个地址
        // 获取原来row中的schema,并在原来Row中的Schema上增加我们要增加的字段名以及类型.
        val schema: StructType = row.schema
          .add("gender", StringType)
          .add("address", StringType)
        // 使用Row的子类GenericRowWithSchema创建新的Row
        val newRow: Row = new GenericRowWithSchema(buffer.toArray, schema)
        // 使用新的Row替换成原来的Row
        newRow
      })(RowEncoder(schema))
      .printSchema()
  }

转载请注明：文章转载自 www.mshxw.com

本文地址：https://www.mshxw.com/it/730541.html

上一篇 JAVA 实现《复杂迷宫》游戏｜CSDN创作打卡

下一篇 flink 1.10.1 cep java版本实现复杂事件模式匹配

大数据系统相关栏目本月热门文章

关于我们文章归档网站地图联系我们