栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Java

spark统计PVUV

Java 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

spark统计PVUV

import org.apache.spark.{SparkConf, SparkContext}

object PvUv {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("stone").setMaster("local")

    val sc = new SparkContext(conf)
    sc.setLogLevel("ERROR")

    val file = sc.textFile("data/pvuvdata" , 10)

    //userid 山东 2018-11-12 1542011088714  3445974150374613566  www.jd.com Buy


    file.map(x => (x.split("t")(5) , 1) ).reduceByKey(_+_).take(5).foreach(println)

   println("---------------uv---------------")


    val keys = file.map(
      line => {
        var strs = line.split("t")
        (strs(5), strs(0))
      }
    )

     keys.distinct().map(k => (k._1 ,1) ).reduceByKey(_+_).sortBy(_._2  ,ascending = false).take(5).foreach(println)

  }


}
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/709130.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号