A.valcounts=textFile.map(line=>line.split(“”)).map(-rd=>(word,1)).reduceByKey(_+_)
B.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).reduceByKey(_+_)
C.valcounts=textFile.map(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
D.valcounts=textFile.flatMap(line=>line.split(“”)).map(word=>(word,1)).groupByKey(_+_)
您可能感兴趣的试卷
你可能感兴趣的试题
A.taildir
B.Log4j
C.JMS
D.Thrift
A.submit命令可以让作业的状态变为PREP
B.statr命令可以让PREP状态的作业变为RUNNING
C.run命令可以让作业状态变为Running
D.kill命令可以作用在PREP/SUSPEND/RUNNING状态的作业上
A.复杂事物操作
B.计算器应用:例如统计某个网站的登录人数
C.一条消息被多个消费者同时消费且保证消息被所有订阅者成功消费的消息队
D.取最新N个数据:例如对某条微博,获取最新的10个评论
A.Kafka是一个高吞吐、分布式、基于发布订阅的消息系统
B.Kafka可以做到消息的持久化
C.Kafka适用于离线和在线的消息消费场景
D.Kafka可以保证每个Partion内的消息有序
A.Spark
B.Streaming
C.MapReduce
D.HDFS
A.kafkaadmin组
B.kafka组
C.kafkasuperuser组
A.按照源文件名,直接生成文件
B.设置文件生成间隔,达到时间间隔时就关闭老文件,新数据将被写入新文
C.设置单个文件大小,当文件大小达到所设定值时,就关闭老文件,新数据
D.设置单个文件存放在event数量,当文件所存放event数量到设定值时
最新试题
由于Spark是基于内存的计算引擎,因此,一个Spark应用可以处理的数据量不能超过分给这个Spark应用的内存总和。()
FusionLnsigt HD用户想通过HBase shell操作来查询某个HBase表中的内容,这中场景下推荐管理员给这个用户分配一个机机账号。()
Fusionlnsight HD中,关于Hive的数据加载功能(通过Hivede LOAD命令导入数据),以下叙述错误的是?()
在Kafka中,关于Consumer说法正确的是()。
Fusionlnsight HD关于Oozie的作业操作命令,下列哪几项叙述是正确的?()
关于Kafka的特点如下᧿述正确的是?()
Fusionlnsight HD中,Streaming打包工具用于将业务代码jar包和其他所依赖的jar包等,打包成一个完整的Streaming应用的jar包。()
在集群正常的情况下,Redis客户端发起一次get调用,客户端跟服务端有()次消息交互。
Fusionlnsight HD中,一个部署在Tomcat上的应用,需访问HBase服务,这种场景下推荐使用机机账号。()
关于Redis特点,下面叙述正确的是?()