该【2025年Spark期末练习题库 】是由【小屁孩】上传分享,文档一共【13】页,该文档可以免费在线阅读,需要了解更多关于【2025年Spark期末练习题库 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..去留无意,闲看庭前花开花落;宠辱不惊,漫随天外云卷云舒。——《幽窗小记》()。[单选题]*A、Sca1aB、JavaC、Lispl(正确答案)D、,下列属于动作Action类型的操作是()。[单选题]*A、Count(正确答案)B、mapC、filterD、()*A、StandaloneHA模式(正确答案)B、Local模式C、Sparkonyarn模式D、()。[单选题]*:..百学须先立志。——朱熹A、count():返回数据集中的元素个数B、take(n):返回数据集中的第n个元素(正确答案)C、map(fwnc)t将每个元素传递到函数func中,并将结果返回为一个新的数据集D、filter(funs):筛选出满足函数tung的元素,()[单选题]*A、joneB、filter(正确答案)C、groupD、()[单选题]*A、mapB、flatMapC、reduceByKey(正确答案)D、,正确的是()[单选题]*A、退出安全模式:hadoopdfsadmin-safemodeleave(正确答案)B、退出安全模式:hadoopdfs-safemodeleaveC、进入安全模式:hadoopdfs-safemodeenterD、进入安全模式:()[单选题]*A、MEMORY_ONLY(正确答案):..人人好公,则天下太平;人人营私,则天下大乱。——刘鹗B、MEMORY_ONLY_SERC、NEMORY_AND_DlSKD、()[单选题]*A、随处运行B、代码简洁C、使用复杂(正确答案)D、()[单选题]*A、SparkStreamingB、MibC、GraphxD、SparkR(正确答案)()[单选题]*A、8080B、4040C、8090(正确答案)D、()[单选题]*A、FIFOQ(正确答案)B、FAIR:..不飞则已,一飞冲天;不鸣则已,一鸣惊人。——《韩非子》C、无D、()[单选题]*A、=trueB、显式指定本地运行C、finalStage无父StageD、partition默认值(正确答案)()[单选题]*A、可分区B、可序列化C、可修改(正确答案)D、,下面哪个是错误的()[单选题]*A、任何函数调用B、是只读的C、存储在各个节点D、存储在磁盘或HDFS(正确答案)()[单选题]*A、NameNode在启动时会自动进入安全模式B、NameNode只有在安全启动模式下才会进入安全模式(正确答案)C、安全模式是一种状态,文件系统不允许有任何修改:..以铜为镜,可以正衣冠;以古为镜,可以知兴替;以人为镜,可以明得失。——《旧唐书·魏征列传》D、进入安全模式后,系统会显示NameNodeinsafemode,,下面哪个是错误的()[单选题]*A、支持加法B、支持数值类型C、可并行D、不支持自定义类型(正确答案)()[单选题]*A、standaloneB、sparkonmesosC、sparkonYARND、Sparkonlocal(正确答案)()[单选题]*A、Partition(正确答案)B、JobC、StageD、()[单选题]*A、httpB、niotyD、Akka(正确答案):..好学近乎知,力行近乎仁,知耻近乎勇。——《中庸》()[单选题]*A、ZooKeeperB、FileSystemC、NONED、hadoop(正确答案)()[单选题]*A、DriverprogramB、sparkmasterC、workernode(正确答案)D、()[单选题]*A、没区别B、多会话(正确答案)C、支持网络环境D、()[单选题]*A、科学统计支持B、多schema(正确答案)C、存储方式不—样D、()[单选题]*:..人人好公,则天下太平;人人营私,则天下大乱。——刘鹗A、通知driverB、通知workerC、注册applicationD、直接ALIVE(正确答案)—项不是applicationMaster的功能()[单选题]*A、数据切分B、为应用程序申请资源,并进一步分配给内部任务C、任务监控与容错D、所有应用的管理者(正确答案)()[单选题]*A、位置优先B、分布式C、弹性D、固定大小(正确答案)()[单选题]*A、数据量大B、数据类型多C、处理速度快D、价值密度高(正确答案)()[单选题]*A、数据量大:..以铜为镜,可以正衣冠;以古为镜,可以知兴替;以人为镜,可以明得失。——《旧唐书·魏征列传》B、数据类型单—(正确答案)C、处理速度快D、()[单选题]*A、批处理计算B、流计算C、图计算D、云计算(正确答案)()[单选题]*A、离线处理计算(正确答案)B、流计算C、图计算D、()。*A每个工作节点上负责具体任务的执行进程Executor(正确答案)(正确答案)(正确答案)(正确答案)()*A、宽依赖(正确答案)B、深度依赖C、广度依赖:..英雄者,胸怀大志,腹有良策,有包藏宇宙之机,吞吐天地之志者也。——《三国演义》D、窄依赖(正确答案)(BC)*A、ResourceManagerB、Executor(正确答案)C、Driver(正确答案)D、()*A、保存计算的RDD分区数据(正确答案)B、向Driver反向注册(正确答案)C、接受Driver端发送来的任务Task,作用在RDD上进行执行(正确答案)D、()*A、PartitionB、Job(正确答案)C、Stage(正确答案)D、TaskScheduler(正确答案)?[填空题]*_________________________________答案解析:ApacheSpark是用于大规模数据(large-scaladata)处理的统一(unified)分析引擎。Spark是一款分布式内存计算的统一分析引擎。其特点就是对任意类型的数据进行自定义计算。:..臣心一片磁针石,不指南方不肯休。——文天祥Spark可以计算:结构化、半结构化、非结构化等各种类型的数据结构,同时也支持使用Python、Java、Scala、R以及SQL语言去开发应用程序计算数据。?[填空题]*?[填空题]*_________________________________答案解析:Hadoop中的MR中每个map/reducetask都是一个java进程方式运行,好处在于进程之间是互相独立的,每个task独享进程资源,没有互相干扰,监控方便,但是问题在于task之间不方便共享数据,执行效率比较低。比如多个maptask读取不同数据源文件需要将数据源加载到每个maptask中,造成重复加载和浪费内存。而基于线程的方式计算是为了数据共享和提高执行效率,Spark采用了线程的最小的执行单位,但缺点是线程之间会有资源竞争。?[填空题]*_________________________________答案解析:速度快、使用简单、通用性强、?[填空题]*_________________________________答案解析:核心SparkCore、SQL计算(SparkSQL)、流计算(SparkStreaming)、图计算(GraphX)、机器学习(MLlib):..非淡泊无以明志,非宁静无以致远。——?[]*?[]*:,spark-submit,[]*?bin/pyspark?[]*[]*[]*[]*_________________________________:..先天下之忧而忧,后天下之乐而乐。——[]*?[]*?[]*_________________________________52.?[]*[]*[]*[]*[]*[]*_________________________________58.?[]*_________________________________59.?[]*[]*_________________________________61.[]*:..其身正,不令而行;其身不正,虽令不从。——《论语》?DAG?Stage?[]*_________________________________SparkDAGDAG,1:1,,TaskTask,,.[]*?[]*[]*_________________________________
2025年Spark期末练习题库 来自淘豆网m.daumloan.com转载请标明出处.