下载此文档

2025年数据采集1+x初级试题及参考答案.pdf


文档分类:IT计算机 | 页数:约17页 举报非法文档有奖
1/17
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/17 下载此文档
文档列表 文档介绍
该【2025年数据采集1+x初级试题及参考答案 】是由【小屁孩】上传分享,文档一共【17】页,该文档可以免费在线阅读,需要了解更多关于【2025年数据采集1+x初级试题及参考答案 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。:..长风破浪会有时,直挂云帆济沧海。——李白数据采集1+x初级试题及参考答案一、单选题(共40题,每题1分,共40分)1、获取页面中title标签的内容,xpath代码为()A、//title/***@text()B、//title/text()C、//title/textD、//title/***@text正确答案:B2、在Linux环境下的Apache容器数据的采集中,启动apache服务代码是()。A、、logstashC、filebeatD、httpd正确答案:D3、哪个表达式用来选取当前节点?A、/B、***@C、.D、..正确答案:C4、哪个表达式用来选取属性?A、/B、..C、.D、@正确答案:D5、()是通过爬虫程序监测某网站数据更新的情况,以便可以爬取到该网站更新的新数据,对于未发生内容变化的网页,则不会爬取。A、聚焦网络爬虫B、深层页面爬虫C、通用网络爬虫D、増量式网络爬虫正确答案:D:..饭疏食,饮水,曲肱而枕之,乐亦在其中矣。不义而富且贵,于我如浮云。——《论语》6、HTML中能够定义表单提交位置的属性是A、methodB、actionC、titleD、name正确答案:B7、以下哪一项与网站优化关键词排名无关()A、网站开发语言B、网站空间稳定性C、网站域名D、网站程序复杂度正确答案:A8、用于将事务处理写到数据库的命令是()A、insertB、savepointmitD、rollback正确答案:C9、json模块中,()方法可以将python的字典和列表转换为json字符串A、dumpB、loadsC、dumpsD、load正确答案:C10、重新启动Apache服务命令为()A、ServicerestartB、HttpdrestartC、ServiceHttprestartD、Servicehttpdrestart正确答案:D11、BeautifulSoup中,能够获取标签内容的是A、stringB、text:..臣心一片磁针石,不指南方不肯休。——文天祥C、string()D、text()正确答案:A12、哪个符号匹配一次或者多次前面的字符?A、+B、?C、.D、*正确答案:A13、JavaScript核心对象中.()用于处理日期和时间。A、Data对象B、Array对象C、Date对象D、String对象正确答案:C14、Scrapy中,用于运行项目中的爬虫的命令是()。A、以上全是B、crawlC、runspiderD、genspider正确答案:B15、Apache的主配置文件路径为()A、/etc/httpd/conf/、httpd/conf/、confD、conf/:A16、盒子模型具备的属性有几个()A、4B、1C、2D、3正确答案:A17、以下属于网页文本数据的是():..为天地立心,为生民立命,为往圣继绝学,为万世开太平。——张载A、JPGB、HTMLC、MPEG-1D、PNG正确答案:B18、CSS选择器中,()前面以“#”号来标志,根据元素ID来选择元素,具有唯一性。A、类选择器B、后代选择器C、ID选择器D、标签选择器正确答案:C19、以下选项中,不是PythonIDE的是()A、RstudioB、SpyderC、PyCharmD、JupyterNotebook正确答案:A20、MySQl安装完毕后为什么要配置环境变量()A、为了关闭MySQl服务B、为了在任何地方使用MySQl命令C、为了启动MySQl服务D、为了安装连接软件正确答案:B21、HTTP协议是A、网络层协议B、传输层协议C、应用层协议D、会话层协议正确答案:C22、下列哪个函数不属于聚合函数()A、sum()B、max()C、str():..不飞则已,一飞冲天;不鸣则已,一鸣惊人。——《韩非子》D、count()正确答案:C23、数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为()A、数据控制语言B、数据定义语言(DDL)C、数据操纵语言(DML)D、数据管理语言正确答案:C24、DB指的是是A、数据库应用B、数据库管理系C、数据库D、关系型数据库正确答案:C25、以下关于对数据采集要求的描述,不正确的是A、高效性B、全面性C、多维性D、非及时性正确答案:D26、在Linux环境下的Tomcat容器数据的采集中,启动Tomcat容器的代码是()。A、、filebeatC、httpdD、logstash正确答案:A27、Android系统是基于Linux操作系统开发的手机系统,因此在进行刷机、删除系统自带软件时需要获得管理员账户()的权限A、administratorB、liveuserC、adminD、root:..志不强者智不达,言不信者行不果。——墨翟正确答案:D28、requests库中,()对象可以实现跨请求保持数据A、ResponseB、SessionC、CookieD、Request正确答案:B29、Java应用系统中常用的日志框架不包括()A、LogbackB、Log4jC、Log4j2D、loguru正确答案:D30、"<inputid="jq1"type="text"/>以下哪种可以隐藏该属性()"A、$("#jq1").remove();B、$(#jq1).remove();C、$("jq1").hide();D、$("#jq1").hide();正确答案:D31、ELK在安装过程中,彼此之间存在一定的依赖关系,正确的安装顺序是()。A、Kibana-ElasticSearch-LogstashB、ElasticSearch-Logstash-KibanaC、ElasticSearch-Kibana-LogstashD、Logstash-ElasticSearch-Kibana正确答案:B32、下列Python标识符中哪个是合法的?()A、forB、i'mC、_D、3Q正确答案:C33、下列不属于ELK范畴的是()A、ElasticSearch:..君子忧道不忧贫。——孔丘B、LogstashC、LuceneD、Kibana正确答案:C34、re模块的常用方法中用于将输入的字符串整个扫描并返回第一个成功的匹配的是()。A、searchpileC、subD、split正确答案:A35、Python不支持的数据类型有()A、charB、intC、floatD、list正确答案:A36、执行后可以查看Python的版本的是()(A)A、importsysprint()B、importsystemprint()C、importsystemprint()D、importsysprint()正确答案:D37、创建表用()关键字A、DELETETABLEB、DROPTABLEC、CREATETABLED、UPDATETABLE正确答案:C38、在xpath中,哪个轴可以选取当前节点的所有属性?()A、descendantB、childC、attrD、attribute:..太上有立德,其次有立功,其次有立言,虽久不废,此谓不朽。——《左传》正确答案:D39、关于数据采集的描述不正确的是()A、以上描述都不正确B、数据采集来源广泛,类型也丰富多样,很看重数据处理的高效性和实时性C、数据采集不在于掌握庞大的的数据信息,而在于对数据的智能处理,挖掘出有价值的信息D、数据采集,要注重数据质量和数据采集性能提升,为数据的准确分析打下基础正确答案:A40、数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些特性()A、单一化、低维度、低并发B、全面性、多维性、高效性C、低维度、高并发、高速率D、多维性、灵活性、高延迟正确答案:B二、多选题(共20题,每题1分,共20分)1、以下哪几个方法与AlertDialog中的按钮设置有关()A、setPositiveButton()B、setAffirmationButton()C、setNegativeButton()D、setNeutralButton()正确答案:ACD2、以下关于资源命名的规则正确的有:()A、资源文件名不可使用大写B、在同一个资源类型的目录中不能存在文件名相同,扩展名不同的资源文件C、资源命名要符合Java变量命名规范D、同类资源的文件名或变量名不能重复正确答案:ABCD3、在操作系统中,进程是指一个程序以及其数据在处理器上执行时发生的所有活动,是系统资源分配和调度的一个独立单位。以下属于进程特征的是()。:..君子忧道不忧贫。——孔丘A、并发性B、独立性C、动态性D、异步性正确答案:ABCD4、根据数据所属主体不同,以下属于数据采集范畴的是()A、数据库采集B、感知设备数据采集C、系统日志采集D、网络数据采集正确答案:ABCD5、Python中,关于输出函数描述正确的是()A、在输出多个数据时,默认使用空格作为输出分隔符B、print()函数默认以回车换行符号作为输出结尾符C、print()函数的所有参数均可省略D、可用file参数设置,将数据输出到文件正确答案:ABCD6、requests库发送请求的方法包括()等。A、PUTB、POSTC、GETD、DELETE正确答案:ABCD7、网站网络推广的方向有哪些()A、电子邮件推广B、资源合作推广C、快捷网址推广D、搜索引擎推广E、网络广告推广正确答案:ABCDE8、下列哪些列类型是数值型的数据()A、INTB、SETC、DOUBLE:..长风破浪会有时,直挂云帆济沧海。——李白D、FLOAT正确答案:ACD9、sql语言分为以下()几类A、DCLB、DQLC、DDLD、DML正确答案:ABCD10、Xpath的内建函数可用于处理()A、字符串值B、比较C、数值D、日期正确答案:ABCD11、以下属于数据采集范畴的是()。A、容器日志数据B、互联网应用数据C、数据库数据D、业务系统日志数据正确答案:ABCD12、以下哪几项是Android平台的优势()A、开放性B、丰富的硬件选择C、无缝结合的Google应用D、不受限制的开发商正确答案:ABCD13、AndroidEmulator有如下限制A、不支持USB连接B、不支持蓝牙C、不支持SD卡D、不支持拨打或接听真实电话正确答案:ABD14、《中华人民共和国网络安全法》中规定()A、不得提供专门用于从事侵入网络、干扰网络正常功能及防护措施、窃:..君子忧道不忧贫。——孔丘取网络数据等危害网络安全活动的程序、工具B、明知他人从事危害网络安全的活动的,不得为其提供技术支持、广告推广、支付结算等帮助C、可以提供危害网络安全活动的程序、工具D、任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能、窃取网络数据等危害网络安全的活动正确答案:ABD15、以下属于CRM主要应用方面的是()。A、合同管理B、客户档案有序管理C、销售报表D、预测销售业绩正确答案:ABCD16、有关IPV6协议说法正确的是()A、不允许协议继续扩充B、灵活的首部格式C、支持资源的预分配D、具备更大的地址空间,地址空间达到128位正确答案:BCD17、以下属于信道复用技术的是()A、频分复用技术B、码分复用技术C、时分复用技术D、波分复用技术正确答案:ABCD18、计算机网络的拓扑结构就是用网络的站点与连接线的几何关系来表示网络的结构,以下为拓扑结构类型的是()。A、网状型B、树型C、总线型D、环型E、星型正确答案:ABCDE19、以下哪几项是Android平台的特性():..先天下之忧而忧,后天下之乐而乐。——范仲淹A、支持摄像头、GPS、指南针和加速计等外围设备B、允许重用和替换组件的应用程序框架C、专门为移动设备优化的Dalvik虚拟机D、支持数据结构化存储的SQLite正确答案:ABCD20、以下关于scrapy框架的描述,正确的有()A、scrapy框架包含的python包中不包括lxmlB、Scrapy是一个开放源码的协作框架C、Scrapy是用纯Python编写的D、scrapy框架是一种快速、简单、可扩展的方式从网站中提取所需要的数据正确答案:BCD三、判断题(共40题,每题1分,共40分)1、ADSL为用户提供的上行和下行带宽是对称的A、正确B、错误正确答案:B2、Robots协议全称是“网络爬虫排除标准”,网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。A、正确B、错误正确答案:A3、任何个人和组织不得从事非法侵入他人网络、干扰他人网络正常功能等危害网络安全的活动,但在一定条件下窃取网络数据是可以的A、正确B、错误正确答案:B4、大数据类型数据库是用来替代关系型数据库的A、正确B、错误正确答案:B5、单向通信,只能有一个方向的通信而没有反方向的交互A、正确B、错误:..勿以恶小而为之,勿以善小而不为。——刘备正确答案:A6、在TCP/IP网络中,每一台主机必须有一个域名。A、正确B、错误正确答案:B7、<head>和</head>分别表示文档的开始和结束,用于告知浏览器其自身是一个HTML文档。A、正确B、错误正确答案:B8、在Tomcat中的应用程序一定是一个WAR(WebArchive)文件A、正确B、错误正确答案:B9、重写父类的方法,可在子类中定义一个这样的方法,即它与要重写的父类方法同名A、正确B、错误正确答案:A10、系统处于不安全状态时一定发生了死锁。A、正确B、错误正确答案:B11、Linux系统管理员的权限和普通用户的权限相同。A、正确B、错误正确答案:B12、在对网站进行SEO优化时,关键词密度根本不用考虑,只要不堆积就行A、正确B、错误正确答案:B13、Python中,可以利用del命令删除元组中的部分元素。A、正确:..博学之,审问之,慎思之,明辨之,笃行之。——《礼记》B、错误正确答案:B14、SNMP直接围绕Session会话连接进行数据提取A、正确B、错误正确答案:B15、*匹配0次的前面字符(相当于{0,})A、正确B、错误正确答案:B16、HTTP请求报文结构包含请求行、请求头部、空行和请求数据4部分。A、正确B、错误正确答案:A17、网站SEO优化时,关键词密度根本不用考虑,只要不堆积就行。A、正确B、错误正确答案:B18、xpath中,元素的索引是从0开始的A、正确B、错误正确答案:B19、动态网页是相对静态网页来说的,指使用动态网络技术生成的网页,动态网页的后缀不仅仅是静态文件常见的形式,通常在动态网址之后包含“?”符号。A、正确B、错误正确答案:A20、计数元字符用来控制一个匹配项可以在字符串中出现的次数,这样会使得表达式更加的灵活通用。A、正确B、错误正确答案:A21、虽然不需要在使用之前显式地声明变量及其类型,但是Python仍属:..天行健,君子以自强不息。地势坤,君子以厚德载物。——《周易》于强类型编程语言,Python解释器会根据赋值或运算来自动推断变量类型。A、正确B、错误正确答案:A22、建立一个新文件可以使用touch命令。A、正确B、错误正确答案:A23、每个元素以及属性都有一个父节点。A、正确B、错误正确答案:A24、根据类来创建对象称作实例化A、正确B、错误正确答案:A25、BeautifulSoup既可以抓取数据,又可以解析数据A、正确B、错误正确答案:B26、进程具备多种特性,如:动态性、顺序性、独立性和同步性A、正确B、错误正确答案:B27、del命令只可以删除列表中的一个元素,不能删除整个列表。A、正确B、错误正确答案:B28、JavaEE基于JavaSE(JavaStandardEdition)平台,提供了一组用于开发和运行的可移植的、健壮的、可伸缩的、可靠的和安全的服务器应用程序的API(ApplicationProgrammingInterface)。A、正确B、错误:..好学近乎知,力行近乎仁,知耻近乎勇。——《中庸》正确答案:A29、。A、正确B、错误正确答案:A30、Python内置函数size()可以返回列表、元组、字典、集合、字符串以及range对象中元素个数A、正确B、错误正确答案:B31、网站设计时能用动态网页尽量用动态网页A、正确B、错误正确答案:B32、响应状态码500表示的含义是“对被请求页面的访问被禁止。”A、正确B、错误正确答案:B33、Java语言具有跨平台性、使用复杂、面向对象、安全性差等特点。A、正确B、错误正确答案:B34、isinstance('123',str)返回值是FalseA、正确B、错误正确答案:B35、堆叠是用专用的端口把交换机连接起来,当作一个交换机使用。A、正确B、错误正确答案:A36、SQL语言中,删除某表中某个索引的命令是dropindex表名on索引名;A、正确:..饭疏食,饮水,曲肱而枕之,乐亦在其中矣。不义而富且贵,于我如浮云。——《论语》B、错误正确答案:B37、、正确B、错误正确答案:A38、文件共享是指系统允许多个用户或者进程去共享同一个文件,文件共享只限于系统内共享。A、正确B、错误正确答案:B39、操作系统中,绝对路径名都是从根目录开始。A、正确B、错误正确答案:A40、关系模型就是一张二维表,一个关系型数据库就是若干个二维表的集合。A、正确B、错误正确答案:A

2025年数据采集1+x初级试题及参考答案 来自淘豆网m.daumloan.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数17
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小屁孩
  • 文件大小608 KB
  • 时间2025-01-19