22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00001
试卷总分:100 得分:100
一、单选题 (共 20 道试题,共 40 分)
1.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
A.s
B.c
C.d
D.r
2.使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()
A.content
B.text
C.title
D.body
3.Python中Object={1, 2, 3, 4, 5},则Objcet是()
A.集合
B.字典
C.列表
D.元组
4.使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令()
A.scroll.left
B.scroll.horiz.left
C.scroll.forward
D.scroll.horiz.forward
5.chrome默认打开开发者工具的快捷是
A.F5
B.F11
C.F12
D.F2
6.Python中把列表转换为集合需要使用##函数
A.set
B.list
C.convert
D.change
7.Python中跳过本次循环应用关键字()
A.break
B.continue
C.exit
D.return
8.PyMongo中逻辑查询表示大于等于的符号是()
A.$gt
B.$lt
C.$gte
D.$lte
9.PyMongo中逻辑查询表示小于的符号是()
A.$gt
B.$lt
C.$gte$$lte
10.可以通过()绕过网站登录。
A.session
B.cookies
C.moonpies
D.localstorage
11.requests中post请求方法的使用为requests.post('网址', data=data)中的data为()
A.列表
B.元组
C.字典
D.集合
12.在Linux中哪个命令是添加权限的()
A.chmod
B.sudo
C.cp
D.mkdir
13.在Scrapy的目录下,哪个文件负责存放爬虫文件?()
A.spiders文件夹
B.item.py
C.pipeline.py
D.settings.py
14.Python中退出循环应用关键字()
A.break
B.continue
C.exit
D.return
15.Python中专门用来处理图像的第三方库是
A.lxml
B.Pillow
C.beautifulsoup
D.pytesseract
16.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()
A.1
B.2
C.3
D.无输出
17.使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()
A.exist
B.exists
C.isnull
D.contains
18.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A.scroll_forwad
B.scroll_up
C.scroll.forward
D.scroll.vert.forward
19.如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
A.列表
B.元组
C.字典
D.集合
20.当需要把Python里面的数据发送给网页时,应先将其转换成()
A.Json字符串
B.GET
C.POST
D.Request
二、多选题 (共 10 道试题,共 20 分)
21.Python中的容器有()
A.列表
B.元组
C.字典
D.集合
22.Python中()容器有推导式
A.列表
B.元组
C.字典
D.集合
23.MongoDB中获取名字为db的库的语句为()
A.client.db
B.client('db')
C.client['db']
D.client{'db'}
24.以下HTTP状态码表示服务器本身发生错误的是
A.400
B.503
C.302
D.500
25.cookies的缺点是
A.实现自动登录
B.跟踪用户状态
C.http中明文传输
D.增加http请求的流量
26.requests中post请求方法的第二个参数可以为()
A.字典
B.列表
C.json数据
D.字符串
27.以下哪些可以独立成为Python编译器()
A.Pycharm
B.IDLE
C.Eclipse
D.Visual Studio 2010
28.一个可行的自动更换代理的爬虫系统,应该下列哪些功能?
A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中
B.在发现某个请求已经被设置过代理后,什么也不做,直接返回
C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用
D.周期性验证数据库中的无效代理,及时将其删除
29.HTTP常用状态码表明请求被正常处理的有()
A.200
B.301
C.302
D.204
30.Python中一个函数可以有()个return语句
A.0
B.1
C.多个
D.2
三、判断题 (共 20 道试题,共 40 分)
31.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。
32.一般来说在页面都通过GET将用户登录信息传递到服务器端。
33.MongoDB是一个关系数据库产品
34.PyMongoDB中排序方法sort第二个参数-1表示升序
35.Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。
36.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
37.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
38.使用AJAX技术,可以在不刷新网页的情况下更新网页数据
39.Redis中使用lrange读取数据后数据也会删除
40.Selenium必须加载对应的webdriver才能模拟浏览器访问
41.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
42.Redis中查询列表长度命令llen中l代表left,即从左侧开始数
43.Python中函数返回值的个数可以是多个
44.使用Charles直接抓取HTTPS的数据包,就会出现大量的Method为CONNECT的请求,但是这些请求又全部都会失败,是没有安装SSL证书导致的
45.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
46.UI Automator Viewer与Python uiautomator可以同时使用
47.为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。
48.运行MongoDB以后,不会在终端打印任何Log
49.在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装
50.”curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID“该命令的作用是启动爬虫
奥鹏,国开,广开,电大在线,各省平台,新疆一体化等平台学习
详情请咨询QQ : 3230981406或微信:aopopenfd777