100分 发表于 2019-9-21 09:14:50

南开19秋(1709、1803、1809、1903、1909)《网络爬虫与信息提取...

19秋学期(1709、1803、1809、1903、1909)《网络爬虫与信息提取》在线作业
1.[单选题]Python中把集合转换为列表需要使用##函数
奥鹏作业答案可以联系QQ 761296021
    A.set    B.list
    C.convert    D.change
    正确答案:——B——
2.[单选题]下面Python代码输出为():
def default_para_without_trap(para=[], value=0):
    if not para:
      para = []
    para.append(value)
    return para
print('第一步:{}'.format(default_para_trap(value=100)))

print('第二步:{}'.format(default_para_trap(value=50)))
    A.第一步:
第二步:
    B.第一步:
第二步:
    C.第一步:
第二步:[]
    D.第一步:
第二步:
    正确答案:——B——
3.[单选题]以下哪个HTML标签表示分区或节()

    正确答案:——A——
4.[单选题]使用xpath方法的返回类型是()
    A.列表
    B.元组
    C.字典
    D.集合
    正确答案:————
5.[单选题]以下哪个HTML标签表示定义 HTML 表格中的标准单元格()

    正确答案:————
6.[单选题]当需要把Python里面的数据发送给网页时,需要先转换成()字符串
    A.Python
    B.Json
    C.正则表达式
    D.Ajax    奥鹏无忧答案网q761296021
    正确答案:————
7.[单选题]以下哪个命令是利用URL语法在命令行下工作的文件传输工具()
    A.curl
    B.tar -zxvf
    C.mkdir
    D.cp
    正确答案:————
8.[单选题]带上通过Chrome浏览器从评论页面复制而来的()再发起请求,可以减少爬虫被网站封锁的概率
    A.Cookie
    B.Html
    C.Headers
    D.CSS
    正确答案:————
9.[单选题]Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()
    A.列表
    B.元组
    C.字典
    D.集合
    正确答案:————
10.[单选题]PyMongo中逻辑查询表示不等于的符号是()
    A.$gt
    B.$lt
    C.$eq$$ne
    正确答案:————
11.[单选题]()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。
    A.meta
    B.head
    C.header
    D.body
    正确答案:————
12.[单选题]使用Xpath构造相同字符串开头的路径采用()方法
    A.starts-with
    B.starts
    C.begin
    D.begin-with
    正确答案:————
13.[单选题]Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()
    A.空
    B.空列表
    C.空元组
    D.不返回
    正确答案:————
14.[单选题]当需要把Python里面的数据发送给网页时,应先将其转换成()
    A.Json字符串
    B.GET
    C.POST
    D.Request
    正确答案:————
15.[单选题]使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令()
    A.scroll
    B.scroll_up
    C.scroll_forword
    D.scroll_back
    正确答案:————
16.[单选题]Redis若要进入交互环境,需要打开终端输入()
    A.redis-cli
    B.redis
    C.redis-cmd
    D.redis-start
    正确答案:————
17.[单选题]使用Xpath获取文本使用()
    A.text
    B.text()
    C.content
    D.content()
    正确答案:————
18.[单选题]Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
    A.列表
    B.元组
    C.字典
    D.集合
    正确答案:————
19.[单选题]使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
    A.scroll_forwad
    B.scroll_up
    C.scroll.forward
    D.scroll.vert.forward
    正确答案:————
20.[单选题]xpath中extract方法返回值类型是()
    A.列表
    B.元组
    C.字典
    D.集合
    正确答案:————
21.[多选题]Python中有哪些实现多线程方法()
    A.multiprocess.dummy
    B.threading.Thread
    C.process
    D.PyMongoDB
    正确答案:————
22.[多选题]HTTP常用状态码表明表明浏览器需要执行某些特殊的处理以正确处理请求的有()
    A.200
    B.301
    C.302
    D.204
    正确答案:————
23.[多选题]Python中的容器有()
    A.列表
    B.元组
    C.字典
    D.集合
    正确答案:————
24.[多选题]Python中()容器有推导式
    A.列表
    B.元组
    C.字典
    D.集合
    正确答案:————
25.[多选题]Python中一个函数可以有()个return语句
    A.0
    B.1
    C.多个
    D.2
    正确答案:————
26.[多选题]使用BeautifulSoup对象后可以使用()来查找内容
    A.find_all
    B.find
    C.search
    D.search_all
    正确答案:————
27.[多选题]在配置ios使用Charles的操作中,正确的有()
    A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
    B.选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
    C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
    D.安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
    正确答案:————
28.[多选题]网络爬虫的用途有()
    A.收集数据
    B.尽职调查
    C.提高流量
    D.攻击服务器
    正确答案:————
29.[多选题]HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
    A.403
    B.404
    C.500
    D.503
    正确答案:————
30.[多选题]HTTP常用状态码表明请求被正常处理的有()
    A.200
    B.301
    C.302
    D.204
    正确答案:————
31.[判断题]异步加载的内容一般在网页框架加载完成之前
    A.对
    B.错
    正确答案:————
32.[判断题]当使用Scarpy创建爬虫时,当爬取网易云音乐首页信息时,scrapy genspider的第二个参数直接输入"163.com"就可以了
    A.对
    B.错
    正确答案:————
33.[判断题]要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样
    A.对
    B.错
    正确答案:————
34.[判断题]Python可以将列表或字典转换成Json字符串
    A.对
    B.错
    正确答案:————
35.[判断题]HTTP状态码302与307完全同义。
    A.对
    B.错
    正确答案:————
36.[判断题]Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
    A.对
    B.错
    正确答案:————
37.[判断题]在默认情况下,Scrapyd可以从外网访问
    A.对
    B.错
    正确答案:————
38.[判断题]所有的异步加载都会向后台发送请求
    A.对
    B.错
    正确答案:————
39.[判断题]在使用多线程处理问题时,线程池设置越大越好
    A.对
    B.错
    正确答案:————
40.[判断题]Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3
    A.对
    B.错
    正确答案:————
41.[判断题]上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
    A.对
    B.错
    正确答案:————
42.[判断题]requests中get请求方法的使用为requests.get('网址', data=data)
    A.对
    B.错
    正确答案:————
43.[判断题]Python中写CSV文件的writerows方法参数为字典类型
    A.对
    B.错
    正确答案:————
44.[判断题]虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
    A.对
    B.错
    正确答案:————
45.[判断题]Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
    A.对
    B.错
    正确答案:————
46.[判断题]XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。
    A.对
    B.错
    正确答案:————
47.[判断题]插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1
    A.对
    B.错
    正确答案:————
48.[判断题]爬虫登录需要识别验证码可以先把程序关闭,肉眼识别以后再重新运行
    A.对
    B.错
    正确答案:————
49.[判断题]mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
    A.对
    B.错
    正确答案:————
50.[判断题]已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行
    A.对
    B.错
    正确答案:————
附件是答案 ,核对题目下载 微信761296021
页: [1]
查看完整版本: 南开19秋(1709、1803、1809、1903、1909)《网络爬虫与信息提取...