南開大學(答案)2024春學期(高起本1709-2103、專升本高起專2003-2103)《網絡爬蟲與信息提取》在線作業_第1頁
南開大學(答案)2024春學期(高起本1709-2103、專升本高起專2003-2103)《網絡爬蟲與信息提取》在線作業_第2頁
南開大學(答案)2024春學期(高起本1709-2103、專升本高起專2003-2103)《網絡爬蟲與信息提取》在線作業_第3頁
南開大學(答案)2024春學期(高起本1709-2103、專升本高起專2003-2103)《網絡爬蟲與信息提取》在線作業_第4頁
南開大學(答案)2024春學期(高起本1709-2103、專升本高起專2003-2103)《網絡爬蟲與信息提取》在線作業_第5頁
已閱讀5頁,還剩11頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

24春學期(高起本:1709-2103、專升本/高起專:2003-2103)《網絡爬蟲與信息提取》在線作業 共50道題總分:100分 100分 單選題 多選題 判斷題 一、單選題 共20題,40分 1 2分 PyMongo中邏輯查詢表示小于的符號是() A$gt B$lt C$gte$$lte 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: 正則表達式的基本符號 2 2分 Scrapy_redis是Scrapy的“()”,它已經封裝了使用Scrapy操作Redis的各個方法 A組件 B模塊 C控件 D單元 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: Scrapy與Redis 3 2分 在Linux中哪個命令是添加權限的() Achmod Bsudo Ccp Dmkdir 我的得分:2分 我的答案:A 解析: 暫無內容 4 2分 如果很多爬蟲同時對一個網站全速爬取,那么其實就是對網站進行了()攻擊 AXSS BDOS CDDOS D跨域 我的得分:2分 我的答案:C 解析: 暫無內容 相關知識點: 階段案例——小說網站爬蟲開發 5 2分 下列說法錯誤的是() A小程序的請求極其簡單,基本上沒有驗證信息 B用Python來請求小程序的后臺接口從而獲取數據,比請求異步加載網頁的后臺接口要復雜很多。 C如果目標網站有微信小程序,那么一定要優先調查能否通過小程序的接口來抓取數據。 D小程序的反爬蟲能力比網頁版的低很多。使用小程序的接口來爬數據,能極大提高爬蟲的開發效率。 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: 異步加載與請求頭 6 2分 Python中列表可以用()方法在末尾添加元素 Aadd Bappend Cplus D+ 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: Python基礎 findall方法 Python編譯器 7 2分 使用UIAutomatorr點亮屏幕的操作是得到相應控件后使用命令() Awakeup Blight Cbright Dsleep 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: 文件操作 8 2分 ()是一個傳遞信息的通道。它負責將爬取博文列表頁獲取到的信息傳遞給負責爬取正文頁的方法中。 Ameta Bhead Cheader Dbody 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: 階段案例——樂視網爬取視頻 9 2分 使用UIAutomator打開微信的操作是獲取相應圖標后使用命令() Atouch Bclick Cpush Dhover 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: 文件操作 10 2分 Scrapy中使用Xpath獲得的結果調用了.extract方法,結果以()形式生成 A列表 B元組 C字典 D集合 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: Scrapy的使用 11 2分 HTTP常用狀態碼表明服務器內部資源出故障了的是() A500 B503 C403 D404 我的得分:2分 我的答案:A 解析: 暫無內容 12 2分 當需要把Python里面的數據發送給網頁時,應先將其轉換成() AJson字符串 BGET CPOST DRequest 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: Python基礎 Python與數據庫 Python編譯器 13 2分 Redis若要進入交互環境,需要打開終端輸入() Aredis-cli Bredis Credis-cmd Dredis-start 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: Redis的使用 14 2分 在Scrapy的目錄下,哪個文件負責存放爬蟲文件?() Aspiders文件夾 Bitem.py Cpipeline.py Dsettings.py 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: 文件操作 15 2分 Python操作CSV文件可通過()容器的方式操作單元格 A列表 B元組 C字典 D集合 我的得分:2分 我的答案:C 解析: 暫無內容 相關知識點: 文件操作 16 2分 Python正則表達式模塊的findall方法返回結果為() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: findall方法 17 2分 以下關于Charles的說法正確的是() ACharles是一個跨平臺的HTTP抓包工具,可以截取HTTP或者HTTPS請求的數據包 BCharles有Windows32/64版和Linux64版,但是目前還沒有對MacOS進行有效的支持。 CCharles上面滾動的數據就是目前計算機發起的數據包。單擊工具欄上面的黃色笤帚圖標,可以清停止抓包。 D在Charles啟動時,系統自帶瀏覽器的部分HTTP流量不會經過Charles。 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: 使用Charles抓取數據包 18 2分 如果使用Python的數據結構來做類比的話,MongoDB中庫相當于一個() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:C 解析: 暫無內容 相關知識點: MongoDB的使用 MongoDB 19 2分 Redis中讀取數據語句lrangechapter03,那么表示讀列表中()個值 A2 B3 C4 D5 我的得分:2分 我的答案:C 解析: 暫無內容 相關知識點: Python的條件語句和循環語句 20 2分 Python正則表達式模塊的findall方法提取內容包含多個,則返回結果的列表中會包含() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: findall方法 二、多選題 共10題,20分 1 2分 一個可行的自動更換代理的爬蟲系統,應該下列哪些功能? A有一個小爬蟲ProxySpider去各大代理網站爬取免費代理并驗證,將可以使用的代理IP保存到數據庫中 B在發現某個請求已經被設置過代理后,什么也不做,直接返回 C在ProxyMiddlerware的process_request中,每次從數據庫里面隨機選擇一條代理IP地址使用 D周期性驗證數據庫中的無效代理,及時將其刪除 我的得分:2分 我的答案:ACD 解析: 暫無內容 相關知識點: 帶權限管理的反向代理 2 2分 Python中有哪些實現多線程方法() Amultiprocess.dummy Bthreading.Thread Cprocess DPyMongoDB 我的得分:2分 我的答案:BA 解析: 暫無內容 相關知識點: findall方法 Python基礎 Python編譯器 3 2分 以下哪些可以獨立成為Python編譯器() APycharm BIDLE CEclipse DVisualStudio2010 我的得分:2分 我的答案:AB 解析: 暫無內容 相關知識點: Python編譯器 4 2分 網絡爬蟲的用途有() A收集數據 B盡職調查 C提高流量 D攻擊服務器 我的得分:2分 我的答案:ABC 解析: 暫無內容 相關知識點: 網絡爬蟲的用途 5 2分 HTTP常用狀態碼表明請求被正常處理的有() A200 B301 C302 D204 我的得分:2分 我的答案:AD 解析: 暫無內容 相關知識點: 請求頭 6 2分 下列關于在IOS上配置charles的說法正確的是() A不同ios設備之間會有比較大的差別,所以配置的時候需要找到對應的安裝證書的入口。 B手機和電腦需要在同一個局域網下。 CHTTP代理可以使用“自動”選項。 D安裝好證書以后,打開iOS設備上的任何一個App,可以看到Charles中有數據包在流動 我的得分:2分 我的答案:BD 解析: 暫無內容 相關知識點: 使用Charles抓取數據包 7 2分 Python中一個函數沒有返回值則可以寫() A沒有return Breturn CreturnNone DreturnNULL 我的得分:2分 我的答案:ABC 解析: 暫無內容 相關知識點: Python函數的定義和使用 8 2分 最常見的HTTP請求類型有() AGET BPOST CSEND DRECEIVE 我的得分:2分 我的答案:BA 解析: 暫無內容 相關知識點: 請求頭 9 2分 HTTP常用狀態碼表明表明服務器本身發生錯誤的有() A403 B404 C500 D503 我的得分:2分 我的答案:CD 解析: 暫無內容 10 2分 自動填充驗證碼的方式有 A手動識別填寫 B圖像識別 C打碼網站 D瀏覽器自動識別 我的得分:2分 我的答案:BC 解析: 暫無內容 相關知識點: 填充驗證碼 三、判斷題 共20題,40分 1 2分 微信小程序的反爬蟲能力要比網頁的高很多。 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: App爬蟲和小程序爬蟲 2 2分 Python中寫CSV文件的writerows方法參數為字典類型 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: Python編譯器 字典與集合 Python基礎 3 2分 Redis插入數據都是插入到列表右側,因此讀取數據也是從右側讀取 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: Redis的使用 4 2分 UIAutomatorViewer與Pythonuiautomator可以同時使用 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: Python編譯器 Python與數據庫 Python基礎 5 2分 robots.txt是一種規范,在法律范疇內 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: 爬蟲開發中的法律和道德問題 6 2分 雖然MongoDB相比于MySQL來說,速度快了很多,但是頻繁讀寫MongoDB還是會嚴重拖慢程序的執行速度。 A對 B錯 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: MongoDB MongoDB的使用 7 2分 上課傳紙條。A要把紙條傳給B,但是A與B距離太遠,于是讓C來轉交紙條。此時,C先篡改紙條的內容再傳給B,這是一種類似抓包的方式。 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 8 2分 默認情況下,MongoDB可以通過外網訪問 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: MongoDB的使用 MongoDB 9 2分 使用AJAX技術,可以在不刷新網頁的情況下更新網頁數據 A對 B錯 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: 簡單的網頁爬蟲方法 10 2分 Charles能截獲HTTP和HTTPS的數據包,如果網站使用websocket就可以截獲。 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: 使用Charles抓取數據包 11 2分 如果元組里面只有整數、浮點數、字符串、一個列表,就既不能添加數據,也不能刪除數據,還不能修改里面數據的值。 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: 字符串、列表、元組 12 2分 HTTP狀態碼302表示資源永久重定向。 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 13 2分 對Charles設置代理時,Ip可以設置為,端口為8888. A對 B錯 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: 使用Charles抓取數據包 14 2分 使用Charles,可以輕松截獲手機App和微信小程序的數據包,從而開發出直接抓取App后臺和小程序后臺的爬蟲。 A對 B錯 我的得分:2分 我的答案:A 解析: 暫無內容 相關知識點: App爬蟲和小程序爬蟲 15 2分 在Windows中下若要運行Redis可以運行redis-server/usr/local/etc/redis.conf A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: Python的安裝和運行 16 2分 PyMongoDB中排序方法sort第二個參數-1表示升序 A對 B錯 我的得分:2分 我的答案:B 解析: 暫無內容 相關知識點: findall方法 17 2分 Redis的集合與Python的集合一樣,沒有順序,值不重復 A對 B錯 我的得分:2分 我的答案:A 解析: 暫無內容 相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論