




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
湖南商務職業技術學院畢業設計
目錄
1引言............................................................................................................................1
1.1項目背景......................................................................................................1
1.2開發環境與工具..........................................................................................2
1.2.1Python簡介..........................................................................................2
1.2.2MySQL簡介............................................................................................2
1.2.3Jypyternotebook簡介......................................................................2
2需求分析.....................................................................................錯誤!未定義書簽。
2.1可行性需求分析..........................................................................................3
2.2采集目標功能分析......................................................................................3
2.3關鍵技術分析..............................................................................................3
2.3.1網絡爬蟲技術.......................................................................................3
2.3.2文件存取技術.......................................................................................3
2.3.3可視化技術...........................................................................................3
3數據采集....................................................................................................................3
3.1采集頁面分析..............................................................................................6
3.2字段分析......................................................................................................8
3.3編程實現......................................................................................................9
4數據清洗與處理......................................................................................................13
4.1數據清洗....................................................................................................13
4.2數據儲存....................................................................................................14
4.3編程實現....................................................................................................15
5數據統計與分析......................................................................................................16
5.1數據準備....................................................................................................16
5.2數據展示....................................................................................................18
5.2.1依據車輛品牌進行統計.....................................................................18
5.2.2依據車輛公里數進行統計.................................................................19
5.2.3據車輛排期以及進氣方式進行統計和分析.....................................19
I
湖南商務職業技術學院畢業設計
5.2.4依據車輛顏色進行統計.....................................................................20
5.3綜述............................................................................................................21
6小結..........................................................................................................................21
參考資料.........................................................................................................................22
II
湖南商務職業技術學院畢業設計
基于Python的瓜子二手車網數據采集與分析
1引言
時光荏苒,1980年開始一直到2000年,我國的汽車發展呈現的是跨越式的,
我國的汽車產量已經達到了一百萬臺,在2000年突破了兩百萬臺,并且我國的
民用乘車量從八零年的五千四百臺發展到了零零年的六十一萬臺,由這些數字
的佐證,很難不看出這是一段我國汽車時代的跨越式發展,就像人們常常說的,
歷史是無法抵擋的,有波折,有倒退,但從歷史性的角度來看,我國的汽車發
展是在大步向前的。
近二十年我國的汽車發展更是來到了一個巔峰,不僅在以前我國的汽車只
能依靠進口,但在2000年之后我們國家開始有了合資品牌,顧名思義合資車就
是外國品牌給我們國家的汽車廠家提供技術而由我國的汽車廠家制造車輛,甚
至我國還誕生出了自己國家的汽車品牌,比如比亞迪,紅旗,吉利等等響當當
的汽車品牌。
根據公安部來布最新的據,截至2022年11月,我們全國的機動車保有量
為四點一五億臺,其中汽車的保有量達到了驚人的三點一八億臺,從這些數據
中我們便可以看出我們國家的二手車市場也是非常之巨大的。特別是到現在我
們都是比較喜新厭舊的,所以很多人都會把自己的車輛變賣來換成其他的車,
這也就誕生了二手車市場。
1.1項目背景
二手車市場是一個龐大而且不斷增長的市場,在這個市場中,人們可以以
比新車更便宜的價格購買汽車,并在之后將它們再次轉手賣掉。因此,二手車
交易也是一個非常大的市場,為人們提供了一種更便宜、更實用的購車方式。
然而,二手車市場存在一些問題,例如質量不一、價格不透明、交易安全等。
因此,針對這些問題,許多企業開始探索使用技術手段來解決這些問題,因此
我們可以使用大數據信息技術對車輛進行一個全面的分析。
大數據技術可以通過分析和處理海量的數據,在二手車買賣過程中提供更
好的解決方案,例如幫助消費者評估汽車的質量、為汽車定價、提供更安全和
可靠的交易平臺等。因此,二手車交易的大數據分析解決方案正逐漸成為一個
備受關注的領域。
但是,與新車市場相比,二手車市場存在一些問題。例如,二手車的質量
1
湖南商務職業技術學院畢業設計
和狀態存在著較大的不確定性,消費者難以準確評估其實際價值;價格和交易
過程缺乏透明度,買家可能會陷入價格陷阱或遭受欺詐。針對這些問題,一些
企業開始探索運用大數據技術,通過分析海量數據和應用智能算法,為消費者
提供更準確、透明和安全的二手車購車體驗。
1.2開發環境與工具
1.2.1Python簡介
Python是一種高層次、解釋型的動態編程語言,被廣泛用于機器學習、人
工智能、數據處理、Web開發、科學計算、網絡爬蟲等領域。它的哲學是代碼可
讀性和簡潔性,語法簡單明了,易于學習和使用。
Python的主要特點有:
簡單易學:Python語法簡單明了,支持面向對象編程、函數式編程和過程
編程。
跨平臺:Python可以在類Unix、Linux、Windows等幾乎所有操作系統上運
行,具有很強的可移植性。
Python有豐富的第三方庫和工具,包括NumPy、SciPy、Pandas、Matplotlib
等用于數據分析和科學計算的庫,Django、Flask等用于Web開發的框架,以及
機器學習和深度學習的庫如TensorFlow、PyTorch等。
擴展性強:Python可以使用C、C++等編寫擴展模塊,也可以被其他語言作
為擴展模塊調用。
開源免費:Python是開源的,免費使用,且有活躍的開發社區支持。
Python的應用廣泛,包括數據分析、人工智能、Web開發、游戲開發等領
域。其簡單易學和可擴展性強的特點使其成為了許多程序員的首選編程語言。
1.2.2MySQL簡介
MySQL是一個流行的關系型數據庫管理系統,由瑞典MySQLAB公司開發,
并由Oracle公司維護和支持。MySQL被廣泛用于Web應用程序和其他類型的軟
件,以處理各種任務,從簡單的Web頁面到復雜的Web應用程序,甚至是企業
級數據處理應用。
MySQL的主要特點包括:
開源免費:MySQL是開源軟件,允許任何人免費使用;同時也有一個商用版
2
湖南商務職業技術學院畢業設計
本提供額外的功能和支持。
輕量級:MySQL是非常輕量級的,能夠在多種操作系統和硬件平臺上運行。
高擴展性:MySQL支持大型數據庫,能夠處理數百萬到數十億行的數據,并
支持分布式處理。
安全性:MySQL具有強大的安全功能,包括支持SSL加密,權限管理等,保
障數據安全。
性能強勁:MySQL在處理大量數據和高并發請求方面有很好的表現,能夠快
速響應大量的讀寫數據請求。
MySQL的應用場景非常廣泛,包括Web應用程序、軟件開發、大數據處理等
領域。借助MySQL的高擴展性和高性能,用戶可以存儲和處理大量數據,并輕
松地在互聯網上實現數據共享。
1.2.3Jypyternotebook簡介
Jupyternotebook從本質上來說是一種應用程序,是一種基于瀏覽器的
工具。它將一些解釋性文本、數學、計算等結合起來,放在一個交互式的創作型
文檔中。并且在這個創作型文檔中所有的內容都是可分享并可見的。在一些教
學或者項目的講解中,jupyternotebook或許是一枝獨秀。因為它支持Markdown
標記語言,在瀏覽器界面編輯代碼的同時可以很方便的為代碼提供注釋。在
jypyternotebook執行代碼的同時對于注釋性文本并不會執行,這個極大的方便
了教學人員,或者開發人員講解項目
Jupyternotebook在大數據方面應用比較廣泛,特別適合用來做數據的
清洗和處理,在數據挖掘和可視化上的應用也是十分方便的。對于比較高層次的
開發人員來說,這個工具也可以用來做深度的機器學習。
對于初學者來說安裝Jupyternotebook的方法就是安裝Anaconda,因為
Anaconda的版本中就是自帶Jupyternotebook。如果覺得不需要Anaconda,可
以自主選擇進入官網下載安裝包。
2需求分析
2.1可行性需求分析
1、技術可行性
Python是面向對象語言中的一門通俗易懂的計算機編程語言,本次項目中
使用Python編寫程序來實現數據獲取,數據清洗預處理,數據可視化。在數據獲
3
湖南商務職業技術學院畢業設計
取的過程中遇到一些小問題。隨后通過抓包分析發現瓜子二手車網站的頁面的
數據是動態傳輸的,所以我們通過瀏覽器控制臺獲取請求和其參數。然后就可以
得到網頁面數據的返回值。隨后將爬取出來的原始數據暫時以csv格式儲存起
來,在后續的數據預處理和可視化中再進行調用。最后我們會將準確的數據存入
MySQL數據庫中做持久化儲存。
以上為此次項目的技術可行性,我也將在后續的工作中將所有的步驟實現
到位,保證數據的準確性和安全性。
2、項目可行性
本次項目通過采集的是我們國家比較知名的二手車交易平臺瓜子二手車交
易平臺,來分析我國的二手車市場行情,我們也將會從車輛品牌,車輛排量,
車輛顏色,車輛年份對他進行深度的解析,分析出相對有價值的信息,最后用
可視化對結果進行解析得出結論二手車交易平臺,而建立一個完善的二手車交
易平臺,不僅可以有效避免交易中的欺詐風險,而且還可以提供保險、退貨等
一系列服務,為我們的二手車的買家和賣家提供更安全、放心、便利的交易環
境。
2.2采集目標功能分析
本次項目的數據集的來源是瓜子二手車交易網站,是通過python爬取瓜子
二手車交易網站在湖南所有信息。數據清洗后共4333條記錄,爬取完成后會去
盡可能的檢查數據的準確性,真實性,可行性,確定爬取出來的數據無誤并且是
屬于瓜子二手車交易網站實時存在的二手車信息。
分析瓜子二手車交易網站信息,明確我們需要爬取的二手車有車輛品牌、車
型、車輛排量、車輛顏色、車輛年份、生產批準日期等數據,在對原始的數據進
行一個預處理后我們會對其數據進行一個多個維度的分析。例如,從車輛的排量
對其進行一個分析,查看有多少款車輛排量是2.0排量,又有多少車輛的排量是
1.6排量。又或者想要得到二手車車輛的車輛顏色,那么我們就可以根據車輛的
顏色去統計說明什么顏色的車輛是最多的,查看什么顏色是人們普遍喜歡的顏
色并且更加容易賣出。
2.3關鍵技術分析
2.3.1網絡爬蟲技術
在我們日常生活中瀏覽網頁通常都會遇到需要緩存在本地的數據,當數量
4
湖南商務職業技術學院畢業設計
量比較小的時候我們可以自己采取手動下載的方式去獲得想要的數據,不過在
我們的大數據領域一般用到的數據體量都是幾個G甚至幾個T的單位,這個時
候采取手動下載獲取數據無疑是一個很愚蠢的方式,所以我們會采取網絡爬蟲
的手段自動化的獲取數據。
網絡爬蟲也被人們叫做網絡機器人,顧名思義就是讓人們不用自己動手操
作,只需要編寫程序或者一些小腳本用來自動的瀏覽龐大的互聯網,并且對想要
的目標網頁去進行精準的數據的采集。當下常見的一些網絡爬蟲按照實現的原
理和技術結構一般可以分為:通用網絡爬蟲、聚焦網絡爬蟲、增量式網絡爬蟲、
深層網絡爬蟲等一些類型。
在大家的印象中常常將普通的網絡爬蟲與黑客混為一談,其實二者之間有
很大的區別。黑客屬于違反法律肆意竊取個人或者組織內有價值的信息以此獲
利,而爬蟲僅僅知識用來代替重復無意義的動作,在合法合理的范圍內去獲得自
己想要的信息,在一定程度上網絡爬蟲和普通用戶瀏覽網頁是沒有本質區別的,
但是爬蟲確實可以作為一種攻擊的手段。在編寫網絡爬蟲的腳本時沒有設置一
定的睡眠緩沖時間,通過極高的頻率反復訪問客戶端網站會讓服務器持續在高
強度環境下工作,對服務器造成一定的壓力,如果一時間處理不過來服務器往往
會自動關機,也就是宕機,這也是常見的DDOS攻擊。
由此可見,網絡爬蟲技術在應用場景的不同它發揮的作用也是不同的。在好
的場景下可以幫我們完成搶購、投票、報名、搶購等操作。但是在壞的場景下
同樣也能一直發送騷擾信息,給他人帶來困擾。爬蟲技術是一把雙刃劍,一個不
小心可能就會傷害到自己和他人,所以我們技術人員要懂法、守法。在法律允許
的范疇內去編寫自己的腳本程序,不要一不小心半只腳踏進犯罪的深淵。
有爬蟲技術,那也一定存在反爬取的技術了。高級的爬蟲都會涉及到反爬蟲
的概念,往往能夠繞過或者突破人家的防守機制從而獲取到自己想到要的數據
時,就代表爬蟲工程師的個人水平已經很不錯了。常見的反爬機制有IP、JS加
密、css反爬、或者Ajax異步、驗證碼等等手段。這些手段會加大爬蟲工程師
的工作量,也會加大網站的開發成本。所以像一般的小網站最多設置一個小反爬,
對于我們獲取數據而言也相對容易。我們也不用去考慮成本的問題。
2.3.2文件存取技術
Python內置csv模塊如圖2-1顯示:
5
湖南商務職業技術學院畢業設計
圖2-1python內置csv模塊
2.3.3可視化技術
爬取下來的數據通過預處理、保存為csv文件格式。該數據集我們能否一
眼就得到我們想要的結論呢?答案是否定的!
我們需要一種技術,根據我們獲取到的龐大數據將其通過統計學圖形的方
式展現在我們眼前,讓我們對其結果一目了然。這個就是數據可視化技術。
顯然我們獲取到的數據是一串串冗長的字符串,上面寫的一條條信息或許
我們能夠看懂讀懂,但是當它成千上萬的時候我們短時間內很難看出端倪和破
綻,我們需要進行深入的了解和分析。對這一坨枯燥而乏味的數據集進行處理完
畢后,我們就要導入需要的第三方庫將數據合理的進行判斷,決定使用什么樣的
幾何圖形才能最好、并且直觀的表達出數據集的信息。
多年來可視化的技術也逐漸發展成為了一下三類:科學可視化、信息可視
化、可視化分析。而我們這里用到的就是信息可視化,信息可視化的處理對象是
非結構化、非幾何的抽象數據,如金融交易、社交網絡和文本數據,其核心挑戰
是針對大尺度高維復雜數據如何減少視覺混淆對信息的干擾。
本次項目中僅僅只是將得到的數據用很簡單的可視化手段實現數據可視化,
具體的就是用python第三方庫matpoltlab去進行可視化,matplotlab中包含
了許多庫,分別對應餅圖、條形圖、直方圖、折線圖等圖形,可以很好的將數據
高效率的表現出來,可視化圖形呈現出來后對于結果自然一目了然,然后得出結
論。
3數據采集
3.1采集頁面分析
我們首先通過谷歌瀏覽器搜索瓜子二手車的官方網頁,然后找到湖南二手
6
湖南商務職業技術學院畢業設計
車目錄集頁面觀察圖3-1,其中URL為:
/car-source/carDetail/detail然后點擊頁面下方的
分頁按鈕,同時觀察URL,發現URL沒有變化。
圖3-1數據網址頁面
按F12調出開發者工具,刷新頁面,如圖3-2。
圖3-2開發者工具
利用全局搜索工具定位所需數據位置,點擊開發者工具上面的Headers字
段,分析這是個什么請求,發現這個是一個GET請求,如圖3-3。
7
湖南商務職業技術學院畢業設計
圖3-3FormData
3.2數據字段分析
我們先來到網頁面打開網頁的選擇欄,然后將選擇欄目定位到車輛要爬取
的位置也就是定位到我們所需要的數據所在的位置,然后跳出開發者工具頁面
刷新一下頁面再進入,點擊開發者工具界面上方的數據預覽Preview按鈕,如圖
3-4,可以看到我們需要的所有的數據信息都是呈現json格式傳遞在這個網頁
面,我們還得知他是post方法響應的網站,所以我們可以根據以上特點通過
Requests方法中的post方法來獲得響應的數據,最原始的數據格式是呈現
json格式的所以我們需要重復獲取響應數據然后依次寫入到csv格式的文件當
中。json數據中包括車輛品牌型號、年份、公里數、排量、顏色等數據字段。
圖3-4分析數據類型頁面
8
湖南商務職業技術學院畢業設計
3.3編程實現
如圖3-5導入所需庫
圖3-5導入所需庫頁面
如圖3-6,3-7設置請求頭,偽裝成瀏覽器訪問服務器。
圖3-6請求頭內容頁面
圖3-7請求頭內容頁面
代碼實現如下:
importcsv
importrandom
importtime
importrequests
importexecjs
9
湖南商務職業技術學院畢業設計
defget_data(clueId):
cookies={
'uuid':'76f047df-50f5-4133-bc3b-35f9a3a59868',
'sessionid':'00872dac-1c74-44a8-8466-edafb5482c39',
'guazitrackersessioncadata':'%7B%22ca_kw%22%3A%22-%22%7D',
'cainfo':
'%7B%22ca_s%22%3A%22seo_baidu%22%2C%22ca_n%22%3A%22default%22%2C%22ca_
medium%22%3A%22-%22%2C%22ca_term%22%3A%22-%22%2C%22ca_content%22%3A%
22-%22%2C%22ca_campaign%22%3A%22-%22%2C%22ca_kw%22%3A%22-%22%2C%22ca
_i%22%3A%22-%22%2C%22scode%22%3A%22-%22%2C%22guid%22%3A%2276f047df-50f
5-4133-bc3b-35f9a3a59868%22%7D',
'user_city_id':'-1',
'cityDomain':'www',
'puuid':'40dfba84-b135-4ead-fce0-6a65b97e9232',
'dsnDataObj':'%7B%7D',
'browsingHistoryCount':'1',
}
ttt=str(round(time.time()*1000))
stringifyParams=
f'ca_n=default&ca_s=seo_baidu&clueId={clueId}&deviceId=76f047df-50f5-4133-bc3b-35f9a3a
59868&fromCrm=1&guazi_city=-1&guid=76f047df-50f5-4133-bc3b-35f9a3a59868&orgUserId=
&osv=ios&platfromSource=wap&sourceFrom=wap&unit=&userId=&versionId='
token=pile(open('瓜子二手車.js','r',encoding='utf-8').read()).call('get_token',
stringifyParams,ttt)
#print(token)
headers={
'authority':'',
'accept':'application/json,text/plain,*/*',
'accept-language':'zh-CN,zh;q=0.9',
'cache-control':'no-cache',
'client-time':ttt,
#'cookie':'uuid=76f047df-50f5-4133-bc3b-35f9a3a59868;
sessionid=00872dac-1c74-44a8-8466-edafb5482c39;
guazitrackersessioncadata=%7B%22ca_kw%22%3A%22-%22%7D;
cainfo=%7B%22ca_s%22%3A%22seo_baidu%22%2C%22ca_n%22%3A%22default%22%2C%
22ca_medium%22%3A%22-%22%2C%22ca_term%22%3A%22-%22%2C%22ca_content%22%
3A%22-%22%2C%22ca_campaign%22%3A%22-%22%2C%22ca_kw%22%3A%22-%22%2C%
22ca_i%22%3A%22-%22%2C%22scode%22%3A%22-%22%2C%22guid%22%3A%2276f047d
f-50f5-4133-bc3b-35f9a3a59868%22%7D;user_city_id=-1;cityDomain=www;
puuid=40dfba84-b135-4ead-fce0-6a65b97e9232;dsnDataObj=%7B%7D;
browsingHistoryCount=1',
'origin':'',
10
湖南商務職業技術學院畢業設計
'pragma':'no-cache',
'referer':'/',
'sec-ch-ua':'"Chromium";v="110","NotA(Brand";v="24","GoogleChrome";v="110"',
'sec-ch-ua-mobile':'?0',
'sec-ch-ua-platform':'"Windows"',
'sec-fetch-dest':'empty',
'sec-fetch-mode':'cors',
'sec-fetch-site':'same-site',
'token':'',
'user-agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36
(KHTML,likeGecko)Chrome/Safari/537.36',
'verify-token':token,
}
params={
'versionId':'',
'sourceFrom':'wap',
'deviceId':'76f047df-50f5-4133-bc3b-35f9a3a59868',
'guid':'76f047df-50f5-4133-bc3b-35f9a3a59868',
'userId':'',
'orgUserId':'',
'unit':'',
'clueId':clueId,
'guazi_city':'-1',
'ca_s':'seo_baidu',
'ca_n':'default',
'osv':'ios',
'fromCrm':'1',
'platfromSource':'wap',
}
response=requests.get(url='/car-source/carDetail/detail',
params=params,cookies=cookies,
headers=headers)
#print(response.json())
#print(clueId)
returnresponse.json()['data']
defdata_parse(json_data):
ifjson_data['carCommodityInfo']['carRecordInfo']['summary'][4]['value']=='自動':
return0
11
湖南商務職業技術學院畢業設計
item={}
item['品牌名稱']=json_data['carCommodityInfo']['basicInfo']['titleDesc']
item['公里數']=json_data['carCommodityInfo']['carRecordInfo']['summary'][1]['value']
item['價格']=json_data['carCommodityInfo']['carPriceInfo']['showPrice']
item['排量']=json_data['carCommodityInfo']['carRecordInfo']['summary'][4]['value']
item['車身顏色']=json_data['carCommodityInfo']['carRecordInfo']['summary'][7]['value']
withopen('瓜子二手車.csv','a',encoding='utf-8',newline='')asf:
#finame=['品牌名稱','公里數','價格','排量','車身顏色']
csv_writer=csv.writer(f)
csv_writer.writerow(item.values())
print(item)
defdata_clean(file1,file2):
withopen(f'{file2}.csv','a',encoding='utf-8',newline='')asf1:
csv_writer=csv.writer(f1)
withopen(f'{file1}.csv','r',encoding='utf-8')asf2:
#finame=['品牌名稱','公里數','價格','排量','車身顏色']
#csv_reader=csv.reader(f)
data=f2.read()
#print(data.split('\n')[1:-1])
count=0
foriindata.split('\n')[1:-1]:
ifi.split(',')[-2]!='自動':
print(i)
csv_writer.writerow(i.split(','))
count+=1
print(count)
defmain(file):
withopen(f'{file}.txt','r',encoding='utf-8')asf:
s=f.read()
clueIds=s.split('\n')[:-1]
#print(clueIds)
forclueIdinclueIds[600:]:
print(clueId)
json_data=get_data(clueId)
data_parse(json_data)
time.sleep(random.randint(15,20)/10)
12
湖南商務職業技術學院畢業設計
if__name__=='__main__':
main(file='clue_ids')
#data_clean(file1='瓜子二手車1',file2='瓜子二手車(清洗)')
4數據清洗與處理
獲得龐大的數據集之后我們需要對數據進行預處理,也就是所謂的清洗和
檢查,確定爬取過來的數據是否存在無效值和確實值,要保證數據的一致性,這
個對于信息質量的評估是一項很重要的任務。不僅如此,我們需要將數據進行有
理化和有序化,這樣子能夠在數據調用共享過程中方便很多開發人員對數據信
息的使用。
本次項目中我們需要將爬下來的數據和網頁原數據進行比對,并且檢查是
否出現空值、錯值,還有數據的位置是否正確。根據不同的需求我們要對數據進
行不同的處理。
4.1數據清洗
打開爬取到的數據文件,如下圖:
圖4-1查看表格數據的描述
我們在圖4-1中查看表格數據的表述,同時我們用isnull函數來查詢數據
是否缺失中經過比對和檢查數據,如圖4-2,確定爬取過來的數據沒有存在無效
值和確實值,要在我爬取的數據里面并沒有發現我所需的數據發現缺失,也沒有
多余的數據。
13
湖南商務職業技術學院畢業設計
圖4-2查看表格是否有數據丟失
4.2數據儲存
數據儲存得方法有很多種,常見得可以直接用記事本格式儲存(txt),或者
直接用其他文件的形式儲存csv、excel、json等,但是以上方法保存的數據體
量普遍都比較小。如果需要儲存較大的數據信息就需要用到我們的數據庫,數據
庫也分為關系型和非關系型數據庫。關系型數據庫比較典型的有MySQL和
Oracle等,非關系型數據庫等以鍵值對形式儲存數據的代表有Mongodb、Redis
等。本次項目我們用到的是csv。
如圖4-3所示:
圖4-3數據存儲為csv頁面
14
湖南商務職業技術學院畢業設計
4.3編程實現
如圖4-4,4-5,4-6。
圖4-4編程代碼(一)
圖4-5編程代碼(二)
15
湖南商務職業技術學院畢業設計
圖4-6編程代碼(三)
圖4-7編程代碼(四)
5數據統計與分析
5.1數據準備
導入相關庫,如圖4-1、5-2。
16
湖南商務職業技術學院畢業設計
圖5-1數據準備頁面
圖5-2數據加載頁面
17
湖南商務職業技術學院畢業設計
5.2數據展示
5.2.1依據車輛品牌型號年限進行統計
圖5-3數據展示頁面
我們把表格中的所有車輛品牌年限的字段數據進行一個匯總以及一個處理,
隨后將他出現的頻率次數進行統計,最后生成一個特定的序列,在序列里面的
數據按照詞頻生成我們想要的詞云圖,如圖5-3中不難看出來年限里面2016款
和2018款是出現的最多的,其次便是2017款,可以看出在二手車市場里面五
至七年的年限的車是二手車里面的頭牌,新車開到五至七年這個區間內賣出的
概率是最高的,當然也說明了我們大部分人去考慮買二手車能接受的年限也就
是五至七年。
不僅如此,在詞云圖中我還發現了我們國家的進口車輛與合資車是占據很
大部分的,國產車還得要更加的努力,爭取再過幾年的二手車市場能在詞云圖
上看到國產車。不難看出在詞云圖中的大部分品牌都屬于德國車或者日系車,
這也說明了這兩個地區的車輛也是屬于我國人群購買的主力。
18
湖南商務職業技術學院畢業設計
5.2.2依據車輛公里數進行統計
圖5-4數據展示頁面
從圖5-4中可以看出在十萬公里以內的車輛是二手車市場里面最多的,大
部分人都會在十萬公里內去將自己的車輛進行交易,而大于了十萬公里數的車
輛相對來說比較少,這也充分的說明了車輛在十萬公里內時進行交易是最容易
出售的而根據有關網站對數據的統計中,絕大部分人對車輛的使用大概是一年
開一萬公里左右,從圖中我們可以看出5到7萬公里數的車是最多的,這也變
相證明了圖5-5的數據可靠性
5.2.3據車輛排量以及進氣方式進行統計和分析
圖5-5數據展示頁面
從圖5-5中我們可以很直觀的看出2.0T二手車是在所有排量中一騎絕塵
19
湖南商務職業技術學院畢業設計
的,這個排量在所有的車里面是一個黃金排量,能夠適用于大部分中國的大部
分地形。
要知道我國對于車輛是有排量稅的,所以在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鋼鐵廠違章計分心得體會模版
- 浙江省衢州市五校聯盟2024-2025學年高二下學期期中聯考化學試卷(PDF版含答案)
- 新概念121-130短語總結模版
- 《語文園地三》教學設計十二
- 科創集團與物業合作協議
- 包裝工藝學第10章
- 學前兒童發展 課件 第4章 學前兒童感知覺的發展
- 運營管理:運營流程(課件)
- 新聞培訓材料
- 藥物性肝病的臨床護理
- 高考數學17題 立體幾何-2025年高考數學沖刺復習(北京專用)解析版
- 《艾薩克·牛頓》課件
- 抱負與使命主題作文導寫-2024-2025學年高一語文單元寫作深度指導(統編版必修下冊)
- 浙江開放大學2025年《社會保障學》形考任務3答案
- 福建省莆田市2025屆高中畢業班高三年級第四次教學質量檢測試卷物理及答案(莆田四檢)
- 貨物裝卸倉儲合同協議
- 2024年四川省寧南縣事業單位公開招聘醫療衛生崗筆試題帶答案
- 初中數學融入課程思政的路徑探索
- 智能制造對融資租賃行業影響-全面剖析
- 銀行資產負債管理試題及答案
- 壓力容器安全教育培訓
評論
0/150
提交評論