Hadoop大數據開發基礎與案例實戰(微課版)課件 6.10 Hive函數_第1頁
Hadoop大數據開發基礎與案例實戰(微課版)課件 6.10 Hive函數_第2頁
Hadoop大數據開發基礎與案例實戰(微課版)課件 6.10 Hive函數_第3頁
Hadoop大數據開發基礎與案例實戰(微課版)課件 6.10 Hive函數_第4頁
Hadoop大數據開發基礎與案例實戰(微課版)課件 6.10 Hive函數_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Hadoop大數據項目開發——Hive函數目錄content02Hive窗口函數01Hive內置函數Hive內置函數分類函數描述數值相關函數

greatest(Tv1,Tv2,..)返回一組相同類型數據中的最大值(過濾NULL值)least(Tv1,Tv2,...)返回一組相同類型數據中的最小值(過濾NULL值)rand()返回0~1之間的隨機值rand(INTseed)返回固定的隨機值round(DOUBLEA)返回參數A四舍五入后的BIGINT值Hive內置函數分類函數描述字符串相關函數

upper(STRINGA)ucase(STRINGA)將字符串A中的小寫字母轉換成大寫字母lower(STRINGA)lcase(STRINGA)將字符串A中的大寫字母轉換成小寫字母concat(STRINGA,STRINGB,...)字符串拼接函數,返回A連接B等產生的字符串regexp_replace(STRINGA,STRINGB,STRINGC)字符串替換函數,用字符串C替換字符串A中的Brepeat(STRINGstr,INTn)返回字符串str重復n次的結果trim(STRINGA)ltrim(STRINGA)rtrim(STRINGA)trim(STRINGA)刪除字符串兩邊的空格,但不會刪除中間的空格,ltrim(STRINGA)和rtrim(STRINGA)分別刪除左邊和右邊的空格length(STRINGstr)獲取字符串str的長度split(STRINGstr,regex)按給定的正則表達式regex分割字符串str,將結果作為字符串數組返回substr(STRINGa,STRINGb)從字符串a中,第b位開始取,取右邊所有的字符Hive內置函數分類函數描述條件函數

if(BOOLEANtestCondition,TvalueTrue,TvalueFalseOrNULL)函數會根據條件返回不同的值,如果滿足條件,返回第一個參數值,否則返回第二個參數值nvl(Tvalue,Tdefault_value)判斷值是否為空,如果T(可以為任意數據類型)為空,則返回默認值時間相關函數

unix_timestamp()獲取當前系統時間,返回值為數字型秒數to_date(stringtimestamp)將時間戳轉換為日期,傳入參數也可以是當前時間戳current_timestampdatediff(STRINGenddate,STRINGstartdate)返回INT類型的兩個日期相差的天數date_add(STRINGstartdate,INTdays)獲取增加天數后的日期last_day(STRINGdate)獲取傳入日期的月末日期Hive內置函數分類函數描述聚合函數

count(*)和count(expr)返回檢索行的總數sum(col)和sum(DISTINCTcol)返回col所有元素的總和avg(col)和avg(DISTINCTcol)返回col所有元素的平均值min(col)返回col所有元素的最小值max(col)返回col所有元素的最大值類型轉換函數cast(expras<type>)將一個數據類型轉換為另一個數據類型膨脹函數explode()將一行數據轉換成列數據,可以用于array和map類型的數據,函數中的參數傳入的是arrary數據類型的列名。此函數不能關聯原有的表中的其他字段、不能與groupby、clusterby、distributeby、sortby聯用、不能進行UDTF嵌套和不允許選擇其他表達式。窗口分析函數想要既顯示聚集前的數據,又要顯示聚集后的數據,引入了窗口函數。窗口函數又叫分析函數,窗口函數兼具分組和排序功能。over()默認的窗口大小是從第一行到最后一行的所有數據。partitionby是按照要求進行分組,這樣設定之后,over的窗口大小就是一個分組。當只指定分組時,sum、avg統計的數據就是分組內的數據,當既指定分組又指定排序時,sum、avg統計的數據就是分組第一行到當前行的數據。窗口函數最重要的關鍵字是partitionby和orderby。分組TOPN函數創建userinfo表將本地數據user.txt文件加載到userinfo表分組TOPN函數查詢結果分組TOPN函數最終查詢結果累加計算函數創建index表將本地數據index.txt文件加載到index表累加計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論