<menuitem id="bnags"></menuitem>

    <ins id="bnags"><video id="bnags"></video></ins><mark id="bnags"></mark>
  • <ins id="bnags"></ins>

      <tr id="bnags"><small id="bnags"></small></tr>

    1. 首頁 慕課課程正文

      大數據課程:數據分析師工作內容及擇業指南

      大數據課程:數據分析師工作內容及擇業指南

        大數據課程網上有很多資料,小編整理了一些有關數據分析師的一些基本工作內容,同時推薦了一份擇業指南。??

        大數據課堂:數據分析師都干啥

        數據分析師,簡單切詞為“數據”,“分析”,“師”。因此,獲取必要的數據,分析這些數據,然后從數據中發現一些問題提出自己的想法,這就是一個數據分析師的基本工作內容。

        自己做了數據分析師,真的覺得古語說的對,“功夫在詩外”。一名好的數據分析師,接到一個需求時,會更多考慮這個需求本身,包括要做的東西是什么,為什么這么做,還可以怎么做,怎么去做,關鍵點是什么。都想清楚了,才去動手做。建議任何一名數據分析人員,都能在做以前把問題想清楚,確認清楚,不要等到做完才發現自己做錯了,那樣會很浪費時間。自己這方面曾犯過N多錯誤。

        下面簡單談下做一名數據分析師要經歷的幾個步驟:

       ?。?)獲取數據

        獲取相關的數據,是數據分析的前提。每個企業,都有自己的一套存儲機制。比如淘寶,所有的數據都在HADOOP上,很多數據都要經過HADOOP,hive來獲取。因此,基礎的SQL語言是必須的。具備基本SQL基礎,再學習下HIVE的細節的語法,基本就可以通過HIVE拿到很多數據了。每個需求明確以后,都要根據需要,把相關的數據獲取到,做基礎數據。

       ?。?)數據處理

        獲取數據,把數據處理成自己想要的東西,是一個關鍵點。很多時候,有了數據不是完成,而是分析的開始。數據分析師最重要的工作就是把數據根據需求處理好,只有數據跟需求結合起來,才能發揮數據的價值,看到需求的問題和本質所在。如果連數據都沒處理好,何談從數據中發現問題呢?

        對于數據的處理,有兩種形式:

        a>如果初步提取的數據是在LINUX上,建議學一門腳本語言,比如AWK,或者PYTHON。如果掌握一門腳本語言,不僅可以在LINUX系統上寫很多自動腳本來運行,會大大節省自己的時間,而且可以通過腳本語言把基礎數據處理成自己想要的任何形式,直接可以使用。

        b>如果數據沒有在LINUX上,那可以download,然后通過其他統計軟件來處理。個人推薦SAS或者R語言。SAS的強大,不必多說。沒有SAS解決不了的問題,而且SAS也有SQL,處理起來也方便。R語言最近也很火,而且免費,packages越來越多,畫圖也簡單,類似Matlab。如果前期數據處理的好,后續只需要通過R或者SAS畫一些圖就可以了。在數據分析師的世界,按照價值排序,圖>表>文字。

        大數據研究常用軟件工具與應用場景

        如今,大數據日益成為研究行業的重要研究目標。面對其高數據量、多維度與異構化的特點,以及分析方法思路的擴展,傳統統計工具已經難以應對。

        工欲善其事,必先利其器。眾多新的軟件分析工具作為深入大數據洞察研究的重要助力,也成為數據科學家所必須掌握的知識技能。

        然而,現實情況的復雜性決定了并不存在解決一切問題的終極工具。實際研究過程中,需要根據實際情況靈活選擇最合適的工具(甚至多種工具組合使用),才能更好的完成研究探索。

        為此,本文針對研究人員(非技術人員)的實際情況,介紹當前大數據研究涉及的一些主要工具軟件(因為相關軟件眾多,只介紹常用的),并進一步闡述其應用特點和適合的場景,以便于研究人員能有的放矢的學習和使用。

        【基礎篇】

        傳統分析/商業統計

        Excel、SPSS、SAS 這三者對于研究人員而言并不陌生。

        ◆ Excel 作為電子表格軟件,適合簡單統計(分組/求和等)需求,由于其方便好用,功能也能滿足很多場景需要,所以實際成為研究人員最常用的軟件工具。其缺點在于功能單一,且可處理數據規模?。ㄟ@一點讓很多研究人員尤為頭疼)。這兩年Excel在大數據方面(如地理可視化和網絡關系分析)上也作出了一些增強,但應用能力有限。

        SPSS(SPSS Statistics)和SAS作為商業統計軟件,提供研究常用的經典統計分析(如回歸、方差、因子、多變量分析等)處理。

        ◆ SPSS 輕量、易于使用,但功能相對較少,適合常規基本統計分析

        ◆ SAS 功能豐富而強大(包括繪圖能力),且支持編程擴展其分析能力,適合復雜與高要求的統計性分析。

        上述三個軟件在面對大數據環境出現了各種不適,具體不再贅述。但這并不代表其沒有使用價值。如果使用傳統研究方法論分析大數據時,海量原始數據資源經過前期處理(如降維和統計匯總等)得到的中間研究結果,就很適合使用它們進行進一步研究。

        數據行業從業者到底能掙多少錢

        隨著大數據時代的到來,數據分析與探勘成為科技顯學,各行各業對于大數據的濃厚興趣也直接反映在大數據人才的豐厚薪資中。

        根據美國大數據及商業智能軟體公司 SiSense 調查研究指出1,資訊分析相關人才起薪約為年薪 5.5 萬美元,換句話說,相較美國大學畢業生平均年薪為 4.76 萬美元,高出 7400 美元,而最高薪的數據科學家,平均年薪為 13.2 萬美元,打敗一大票科技公司的高階工程師,而且這個差距還在繼續拉大中。

        以下根據 Payscale 所提供的職位基本年薪做參考,為大家整理了四個最常見的大數據人才工作內容以及薪資范圍。

        數據分析師

        這個職位大概是最常見的,「數據分析師」指的是不同行業中,專門從事行業內數據蒐集、整理、分析,并依據這些數據做出研究、評估的專業人員。

        這類職缺通常要求應徵者有數學、統計、或是電腦科學等的相關學位跟背景,最常見的工作技能要求是 SQL、R、SAS、SPSS、Excel,以及隨著需要處理的數據量日漸龐大,Hadoop 也被許多公司列為必備的基本條件之一。

        美國地區數據科學家的年薪大約在 $36,139 到 $77,696 美元之間(約等于年薪臺幣 110 萬到 240 萬),中間值大約是 $51,224 美元(臺幣 160 萬)。擁有統計分析、數據建模(Data modeling)以及 SAS 等技能的應徵者一般來說更有機會得到高薪。

        數據科學家

        被《哈佛商業評論》譽為「21 世紀最性感工作」的數據科學家可以說是數據分析師的進化版。

        兩者的分別可以從職稱的不同看出端倪:數據「分析師」統計分析數據作為評估基準來設計行銷方案時,數據「科學家」則是把心力放在設計分析數據的演算法,提出不同的理論來測試這些結論,最后建立統計模型來判斷消費者行為、找出最關鍵的行為誘發因子。

        因此數據科學家需要具備程式開發的能力,例如 Java 或 Python,而且對機器學習(Machine Learning)領域有所了解。

        美國地區的數據科學家年薪大約落在 $63,192 到 $142,118 美元間,中間值是 $96,579 美元,幾乎是數據分析師的兩倍。

        數據架構師

        數據架構師要負責建立和維持公司數據儲存的技術基準,策劃硬體和軟體的結構,確保數據儲存系統可以支持未來的數據量和分析需求。

        數據架構師通常擁有電腦科學學位,并且精通數據庫相關知識,像是關聯式數據庫(Relational database)、數據倉儲(Data warehouse)、以及分散式數據系統(Distributed storage system)等等。

        美國地區數據架構師的薪資范圍是 $65,928 到 $147,868 美元,中間值為 $105,581 美元,以目前的趨勢來看,比起 SQL ,擅長 OracleDB 的人才較容易得到高薪。

        數據分析師的擇業指南

        數據分析師這個職業現在越來越火爆。本文面向那些準備投身于這個行當的年輕人,在選擇怎樣的公司上給出了三條參考標準。它們分別是:第一點:去供職于那些利用數據分析來做市場戰略定位的公司;第二點:去為一個擁有著偉大想法的公司工作;第三點,去選擇給一家即將進入空白市場的公司

        現在確實是屬于數據分析師的天下了。如果你有能力,有經驗,充滿好奇心以及永不倦怠的熱情,作為數據分析師的你可謂前景廣闊,有一大批公司乖乖站在你家門前掛著牌子等著你的挑選。但是在評估到底去哪家公司的平臺上施展你的才華的時候,卻是有著很多考量的。即便是一個從業多年的老手也不可能在各種大小規模不一,發展階段不同,擁有各自的企業文化的公司待過。他們也不可能橫跨多個領域,掌握多種技術。但是,在本文中卻給出所有有志于從事數據分析師這個職業的年輕人一些經驗。大體上總結一下就三點內容,憑借這三點內容,你可以非常理性、客觀地分析出來眼前的這家公司到底是否值得去。

        第一點:去供職于那些利用數據分析來做市場戰略定位的公司

        公司想要在市場上擁有特殊的競爭優勢,從而實現與眾不同的市場地位,其實途徑方法都有很多種。有一些利用價格來區分自己,比如靠低價來獲取市場競爭優勢;還有一些公司愿意通過更加優質的產品來達到鶴立雞群的效果;更有一些人通過訂單處理進程的快慢贏得顧客的認可與忠誠,更快的配送上門服務就是很好的例證。

        一個數據分析師應該選的這家公司,應該憑借數據學來做到自己與其他競爭對手之間的「切割」。請注意,有可能數據學可以用來支持更低的價格,更優質的產品,更快的配送速度,但是它絕對不是實現這些優勢的主要原因。直接,且主要的原因通常情況下是規模經濟造成了更低的價格,專利和品牌帶來了更加優質的產品,自動化的技術使得配送速度提升。如果公司核心競爭力是構建在數據和分析工具上,那么它會迅速跟其他競爭者拉開幾個身位。

        一旦這種優勢得以建立,整個公司都會瞄準數據學發力,所有的資源都是圍繞著數據分析投入。它會更加愿意投資,獲得數據領域最頂尖的人才,打造最優秀的底層系統,不斷地將最前沿的算法和計算技術推向極致,開發各種不可思議的工程產品來展現數據學的魔力。

        在做市場上戰略區分的時候,「足夠好」這個詞是絕對不能出現的。公司和數據分析師雙方都應有著足夠強烈的意愿,推動技術再往前發展一點點,永無止境地去摸索極限,并愿意承擔更多的風險。你每天早上起床睜眼的時候,你一想到這個公司,就能興奮的一個鯉魚打挺立刻翻身下床,精神抖擻,迫不及待的開展全新一天的工作,它是一個能夠拉動提升你,讓你成為這個世界最優秀人才的平臺。

        相關閱讀

        大數據工程師職業發展以及薪酬一覽

        智慧數據:大數據平臺規劃方案(ppt)

        以上就是本期的大數據課程全部內容,如果你想學習更多大數據相關內容,請關注慕課 | 數據觀

      分享:
      延伸閱讀
        速讀區塊鏈
        貴州

        貴州大數據產業政策

        貴州大數據產業動態

        貴州大數據企業

        更多
        大數據概念_大數據分析_大數據應用_大數據百科專題
        企業
        更多
        两个人的房间在线观看完整版