前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的統(tǒng)計學大數(shù)據(jù)分析主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞 泛在學習 學習生態(tài) 有效學習 英語學習 大數(shù)據(jù)
近年來,移動互聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術(shù)發(fā)展日新月異,已經(jīng)成為推動教育變革的重要力量。移動通信終端的普及為學生營造了泛在英語學習環(huán)境,大數(shù)據(jù)技術(shù)開啟了個性化智能教育時代,翻轉(zhuǎn)課堂、MOOC、微課等新型教學模式層出不窮,雖然它們不能取代傳統(tǒng)教學模式,但英語教師必須與時俱進,重視信息技術(shù)對傳統(tǒng)英語課堂的改造和提升,以全新的視角思考英語教學的變革方向。
一、研究理論概述
1.泛在學習理論
泛在學習是指任何人在任何時間和任何地點都可以通過泛在網(wǎng)絡(luò)實現(xiàn)任何知識內(nèi)容的學習。泛在網(wǎng)絡(luò)和泛在計算技術(shù)為人類實現(xiàn)隨時隨地的泛在學習提供了技術(shù)保障,信息技術(shù)和教育技術(shù)的融合發(fā)展正深刻改變著知識的傳播方式和學生的學習方式,不斷重構(gòu)著教育和學習的生態(tài)環(huán)境。一方面,移動通信終端的多元化發(fā)展解除了傳統(tǒng)英語學習對地點的約束,翻轉(zhuǎn)課堂、MOOC等新型教學模式使學生可以自由地選擇學習時間、進度、內(nèi)容和學習方式。另一方面,傳統(tǒng)教學設(shè)備正在向數(shù)字教學設(shè)備變遷,教育領(lǐng)域信息基礎(chǔ)設(shè)施建設(shè)有效地推動跨區(qū)域教學資源整合,海量的多媒體教學內(nèi)容必須和學生的碎片化時間有效結(jié)合,教師需要針對不同學情的學生進行精準施策和差異化施策。
2.學習生態(tài)理論
學習生態(tài)是由學習群體及其所處的環(huán)境共同構(gòu)成的生態(tài)系統(tǒng)。系統(tǒng)由信息技術(shù)、多媒體教學設(shè)施等支撐,通過以合作、交流、共享、互動為特征的教育實踐,實現(xiàn)知識信息傳遞和有效學習,從而促進系統(tǒng)的不斷優(yōu)化。學生與學習環(huán)境、學生和學習群體之間密切聯(lián)系、相互作用,通過知識的吸納、內(nèi)化、創(chuàng)新、外化、反饋等過程實現(xiàn)有效學習[1]。在泛在學習的背景下,學習生態(tài)研究的是教育信息、學習主體、教師、教育信息環(huán)境之間相互作用的生態(tài)系統(tǒng),需要從教育信息化建設(shè)和應(yīng)用的視角研究各個生態(tài)系統(tǒng)成員之間的相互作用規(guī)律,維護生態(tài)系統(tǒng)的平衡發(fā)展。
3.有效學習理論
有效學習是指學生在教師的指導下,針對學習內(nèi)容采取適合自己的學習策略,積極主動地參與到學習過程中,高效率地完成知識建構(gòu),從而實現(xiàn)學習目標并優(yōu)化自身知識結(jié)構(gòu)的學習行為。有效學習是對學習內(nèi)容、學習方法、學習過程、學習結(jié)果的價值追求[2],學生可以實現(xiàn)對知識的深層次理解和靈活應(yīng)用。學習內(nèi)容的優(yōu)化在大數(shù)據(jù)背景下表現(xiàn)為對海量學習內(nèi)容的篩選、清洗與轉(zhuǎn)化[3],使之滿足學生的學習需要。學習方法調(diào)整是建立在對學生學習情況進行多元評價的基礎(chǔ)上,根據(jù)學生個人學習偏好、認知習慣、學習方式、情感態(tài)度因素、學習內(nèi)容的變化而動態(tài)進行的。學習過程的積極參與是指學生能夠積極主動地學習,充分和師生進行合作、交流,善于提出問題、分析問題和解決問題。學習評價是學生改變學習計劃、優(yōu)化學習方法的重要手段,對學生學習可以起到引導、激勵、啟示和教育作用。
二、當前英語泛在學習模式存在的主要問題
1.傳統(tǒng)課堂教學和線上教學環(huán)節(jié)缺乏有效銜接
首先,魍晨翁媒萄Ш拖呱轄萄г誚萄Ы謐?、肿R范圍上沒有有效銜接。例如,學生不知道如何在線上學習課堂上沒有掌握的知識點,或者在線上環(huán)節(jié)重復學習課堂中已經(jīng)掌握的知識點。其次,缺乏對課堂英語學習和個性化英語自主學習的融合創(chuàng)新設(shè)計。在傳統(tǒng)課堂教學中,整齊劃一的教學標準無法滿足英語學習分層分級的差異化教學要求。不同學情的學生對學習時間、空間、內(nèi)容、方式的需求不盡相同,教師在教學中沒能和學生線上學習的大數(shù)據(jù)分析結(jié)果進行有效的融合對接,僅根據(jù)自身的教學經(jīng)驗和主觀判斷作為實施因材施教的依據(jù),因此其決策缺乏精準性和穩(wěn)定性。
2.泛在學習缺乏生態(tài)性系統(tǒng)設(shè)計,學生英語泛在學習的用戶黏性不高
當前泛在學習過程特別是在線學習過程缺乏師生互動性、社交互動性、線上線下互動性。泛在學習僅停留在將文字、圖像、視頻等教學資料數(shù)字化、網(wǎng)絡(luò)化、集成化和泛在化的階段,這在某種程度上增加了學生英語學習的選擇性和便利性,但缺乏針對不同學生的學習黏性設(shè)計,因此泛在學習效果并不理想。
3.英語泛在學習體系缺乏具有“參與感”和“現(xiàn)場感”的語言學習環(huán)境
建構(gòu)主義理論認為,知識的獲得是在學習環(huán)境的特定情境作用下,借助教師的幫助與學習伙伴的協(xié)作,通過意義的建構(gòu)過程實現(xiàn)的。因此在英語泛在學習過程中,必須增強學生在特定情境下的溝通和交際活動的參與性[4]。例如,如果在英語課程設(shè)計和在線學習設(shè)計環(huán)節(jié),鼓勵學生廣泛參與學習內(nèi)容、學習方法、學習偏好的設(shè)計,就會讓學生感受到教師對學生的愛與尊重,從而增強學生學習的主動性和積極性,使不同學情的學生都能在學習過程中體驗自我實現(xiàn)感,實現(xiàn)自主學習。另外,教師缺乏對學生多元需求的感知和把握,缺乏語言鍛煉的“現(xiàn)場感”設(shè)計,使學生無法在接近真實生活情境的語言環(huán)境中得到語言交際鍛煉。
三、基于大數(shù)據(jù)分析的英語泛在學習生態(tài)系統(tǒng)
移動通信和大數(shù)據(jù)分析技術(shù)的發(fā)展為有效解決當前英語泛在學習模式存在的問題提供新的方式和途徑?;诖髷?shù)據(jù)分析的英語泛在學習生態(tài)系統(tǒng)以學生的英語學習需求、特征、習慣、喜好等大數(shù)據(jù)挖掘為切入點,聯(lián)合學校、互聯(lián)網(wǎng)教育機構(gòu)、教材編寫人員、教師、信息化支撐機構(gòu)、教育管理機構(gòu)、在校學生和在職學員等生態(tài)系統(tǒng)成員共同把泛在學習落實到教學環(huán)境、模式設(shè)計、資源開發(fā)、評價機制和管理機制等工作中,不僅僅是教育內(nèi)容資源和信息的共享空間,而且是實施素質(zhì)教育和個性化學習的公共服務(wù)平臺。因此,本文構(gòu)建了基于大數(shù)據(jù)分析的英語泛在學習生態(tài)系統(tǒng),主要包括大數(shù)據(jù)采集、大數(shù)據(jù)存儲、大數(shù)據(jù)分析、大數(shù)據(jù)應(yīng)用四個子系統(tǒng),并構(gòu)建了系統(tǒng)體系結(jié)構(gòu)模型(圖1)。
1.大數(shù)據(jù)采集子系統(tǒng)
首先,大數(shù)據(jù)采集子系統(tǒng)要實現(xiàn)數(shù)據(jù)、文字、圖像、音頻、視頻、多媒體等結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)采集,實現(xiàn)跨區(qū)域、跨機構(gòu)、跨教學環(huán)節(jié)的數(shù)據(jù)互聯(lián)互通和數(shù)據(jù)采集功能,解決教育數(shù)據(jù)資源配置效率不高的問題。其次,實現(xiàn)英語教學設(shè)計、教學實施、課程內(nèi)容建設(shè)、網(wǎng)絡(luò)學習內(nèi)容資源建設(shè)、語料庫建設(shè)、學生學習認知過程監(jiān)控、學生學習情感態(tài)度監(jiān)控和學習評價等全教學鏈條的數(shù)據(jù)采集功能,為生態(tài)系統(tǒng)成員之間的共生發(fā)展提供良好的數(shù)據(jù)資源基礎(chǔ)。
英語教學設(shè)計數(shù)據(jù)主要采集教師按照教學大綱和教學目標要求對不同學生制定的學習內(nèi)容、學習進度、學習路徑等數(shù)據(jù),厘清學生在課堂上和網(wǎng)絡(luò)上分別學什么、在哪學、怎么學的問題。教學過程數(shù)據(jù)主要采集教師在教學中幫助學生解決英語學習問題的經(jīng)驗、做法和策略,包括情感態(tài)度、認知因素的調(diào)控、語言情境的構(gòu)建、師生的有效互動等。課程內(nèi)容數(shù)據(jù)主要是采集教師、學校、互聯(lián)網(wǎng)教育機構(gòu)課程教學內(nèi)容數(shù)據(jù),包括教材內(nèi)容、課件、題庫、案例等授課內(nèi)容資料,以及以上資料經(jīng)過碎片化處理的數(shù)據(jù)資料。
網(wǎng)絡(luò)資源數(shù)據(jù)庫主要采集互聯(lián)網(wǎng)、校園網(wǎng)上英語學習方面的相關(guān)資料。英語語料庫數(shù)據(jù)主要采集中國學習者英語語料庫、美國當代英語語料庫等語料庫內(nèi)容,以及英語教材、英美小說、散文、演說詞、電影劇本、新聞稿等英文自然語料。學習行為數(shù)據(jù)庫主要采集學生課堂學習行為和線上學習行為數(shù)據(jù)。課堂學習行為包括是否預(yù)習、復習等,線上學習行為數(shù)據(jù)采集學習日志、學習習慣、學習時長和學習路徑等。學習評價數(shù)據(jù)主要采集教師或者在線學習系統(tǒng)對學生的學習能力、學習方法、學習策略運用、學習過程和學習結(jié)果的評價數(shù)據(jù)。學習情感態(tài)度數(shù)據(jù)主要是通過問卷、訪談等方式采集影響學生英語語言習得的動機、態(tài)度、焦慮、自信等指標。
2.大數(shù)據(jù)存儲子系統(tǒng)
大數(shù)據(jù)存儲子系統(tǒng)主要實現(xiàn)對大數(shù)據(jù)采集子系統(tǒng)采集的海量結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)進行數(shù)據(jù)清理、歸檔、壓縮,實現(xiàn)一體化數(shù)據(jù)存儲??梢詫崿F(xiàn)跨區(qū)域、跨系統(tǒng)的英語泛在學習數(shù)據(jù)的融合,解決不同教學機構(gòu)、數(shù)據(jù)結(jié)構(gòu)、操作系統(tǒng)帶來的信息孤島問題。英語學習數(shù)據(jù)倉庫是指集成了大數(shù)據(jù)分析子系統(tǒng)和應(yīng)用子系統(tǒng)決策分析所需的泛在學習數(shù)據(jù),這些數(shù)據(jù)是按照一定的英語學習主題進行組織,是在對原有分散的各類英語泛在學習數(shù)據(jù)庫數(shù)據(jù)進行加工、匯總和整理后得到的,有效地消除了各類源數(shù)據(jù)中的不一致性,所以英語學習數(shù)據(jù)倉庫的信息均是關(guān)于學生英語泛在學習全局情況的一致性信息。數(shù)據(jù)倉庫的這些全局性信息同r通過網(wǎng)絡(luò)云平臺實現(xiàn)英語泛在學習數(shù)據(jù)的云端存儲,可以直接由大數(shù)據(jù)應(yīng)用子系統(tǒng)調(diào)用。
3.大數(shù)據(jù)分析子系統(tǒng)
認知因素和情感因素是影響英語習得效果的兩個重要方面。大數(shù)據(jù)分析子系統(tǒng)首先結(jié)合學生應(yīng)該達到的學習目標對學生個體的英語學習認知行為和學習的情感態(tài)度進行數(shù)據(jù)挖掘,分析學生的動機、態(tài)度、焦慮、自信、興趣等情感因素,以及學習毅力、能力、習慣、方法、英語水平和常犯錯誤等認知行為因素,對數(shù)據(jù)挖掘結(jié)果進行聚類運算和分類處理,根據(jù)學生的學習認知行為和學習態(tài)度情況將學生細分,以識別不同學生之間相似的泛在學習需求,以及某個學生個體在不同學習階段泛在學習需求的差異性。同時,大數(shù)據(jù)分析子系統(tǒng)會對學生的學習過程和學習結(jié)果進行動態(tài)綜合評價,并根據(jù)學習評價結(jié)果判斷學習方案的優(yōu)劣,有針對性地進行線上和線下學習方案的調(diào)整。
4.大數(shù)據(jù)應(yīng)用子系統(tǒng)
大數(shù)據(jù)應(yīng)用子系統(tǒng)包括學習信息推送系統(tǒng)、學習信息定制系統(tǒng)、在線互動學習系統(tǒng)、語言情境仿真系統(tǒng)、知識關(guān)聯(lián)推薦系統(tǒng)、知識精準搜索系統(tǒng)、知識樹形管理系統(tǒng)和娛樂在線學習系統(tǒng)等應(yīng)用。學生可以通過學習終端連接到相關(guān)應(yīng)用系統(tǒng)進行英語語言知識的有效學習。學習信息推薦系統(tǒng)自動推薦給學生的學習信息是學生應(yīng)掌握而目前未掌握的英語知識。學習信息定制系統(tǒng)可以滿足學生根據(jù)自身學習需求而定制某類主題的學習信息。學生一方面通過在線互動學習系統(tǒng)可以和輔導教師進行交流互動,解決學習中遇到的問題,另一方面可以通過社交軟件實現(xiàn)和其他學習者的溝通和交流,共享英語學習經(jīng)驗。
語言情境仿真系統(tǒng)可以實現(xiàn)某類主題的英語學習情境的在線仿真,讓學生在接近真實環(huán)境的英語語言情境中進行英語交際鍛煉。知識關(guān)聯(lián)推薦系統(tǒng)是根據(jù)學生所學知識點,自動關(guān)聯(lián)推薦對應(yīng)的拓展知識點。知識精準搜索系統(tǒng)可以幫助學生快速實現(xiàn)英語知識的精準有效搜索,從而進行有針對性的學習。知識樹形管理系統(tǒng)可以實現(xiàn)學生已掌握知識和未掌握知識的樹形目錄管理,實現(xiàn)線上學習和課堂學習知識管理的無縫鏈接。
基于大數(shù)據(jù)分析的英語泛在學習生態(tài)系統(tǒng)有利于充分發(fā)揮信息技術(shù)對傳統(tǒng)英語教育的改造提升作用,可以有效促進信息技術(shù)與教學過程、內(nèi)容、方法和教學評價體系的深度融合。在生態(tài)系統(tǒng)的價值取向上注重以促進學生全面健康發(fā)展為中心,注重需求導向的個性化學生培養(yǎng)模式。在學生習得效果評價體系上注重加強學習過程評估,強調(diào)過程評估和結(jié)果評估相結(jié)合。系統(tǒng)注重充分挖掘?qū)W生的個體差異,充分挖掘?qū)W生的學習潛能,圍繞學生英語學習習慣的形成和學習情感態(tài)度的培養(yǎng),以現(xiàn)代信息技術(shù)為輔助手段,將英語語言知識進行碎片化、情境化、可視化處理,通過采取教育信息推送、關(guān)聯(lián)推薦和定制化相結(jié)合的方式實現(xiàn)知識的在線傳播,給學生提供個性化、定制化的英語學習信息服務(wù),帶給學生全新的英語泛在學習體驗。
參考文獻
[1] 張豪鋒,卜彩麗.略論學習生態(tài)系統(tǒng)[J].中國遠程教育,2007(4).
[2] 曹貞.以有效學習為目標的大學課堂教學[J].教育與職業(yè),2007(26).
[3] 陳明選,陳舒.論信息化環(huán)境下大學生的有效學習[J].高等教育研究,2013(9).
關(guān)鍵詞:大數(shù)據(jù)時代;統(tǒng)計學;影響
隨著大數(shù)據(jù)時代的到來,各企業(yè)采用了新的策略,獲得了更多的利潤。對于統(tǒng)計專業(yè)來說,改變發(fā)展策略,使培養(yǎng)出來的專業(yè)人才能夠適應(yīng)大數(shù)據(jù)背景的需求是其主要任務(wù)。目前,高校統(tǒng)計學專業(yè)逐漸認識到大數(shù)據(jù)時代綜合性人才培養(yǎng)的重要性,并對專業(yè)建設(shè)進行了相關(guān)改革。
一、大數(shù)據(jù)時代對統(tǒng)計學的影響
大數(shù)據(jù)時代的到來對現(xiàn)代統(tǒng)計專業(yè)的發(fā)展造成了新的沖擊,要確保培養(yǎng)出來的人才能夠起到應(yīng)有的作用,首先要了解大數(shù)據(jù)時代對統(tǒng)計專業(yè)所造成的影響。
(一)大數(shù)據(jù)時代使數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)性質(zhì)發(fā)生變化
網(wǎng)絡(luò)技術(shù)以及基于網(wǎng)絡(luò)技術(shù)的電子商務(wù)等新的數(shù)據(jù)記錄模式標志著大數(shù)據(jù)時代的到來。大數(shù)據(jù)時代,不再依賴于抽樣調(diào)查的記錄模式,網(wǎng)站瀏覽、視頻監(jiān)控都將形成大量數(shù)據(jù)。傳統(tǒng)的數(shù)據(jù)結(jié)構(gòu)甚至是數(shù)據(jù)性質(zhì)發(fā)生了變化。大量的數(shù)據(jù)信息對于需求者來說,如何甄別其可用價值成為關(guān)鍵。傳統(tǒng)的數(shù)據(jù)可以二維表格顯示和整理。但大數(shù)據(jù)時代所產(chǎn)生的數(shù)據(jù)具有多樣化和復雜化特征,往往包含了大量的音頻、視頻、HTML等。這要求大數(shù)據(jù)的收集具有較強的目的性,才能實現(xiàn)其價值。
(二)大數(shù)據(jù)時代要求統(tǒng)計分析方法和統(tǒng)計思維更新
大數(shù)據(jù)時代的主要特征為數(shù)據(jù)多且復雜,數(shù)據(jù)分析要求分析者對總體進行分析。在這一背景下,參數(shù)統(tǒng)計不再具有意義,假設(shè)檢驗法也隨著總體分析而失去價值。數(shù)據(jù)的復雜化對傳統(tǒng)大數(shù)據(jù)統(tǒng)計思維造成了巨大的沖擊,要求統(tǒng)計者具有活躍的思維。只有對傳統(tǒng)數(shù)據(jù)的改變進行分析,并且樹立新的統(tǒng)計方法。
二、大數(shù)據(jù)時代下的統(tǒng)計學發(fā)展新策略
為適應(yīng)大數(shù)據(jù)時代的需求,統(tǒng)計學專業(yè)的發(fā)展勢必要對傳統(tǒng)模式進行改革。目前,多數(shù)高校統(tǒng)計學專業(yè)已經(jīng)認識到大數(shù)據(jù)對于其發(fā)展帶來的沖擊。為此,本文提出了以下策略,以及能夠幫助統(tǒng)計學取得更好發(fā)展。
(一)加強統(tǒng)計應(yīng)用性教學
根據(jù)大數(shù)據(jù)時代數(shù)據(jù)的總體分析特征,數(shù)據(jù)分析人員應(yīng)掌握全面的分析方法。在人才培養(yǎng)過程中,應(yīng)致力于培養(yǎng)實踐分析能力,提高數(shù)據(jù)和資料收集能力,并且培養(yǎng)其強烈的數(shù)據(jù)價值觀,使其能夠從眾多數(shù)據(jù)中找到所需的。另外,對傳統(tǒng)模式進行改革,增加大數(shù)據(jù)統(tǒng)計內(nèi)容,以適應(yīng)時代的需求?;诖髷?shù)據(jù)的結(jié)構(gòu)特點,實施資料透視化教學,提高分析者對復雜數(shù)據(jù)的分析能力。
(二)培養(yǎng)大數(shù)據(jù)統(tǒng)計思維
在人才培養(yǎng)過程中,新的統(tǒng)計思維的培養(yǎng)具有重要意義,即強調(diào)數(shù)據(jù)分析實踐能力的提高。統(tǒng)計思維的培養(yǎng)有助于數(shù)據(jù)分析者對復雜的數(shù)據(jù)進行區(qū)分,從而整理有效信息。在大數(shù)據(jù)時代,不僅要以傳統(tǒng)的平均思維、動態(tài)思維和變異思維為基礎(chǔ),還要注重基于整體分析的大數(shù)據(jù)思維。另外,還要培養(yǎng)數(shù)據(jù)分者的復雜性思維,以應(yīng)對復雜的數(shù)據(jù)庫??傊髷?shù)據(jù)時代需要數(shù)據(jù)分析者具有全面的、創(chuàng)新性的思維。
(三)強化基礎(chǔ)性統(tǒng)計知識
統(tǒng)計學自身具有復雜性,其改變多且抽象?;A(chǔ)的統(tǒng)計知識是進一步掌握大數(shù)據(jù)分析思維的基礎(chǔ),可見學習基礎(chǔ)性統(tǒng)計知識的重要性是不言而喻的。為此,應(yīng)該采取深入淺出的方法,利用多媒體等方式使復雜的數(shù)據(jù)統(tǒng)計清晰化、簡單化。結(jié)合具體的案例使數(shù)據(jù)分析者正確認識統(tǒng)計概念、掌握統(tǒng)計原理和方法。此外大數(shù)據(jù)分析不再是一種專業(yè),而是更傾向于一種技術(shù),這要求我們將大數(shù)據(jù)分析與統(tǒng)計學以外的相關(guān)知識相互聯(lián)系。注重真實相關(guān)與偽相關(guān)的講解,強調(diào)商務(wù)智能的開發(fā)和分析。只有具有堅實的基礎(chǔ),才能確保數(shù)據(jù)分析者大數(shù)據(jù)分析思維的養(yǎng)成,適應(yīng)現(xiàn)代社會的需求。
(四)加強復合型人才培養(yǎng)
為適應(yīng)大數(shù)據(jù)時代的需求,復合型人才的培養(yǎng)是關(guān)鍵。所謂復合型人才,是指其不但要具有專業(yè)的數(shù)據(jù)分析能力,還要相應(yīng)的具備管理以及其從事專業(yè)的技術(shù)。大數(shù)據(jù)時代,高校應(yīng)建立全面的人才培養(yǎng)模式,注重培養(yǎng)人才的數(shù)據(jù)分析能力、編程能力等,使其真正了解大數(shù)據(jù),懂得如何利用大數(shù)據(jù)對其所處的行業(yè)起到積極作用才是關(guān)鍵??傊髷?shù)據(jù)時代對綜合性人才具有更高的需求,大數(shù)據(jù)時代不僅培養(yǎng)的是一種能力,而且是一種思維,是對全新模式下的數(shù)據(jù)的分析和利用。高校作為人才培養(yǎng)的重要基地,其教學模式的改革、對大數(shù)據(jù)時代所需教學模式的認識是高校的主要任務(wù)。
三、總結(jié)
統(tǒng)計學是經(jīng)濟學的基礎(chǔ)課程,傳統(tǒng)的統(tǒng)計人才培養(yǎng)具有定向性。而隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)產(chǎn)生的形式多樣,且具有復雜性。大數(shù)據(jù)分析不僅是作為一種專業(yè)存在,而是應(yīng)以一項必備的技術(shù)而存在。大數(shù)據(jù)時代,傳統(tǒng)的統(tǒng)計思維和統(tǒng)計方法發(fā)生了改變,統(tǒng)計人才培養(yǎng)方式的改革也就勢在必行。(作者單位:海南師范大學)
參考文獻:
[1] 朱懷慶.大數(shù)據(jù)時代對本科經(jīng)管類統(tǒng)計學教學的影響及對策[J].高等教育研究,2014(3).
[2] 姚壽福.經(jīng)濟管理類本科專業(yè)統(tǒng)計學課程教學改革思考[J].高等教育研究,2012(3).
[3] 孫耀東.大數(shù)據(jù)背景下統(tǒng)計學專業(yè)課程教學探究[J].廊坊師范學院學報(自然科學版),2015(06).
統(tǒng)計學研究的對象是數(shù)據(jù),數(shù)據(jù)科學顧名思義也是以數(shù)據(jù)為研究對象,這產(chǎn)生一種直觀的錯覺,似乎數(shù)據(jù)科學與統(tǒng)計學之間存在某種與生俱來的淵源關(guān)系。Wu(1998)直言不諱,數(shù)據(jù)科學就是統(tǒng)計學的重命名,相應(yīng)地,數(shù)據(jù)科學家替代了統(tǒng)計學家這個稱謂。若此,那是什么促成了這種名義上的替代?顯然僅僅因為數(shù)據(jù)量大本身并不足以促成“統(tǒng)計學”向“數(shù)據(jù)科學”的轉(zhuǎn)變,數(shù)據(jù)挖掘、機器學習這些概念似乎就已經(jīng)足夠了。問題的關(guān)鍵在于,二者所指的“數(shù)據(jù)”并非同一概念,數(shù)據(jù)②本身是一個很寬泛的概念,只要是對客觀事物記錄下來的、可以鑒別的符號都可以稱之為數(shù)據(jù),包括數(shù)字、文字、音頻、視頻等等。統(tǒng)計學研究的數(shù)據(jù)雖然類型豐富,如類別數(shù)據(jù)、有序數(shù)據(jù)等定性數(shù)據(jù),定距數(shù)據(jù)、定比數(shù)據(jù)等定量數(shù)據(jù),但這些都是結(jié)構(gòu)化數(shù)據(jù);數(shù)據(jù)科學所謂的數(shù)據(jù)則更為寬泛,不僅包括這些傳統(tǒng)的結(jié)構(gòu)型數(shù)據(jù),而且還包括文本、圖像、視頻、音頻、網(wǎng)絡(luò)日志等非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù),即,大數(shù)據(jù)。大數(shù)據(jù)(以半/非結(jié)構(gòu)型數(shù)據(jù)為主)使基于關(guān)系型數(shù)據(jù)庫的傳統(tǒng)分析工具很難發(fā)揮作用,或者說傳統(tǒng)的數(shù)據(jù)庫和統(tǒng)計分析方法很難在可容忍的時間范圍內(nèi)完成存儲、管理和分析等一系列數(shù)據(jù)處理過程,為了有效地處理這類數(shù)據(jù),需要一種新的范式———數(shù)據(jù)科學。真正意義上的現(xiàn)代統(tǒng)計學是從處理小數(shù)據(jù)、不完美的實驗等這類現(xiàn)實問題發(fā)展起來的,而數(shù)據(jù)科學是因為處理大數(shù)據(jù)這類現(xiàn)實問題而興起的。因此數(shù)據(jù)科學的研究對象是大數(shù)據(jù),而統(tǒng)計學以結(jié)構(gòu)型數(shù)據(jù)為研究對象。退一步,單從數(shù)量級來講,也已發(fā)生了質(zhì)變。對于結(jié)構(gòu)化的大規(guī)模數(shù)據(jù),傳統(tǒng)的方法只是理論上的(可行性)或不經(jīng)濟的(有效性),實踐中還需要借助數(shù)據(jù)挖掘、機器學習、并行處理技術(shù)等現(xiàn)代計算技術(shù)才能實現(xiàn)。
二、數(shù)據(jù)科學的統(tǒng)計學內(nèi)涵
(一)理論基礎(chǔ)
數(shù)據(jù)科學中的數(shù)據(jù)處理和分析方法是在不同學科領(lǐng)域中分別發(fā)展起來的,譬如,統(tǒng)計學、統(tǒng)計學習或稱統(tǒng)計機器學習、數(shù)據(jù)挖掘、應(yīng)用數(shù)學、數(shù)據(jù)密集型計算、密集計算方法等。在量化分析的浪潮下甚至出現(xiàn)了“metric+模式”,如計量經(jīng)濟學、文獻計量學、網(wǎng)絡(luò)計量學、生物統(tǒng)計學等。因此,有學者將數(shù)據(jù)科學定義為計算機科學技術(shù)、數(shù)學與統(tǒng)計學知識、專業(yè)應(yīng)用知識三者的交集,這意味著數(shù)據(jù)科學是一門新興的交叉學科。但是這種沒有側(cè)重的疊加似乎只是羅列了數(shù)據(jù)科學所涉及到的學科知識,并沒有進行實質(zhì)性的分析,就好似任何現(xiàn)實活動都可以拆解為不同的細分學科,這是必然的。根據(jù)Naur(1960,1974)的觀點,數(shù)據(jù)科學或稱數(shù)據(jù)學是計算機科學的一個替代性稱謂。但是這種字面上的轉(zhuǎn)換,并沒有作為一個獨立的學科而形成。Cleveland(2001)首次將數(shù)據(jù)科學作為一個獨立的學科提出時,將數(shù)據(jù)科學表述為統(tǒng)計學加上它在計算技術(shù)方面的擴展。這種觀點表明,數(shù)據(jù)科學的理論基礎(chǔ)是統(tǒng)計學,數(shù)據(jù)科學可以看作是統(tǒng)計學在研究范圍(對象)和分析方法上不斷擴展的結(jié)果。一如統(tǒng)計學最初只是作為征兵、征稅等行政管理的附屬活動,而現(xiàn)在包括了范圍更廣泛的理論和方法。從研究范圍的擴展來看,是從最初的結(jié)構(gòu)型大規(guī)模數(shù)據(jù)(登記數(shù)據(jù)),到結(jié)構(gòu)型的小規(guī)模數(shù)據(jù)(抽樣數(shù)據(jù))、結(jié)構(gòu)型的大規(guī)模數(shù)據(jù)(微觀數(shù)據(jù)),再擴展到現(xiàn)在的非(半)結(jié)構(gòu)型的大規(guī)模數(shù)據(jù)(大數(shù)據(jù))和關(guān)系數(shù)據(jù)等類型更為豐富的數(shù)據(jù)。從分析方法的擴展來看,是從參數(shù)方法到非參數(shù)方法,從基于模型到基于算法,一方面?zhèn)鹘y(tǒng)的統(tǒng)計模型需要向更一般的數(shù)據(jù)概念延伸;另一方面,算法(計算機實現(xiàn))成為必要的“可行性分析”,而且在很多方面算法模型的優(yōu)勢越來越突出。注意到,數(shù)據(jù)分析有驗證性的數(shù)據(jù)分析和探索性的數(shù)據(jù)分析兩個基本取向,但不論是哪一種取向,都有一個基本的前提假設(shè),就是觀測數(shù)據(jù)是由背后的一個(隨機)模型生成,因此數(shù)據(jù)分析的基本問題就是找出這個(隨機)模型。Tukey(1980,2000)明確提到,EDA和CDA并不是替代關(guān)系,兩者皆必不可少,強調(diào)EDA是因為它被低估了。數(shù)據(jù)導向是計算機時代統(tǒng)計學發(fā)展的方向,這一觀點已被越來越多的統(tǒng)計學家所認同。但是數(shù)據(jù)導向仍然有基于模型與基于算法兩種聲音,其中,前文提到的EDA和CDA都屬于基于模型的方法,它們都假定數(shù)據(jù)背后存在某種生成機制;而算法模型則認為復雜的現(xiàn)實世界無法用數(shù)學公式來刻畫,即,不設(shè)置具體的數(shù)學模型,同時對數(shù)據(jù)也不做相應(yīng)的限制性假定。算法模型自20世紀80年代中期以來隨著計算機技術(shù)的迅猛發(fā)展而得到快速成長,然而很大程度上是在統(tǒng)計學這個領(lǐng)域之外“悄然”進行的,比如人工神經(jīng)網(wǎng)絡(luò)、支持向量機、決策樹、隨機森林等機器學習和數(shù)據(jù)挖掘方法。若響應(yīng)變量記為y,預(yù)測變量記為x,擾動項和參數(shù)分別記為ε和β,則基于模型的基本形式是:y=f(x,β,ε),其目的是要研究清楚y與x之間的關(guān)系并對y做出預(yù)測,其中,f是一個有顯式表達的函數(shù)形式(若f先驗假定,則對應(yīng)CDA;若f是探索得到的,則對應(yīng)EDA),比如線性回歸、Logistic回歸、Cox回歸等。可見,傳統(tǒng)建模的基本觀點是,不僅要得到正確的模型———可解釋性強,而且要得到準確的模型———外推預(yù)測能力強。而對于現(xiàn)實中復雜的、高維的、非線性的數(shù)據(jù)集,更切合實際的做法是直接去尋找一個恰當?shù)念A(yù)測規(guī)則(算法模型),不過代價是可解釋性較弱,但是算法模型的計算效率和可擴展性更強。基于算法的基本形式類似于非參數(shù)方法y=f(x,ε),但是比非參數(shù)方法的要求更低yx,因為非參數(shù)方法很多時候要求f或其一階導數(shù)是平滑的,而這里直接跳過了函數(shù)機制的探討,尋找的只是一個預(yù)測規(guī)則(后續(xù)的檢驗也是基于預(yù)測構(gòu)造的)。在很多應(yīng)用場合,算法模型得到的是針對具體問題的解(譬如某些參數(shù)是被當作一個確定的值通過優(yōu)化算法得到的),并不是統(tǒng)計意義上的推斷解。
(二)技術(shù)維度
數(shù)據(jù)科學是基于數(shù)據(jù)的決策,數(shù)據(jù)分析的本質(zhì)既不是數(shù)學,也不是軟件程序,而是對數(shù)據(jù)的“閱讀”和“理解”。技術(shù)只是輔助數(shù)據(jù)理解的工具,一個毫無統(tǒng)計學知識的人應(yīng)用統(tǒng)計軟件也可以得到統(tǒng)計結(jié)果,但無論其過程還是結(jié)果都是可疑的,對統(tǒng)計結(jié)果的解釋也無法令人信服。“從計算機科學自身來看,這些應(yīng)用領(lǐng)域提供的主要研究對象就是數(shù)據(jù)。雖然計算機科學一貫重視數(shù)據(jù)的研究,但數(shù)據(jù)在其中的地位將會得到更進一步的加強”。不可否認,統(tǒng)計分析逐漸向計算機科學技術(shù)靠近的趨勢是明顯的。這一方面是因為,數(shù)據(jù)量快速膨脹,數(shù)據(jù)來源、類型和結(jié)構(gòu)越來越復雜,迫切需要開發(fā)更高效率的存儲和分析工具,可以很好地適應(yīng)數(shù)據(jù)量的快速膨脹;另一方面,計算機科學技術(shù)的迅猛發(fā)展為新方法的實現(xiàn)提供了重要的支撐。對于大數(shù)據(jù)而言,大數(shù)據(jù)分析丟不掉計算機科學這個屬性的一個重要原因還不單純是因為需要統(tǒng)計軟件來協(xié)助基本的統(tǒng)計分析和計算,而是大數(shù)據(jù)并不能像早先在關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)那樣可以直接用于統(tǒng)計分析。事實上,面對越來越龐雜的數(shù)據(jù),核心的統(tǒng)計方法并沒有實質(zhì)性的改變,改變的只是實現(xiàn)它的算法。因此,從某種程度上來講,大數(shù)據(jù)考驗的并不是統(tǒng)計學的方法論,而是計算機科學技術(shù)和算法的適應(yīng)性。譬如大數(shù)據(jù)的存儲、管理以及分析架構(gòu),這些都是技術(shù)上的應(yīng)對,是如何實現(xiàn)統(tǒng)計分析的輔助工具,核心的數(shù)據(jù)分析邏輯并沒有實質(zhì)性的改變。因此,就目前而言,大數(shù)據(jù)分析的關(guān)鍵是計算機技術(shù)如何更新升級來適應(yīng)這種變革,以便可以像從前一樣滿足統(tǒng)計分析的需要。
(三)應(yīng)用維度
在商業(yè)應(yīng)用領(lǐng)域,數(shù)據(jù)科學被定義為,將數(shù)據(jù)轉(zhuǎn)化為有價值的商業(yè)信息①的完整過程。數(shù)據(jù)科學家要同時具備數(shù)據(jù)分析技術(shù)和商業(yè)敏感性等綜合技能。換句話說,數(shù)據(jù)科學家不僅要了解數(shù)據(jù)的來源、類型和存儲調(diào)用方式,而且還要知曉如何選擇相應(yīng)的分析方法,同時對分析結(jié)果也能做出切合實際的解釋②。這實際上提出了兩個層面的要求:①長期目標是數(shù)據(jù)科學家從一開始就應(yīng)該熟悉整個數(shù)據(jù)分析流程,而不是數(shù)據(jù)庫、統(tǒng)計學、機器學習、經(jīng)濟學、商業(yè)分析等片段化碎片化的知識。②短期目標實際上是一個“二級定義”,即,鼓勵已經(jīng)在專業(yè)領(lǐng)域內(nèi)有所成就的統(tǒng)計學家、程序員、商業(yè)分析師相互學習。在提及數(shù)據(jù)科學的相關(guān)文獻中,對應(yīng)用領(lǐng)域有更多的傾向;數(shù)據(jù)科學與統(tǒng)計學、數(shù)學等其他學科的區(qū)別恰在于其更傾向于實際應(yīng)用。甚至有觀點認為,數(shù)據(jù)科學是為應(yīng)對大數(shù)據(jù)現(xiàn)象而專門設(shè)定的一個“職業(yè)”。其中,商業(yè)敏感性是數(shù)據(jù)科學家區(qū)別于一般統(tǒng)計人員的基本素質(zhì)。對數(shù)據(jù)的簡單收集和報告不是數(shù)據(jù)科學的要義,數(shù)據(jù)科學強調(diào)對數(shù)據(jù)多角度的理解,以及如何就大數(shù)據(jù)提出相關(guān)的問題(很多重要的問題,我們非但不知道答案而且不知道問題何在以及如何發(fā)問)。同時數(shù)據(jù)科學家要有良好的表達能力,能將數(shù)據(jù)中所發(fā)現(xiàn)的事實清楚地表達給相關(guān)部門以便實現(xiàn)有效協(xié)作。從商業(yè)應(yīng)用和服務(wù)社會的角度來看,強調(diào)應(yīng)用這個維度無可厚非,因為此處是數(shù)據(jù)產(chǎn)生的土壤,符合數(shù)據(jù)科學數(shù)據(jù)導向的理念,數(shù)據(jù)分析的目的很大程度上也是為了增進商業(yè)理解,而且包括數(shù)據(jù)科學家、首席信息官這些提法也都肇始于實務(wù)部門。不過,早在20世紀90年代中期,已故圖靈獎得主格雷(JimGray)就已經(jīng)意識到,數(shù)據(jù)庫技術(shù)的下一個“大數(shù)據(jù)”挑戰(zhàn)將會來自科學領(lǐng)域而非商業(yè)領(lǐng)域(科學研究領(lǐng)域成為產(chǎn)生大數(shù)據(jù)的重要土壤)。2008年9月4日刊出的《自然》以“bigdata”作為專題(封面)探討了環(huán)境科學、生物醫(yī)藥、互聯(lián)網(wǎng)技術(shù)等領(lǐng)域所面臨的大數(shù)據(jù)挑戰(zhàn)。2011年2月11日,《科學》攜其子刊《科學-信號傳導》、《科學-轉(zhuǎn)譯醫(yī)學》、《科學-職業(yè)》專門就日益增長的科學研究數(shù)據(jù)進行了廣泛的討論。格雷還進一步提出科學研究的“第四范式”是數(shù)據(jù)(數(shù)據(jù)密集型科學),不同于實驗、理論、和計算這三種范式,在該范式下,需要“將計算用于數(shù)據(jù),而非將數(shù)據(jù)用于計算”。這種觀點實際上是將數(shù)據(jù)從計算科學中單獨區(qū)別開來了。
三、數(shù)據(jù)科學范式對統(tǒng)計分析過程的直接影響
以前所謂的大規(guī)模數(shù)據(jù)都是封閉于一個機構(gòu)內(nèi)的(數(shù)據(jù)孤島),而大數(shù)據(jù)注重的是數(shù)據(jù)集間的關(guān)聯(lián)關(guān)系,也可以說大數(shù)據(jù)讓孤立的數(shù)據(jù)形成了新的聯(lián)系,是一種整體的、系統(tǒng)的觀念。從這個層面來說,將大數(shù)據(jù)稱為“大融合數(shù)據(jù)”或許更為恰當。事實上,孤立的大數(shù)據(jù),其價值十分有限,大數(shù)據(jù)的革新恰在于它與傳統(tǒng)數(shù)據(jù)的結(jié)合、線上和線下數(shù)據(jù)的結(jié)合,當放到更大的環(huán)境中所產(chǎn)生的“1+1>2”的價值。譬如消費行為記錄與企業(yè)生產(chǎn)數(shù)據(jù)結(jié)合,移動通訊基站定位數(shù)據(jù)用于優(yōu)化城市交通設(shè)計,微博和社交網(wǎng)絡(luò)數(shù)據(jù)用于購物推薦,搜索數(shù)據(jù)用于流感預(yù)測、利用社交媒體數(shù)據(jù)監(jiān)測食品價等等。特別是數(shù)據(jù)集之間建立的均衡關(guān)系,一方面無形中增強了對數(shù)據(jù)質(zhì)量的監(jiān)督和約束;另一方面,為過去難以統(tǒng)計的指標和變量提供了另辟蹊徑的思路。從統(tǒng)計學的角度來看,數(shù)據(jù)科學(大數(shù)據(jù))對統(tǒng)計分析過程的各個環(huán)節(jié)(數(shù)據(jù)收集、整理、分析、評價、等)都提出了挑戰(zhàn),其中,集中表現(xiàn)在數(shù)據(jù)收集和數(shù)據(jù)分析這兩個方面。
(一)數(shù)據(jù)收集方面
在統(tǒng)計學被作為一個獨立的學科分離出來之前(1900年前),統(tǒng)計學家們就已經(jīng)開始處理大規(guī)模數(shù)據(jù)了,但是這個時期主要是全國范圍的普查登記造冊,至多是一些簡單的匯總和比較。之后(1920-1960年)的焦點逐漸縮聚在小規(guī)模數(shù)據(jù)(樣本),大部分經(jīng)典的統(tǒng)計方法(統(tǒng)計推斷)以及現(xiàn)代意義上的統(tǒng)計調(diào)查(抽樣調(diào)查)正是在這個時期產(chǎn)生。隨后的45年里,統(tǒng)計方法因廣泛的應(yīng)用而得到快速發(fā)展。變革再次來自于統(tǒng)計分析的初始環(huán)節(jié)———數(shù)據(jù)收集方式的轉(zhuǎn)變:傳統(tǒng)的統(tǒng)計調(diào)查方法通常是經(jīng)過設(shè)計的、系統(tǒng)收集的,而大數(shù)據(jù)是零散實錄的、有機的,這些數(shù)據(jù)通常是用戶使用電子數(shù)碼產(chǎn)品的副產(chǎn)品或用戶自行產(chǎn)生的內(nèi)容,比如社交媒體數(shù)據(jù)、搜索記錄、網(wǎng)絡(luò)日志等數(shù)據(jù)流等,而且數(shù)據(jù)隨時都在增加(數(shù)據(jù)集是動態(tài)的)。與以往大規(guī)模數(shù)據(jù)不同的是,數(shù)據(jù)來源和類型更加豐富,數(shù)據(jù)庫間的關(guān)聯(lián)性也得到了前所未有的重視(大數(shù)據(jù)的組織形式是數(shù)據(jù)網(wǎng)絡(luò)),問題也變得更加復雜。隨著移動電話和網(wǎng)絡(luò)的逐漸滲透,固定電話不再是識別住戶的有效工具變量,相應(yīng)的無回答率也在增加(移動電話的拒訪率一般高于固定電話),同時統(tǒng)計調(diào)查的成本在增加,人口的流動性在增加,隱私意識以及法律對隱私的保護日益趨緊,涉及個人信息的數(shù)據(jù)從常規(guī)調(diào)查中越來越難以取得(從各國的經(jīng)驗來看,拒訪率或無回答率的趨勢是增加的),對時效性的要求也越來越高。因此,官方統(tǒng)計的數(shù)據(jù)來源已經(jīng)無法局限于傳統(tǒng)的統(tǒng)計調(diào)查,迫切需要整合部門行政記錄數(shù)據(jù)、商業(yè)記錄數(shù)據(jù)、個人行為記錄數(shù)據(jù)等多渠道數(shù)據(jù)源,與部門和搜索引擎服務(wù)商展開更廣泛的合作。
(二)數(shù)據(jù)分析方面
現(xiàn)代統(tǒng)計分析方法的核心是抽樣推斷(參數(shù)估計和假設(shè)檢驗),然而數(shù)據(jù)收集方式的改變直接淡化了樣本的意義。比如基于瀏覽和偏好數(shù)據(jù)構(gòu)建的推薦算法,誠然改進算法可以改善推薦效果,但是增加數(shù)據(jù)同樣可以達到相同的目的,甚至效果更好。即所謂的“大量的數(shù)據(jù)勝于好的算法”這與統(tǒng)計學的關(guān)鍵定律(大數(shù)定律和中心極限定理)是一致的。同樣,在大數(shù)據(jù)分析中,可以用數(shù)量來產(chǎn)生質(zhì)量,而不再需要用樣本來推斷總體。事實上,在某些場合(比如社會網(wǎng)絡(luò)數(shù)據(jù)),抽樣本身是困難的。數(shù)據(jù)導向的、基于算法的數(shù)據(jù)分析方法成為計算機時代統(tǒng)計學發(fā)展無法回避的一個重要趨勢。算法模型不僅對數(shù)據(jù)分布結(jié)構(gòu)有更少的限制性假定,而且在計算效率上有很大的優(yōu)勢。特別是一些積極的開源軟件的支撐,以及天生與計算機的相容性,使算法模型越來越受到學界的廣泛重視。大數(shù)據(jù)分析首先涉及到存儲、傳輸?shù)却髷?shù)據(jù)管理方面的問題。僅從數(shù)量上來看,信息爆炸、數(shù)據(jù)過剩、數(shù)據(jù)泛濫、數(shù)據(jù)墳?zāi)?、豐富的數(shù)據(jù)貧乏的知識……這些詞組表達的主要是我們匱乏的、捉襟見肘的存儲能力,同時,存儲數(shù)據(jù)中有利用價值的部分卻少之又少或塵封窖藏難以被發(fā)現(xiàn)。這除了對開采工具的渴求,當時的情緒主要還是遷怨于盲目的記錄,把過多精力放在捕捉和存儲外在信息。在這種情況下,開采有用的知識等價于拋棄無用的數(shù)據(jù)。然而,大數(shù)據(jù)時代的思路改變了,開始變本加厲巨細靡遺地記錄一切可以記錄的數(shù)據(jù)。因為:數(shù)據(jù)再怎么拋棄還是會越來越多。我們不能通過刪減數(shù)據(jù)來適應(yīng)自己的無能,為自己不愿做出改變找借口,而是應(yīng)該面對現(xiàn)實,提高處理海量數(shù)據(jù)的能力。退一步,該刪除哪些數(shù)據(jù)呢?當前無用的數(shù)據(jù)將來也無用嗎?顯然刪除數(shù)據(jù)的成本要大于存儲的成本。大數(shù)據(jù)存儲目前廣泛應(yīng)用的是GFS、HDFS等基于計算機群組的文件系統(tǒng),它可以通過簡單增加計算機來無限地擴充存儲能力。值得注意的是,分布式文件系統(tǒng)存儲的數(shù)據(jù)僅僅是整個架構(gòu)中最基礎(chǔ)的描述,是為其他部件服務(wù)的(比如MapReduce),并不能直接用于統(tǒng)計分析。而NoSQL這類分布式存儲系統(tǒng)可以實現(xiàn)高級查詢語言,事實上,有些RDBMS開始借鑒MapReduce的一些思路,而基于MapReduce的高級查詢語言也使MapReduce更接近傳統(tǒng)的數(shù)據(jù)庫編程,二者的差異將變得越來越模糊。大數(shù)據(jù)分析的可行性問題指的是,數(shù)據(jù)量可能大到已經(jīng)超過了目前的存儲能力,或者盡管沒有大到無法存儲,但是如果算法對內(nèi)存和處理器要求很高,那么數(shù)據(jù)相對也就“大”了。換句話說,可行性問題主要是,數(shù)據(jù)量太大了,或者算法的復雜度太高。大數(shù)據(jù)分析的有效性問題指的是,盡管目前的硬件條件允許,但是耗時太久,無法在可容忍的或者說可以接受的時間范圍內(nèi)完成。目前對有效性的解決辦法是采用并行處理。注意到,高性能計算和網(wǎng)格計算也是并行處理,但是對于大數(shù)據(jù)而言,由于很多節(jié)點需要訪問大量數(shù)據(jù),因此很多計算節(jié)點會因為網(wǎng)絡(luò)帶寬的限制而不得不空閑等待。而MapReduce會盡量在計算節(jié)點上存儲數(shù)據(jù),以實現(xiàn)數(shù)據(jù)的本地快速訪問。因此,數(shù)據(jù)本地化是MapReduce的核心特征。
四、結(jié)論
(一)數(shù)據(jù)科學不能簡單地理解為統(tǒng)計學的重命名,二者所指“數(shù)據(jù)”并非同一概念,前者更為寬泛,不僅包括結(jié)構(gòu)型數(shù)據(jù),而且還包括文本、圖像、視頻、音頻、網(wǎng)絡(luò)日志等非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù);同時,數(shù)量級也是后者難以企及的(PB以上)。但是數(shù)據(jù)科學的理論基礎(chǔ)是統(tǒng)計學,數(shù)據(jù)科學可以看作是統(tǒng)計學在研究范圍(對象)和分析方法上不斷擴展的結(jié)果,特別是數(shù)據(jù)導向的、基于算法的數(shù)據(jù)分析方法越來越受到學界的廣泛重視。
(二)從某種程度上來講,大數(shù)據(jù)考驗的并不是統(tǒng)計學的方法論,而是計算機科學技術(shù)和算法的適應(yīng)性。譬如大數(shù)據(jù)的存儲、管理以及分析架構(gòu),這些都是技術(shù)上的應(yīng)對,核心的數(shù)據(jù)分析邏輯并沒有實質(zhì)性的改變。因此,大數(shù)據(jù)分析的關(guān)鍵是計算機技術(shù)如何更新升級以適應(yīng)這種變革,以便可以像從前一樣滿足統(tǒng)計分析的需要。
(三)大數(shù)據(jù)問題很大程度上來自于商業(yè)領(lǐng)域,受商業(yè)利益驅(qū)動,因此數(shù)據(jù)科學還被普遍定義為,將數(shù)據(jù)轉(zhuǎn)化為有價值的商業(yè)信息的完整過程。這種強調(diào)應(yīng)用維度的觀點無可厚非,因為此處是數(shù)據(jù)產(chǎn)生的土壤,符合數(shù)據(jù)科學數(shù)據(jù)導向的理念。不過,早在20世紀90年代中期,已故圖靈獎得主格雷就已經(jīng)意識到,數(shù)據(jù)庫技術(shù)的下一個“大數(shù)據(jù)”挑戰(zhàn)將會來自科學領(lǐng)域而非商業(yè)領(lǐng)域(科學研究領(lǐng)域成為產(chǎn)生大數(shù)據(jù)的重要土壤)。他提出科學研究的“第四范式”是數(shù)據(jù),不同于實驗、理論、和計算這三種范式,在該范式下,需要“將計算用于數(shù)據(jù),而非將數(shù)據(jù)用于計算”。這種觀點實際上將數(shù)據(jù)從計算科學中單獨區(qū)別開了。
(四)數(shù)據(jù)科學范式對統(tǒng)計分析過程的各個環(huán)節(jié)都提出了挑戰(zhàn),集中表現(xiàn)在數(shù)據(jù)收集和數(shù)據(jù)分析這兩個方面。數(shù)據(jù)收集不再是刻意的、經(jīng)過設(shè)計的,而更多的是用戶使用電子數(shù)碼產(chǎn)品的副產(chǎn)品或用戶自行產(chǎn)生的內(nèi)容,這種改變的直接影響是淡化了樣本的意義,同時增進了數(shù)據(jù)的客觀性。事實上,在某些場合(比如社會網(wǎng)絡(luò)數(shù)據(jù)),抽樣本身是困難的。數(shù)據(jù)的存儲和分析也不再一味地依賴于高性能計算機,而是轉(zhuǎn)向由中低端設(shè)備構(gòu)成的大規(guī)模群組并行處理,采用橫向擴展的方式。
關(guān)鍵詞:管理統(tǒng)計學;教學模式;大數(shù)據(jù);案例教學
中圖分類號:G4 文獻標識碼:A doi:10.19311/ki.1672-3198.2016.33.147
1 引言
管理統(tǒng)計學是一門應(yīng)用統(tǒng)計學方法和理論研究經(jīng)濟管理問題的應(yīng)用性學科,它通過收集、分析、表述、解釋數(shù)據(jù)來探索經(jīng)濟管理問題的規(guī)律,并輔助企業(yè)進行管理決策和提高管理效率。傳統(tǒng)的統(tǒng)計學關(guān)注小規(guī)模數(shù)據(jù)下的數(shù)據(jù)描述、推斷和科學分析用。與之相應(yīng),管理統(tǒng)計學的課堂教學主要關(guān)注統(tǒng)計學原理的講述、小數(shù)據(jù)的推斷分析和經(jīng)濟管理問題的簡單應(yīng)用。
然而,自2008年Nature雜志發(fā)表“Big data:science in the peta byte era”以恚大數(shù)據(jù)的發(fā)展方興未艾,備受學術(shù)界,企業(yè)界等關(guān)注。大數(shù)據(jù)的理念和技術(shù)不僅在互聯(lián)網(wǎng)、金融、機器人、人工智能等領(lǐng)域取得突破性進展,也將對企業(yè)的生產(chǎn)、經(jīng)營和決策等活動帶來深刻的影響,通過對企業(yè)大數(shù)據(jù)的深度挖掘,有助于實現(xiàn)企業(yè)的商業(yè)價值,規(guī)避企業(yè)的決策風險,提高企業(yè)的競爭力。
大數(shù)據(jù)時代的到來,對管理統(tǒng)計學來說既是機遇又是挑戰(zhàn),機遇在于:大數(shù)據(jù)的分析主要建立在統(tǒng)計學的基礎(chǔ)上對數(shù)據(jù)進行處理、分析,從而使得大數(shù)據(jù)可視化;而挑戰(zhàn)在于:當下管理統(tǒng)計學的教學方法和教學手段難以匹配大數(shù)據(jù)時代對數(shù)據(jù)分析從業(yè)者的要求,這就要求對管理統(tǒng)計學的課堂教學模式進行進一步的發(fā)展與創(chuàng)新,以期適應(yīng)大數(shù)據(jù)背景下的新要求。
如何結(jié)合大數(shù)據(jù)時代的新要求設(shè)計合適的課堂教學模式,如何結(jié)合豐富的大數(shù)據(jù)應(yīng)用案例開展課堂教學活動,如何增強大數(shù)據(jù)背景下學生的數(shù)據(jù)驅(qū)動的管理決策意識,培養(yǎng)適應(yīng)大數(shù)據(jù)時代要求的高素質(zhì)人才,這些都是大數(shù)據(jù)背景下傳統(tǒng)的管理統(tǒng)計學課堂教學模式所面臨的問題和挑戰(zhàn),這也促使管理統(tǒng)計學教學工作者不得不去探究、優(yōu)化甚至改革現(xiàn)有的管理統(tǒng)計學課堂教育模式。
2 傳統(tǒng)管理統(tǒng)計學教學模式的概述
筆者所在的教學團隊來自于武漢科技大學管理學院,承擔全院《管理統(tǒng)計學》課程教學任務(wù),在教學方法、實踐教學等有較為豐富的教學經(jīng)驗。然而,在多年的教學過程實踐和與學生的教學互動當中發(fā)現(xiàn):現(xiàn)有的管理統(tǒng)計學教學模式盡管相對較為成熟,在培養(yǎng)學生的數(shù)據(jù)分析意識方面起到的重要作用,但是仍存在以下不足,而這些不足恰恰難以適應(yīng)大數(shù)據(jù)背景下對管理統(tǒng)計學教學帶來的挑戰(zhàn)。
2.1 注重理論講授,忽視應(yīng)用教學
受技術(shù)發(fā)展和數(shù)據(jù)規(guī)模等因素的制約,傳統(tǒng)的管理統(tǒng)計學教學大都采用理論驅(qū)動的教學模式,教師依托教材,注重統(tǒng)計學基本原理和方法的傳授,學生掌握基本原理,對統(tǒng)計學的實際應(yīng)用等關(guān)注較少。
盡管管理統(tǒng)計學課堂教學會涉及到一定的應(yīng)用案例,但是這些案例大都簡單,陳舊,數(shù)據(jù)來源單一,難以接觸實際原始數(shù)據(jù),統(tǒng)計建模思路也相對固定,這些教學案例既不能反映管理統(tǒng)計學的最新發(fā)展和應(yīng)用思想,也無法將其帶入企業(yè)經(jīng)營的情景,對企業(yè)決策過程缺乏了解,這些因素都使得學生對該課程的學習興趣不高,不利于培養(yǎng)學生應(yīng)用統(tǒng)計學解決實際問題的能力,進而影響課堂教學效果。
2.2 注重數(shù)學推導,忽視工具應(yīng)用
管理統(tǒng)計學要求學生掌握一定的數(shù)學基礎(chǔ),教材也都有較多的數(shù)學公式和理論推導,忽視了培養(yǎng)學生應(yīng)用SPSSvSASvR等統(tǒng)計軟件工具解決統(tǒng)計問題的操作能力。
根據(jù)經(jīng)管類專業(yè)的培養(yǎng)定位,對于經(jīng)管類專業(yè)的學生而言,相比于統(tǒng)計的數(shù)學公式,真正實用的如何借用SPSSvSASvR等統(tǒng)計軟件工具來解決企業(yè)經(jīng)營決策面臨的實際問題,尤其是在大數(shù)據(jù)背景下,需要處理海量、復雜、多源、異質(zhì)的高維數(shù)據(jù)。這些是單憑數(shù)學推導和簡單的手動計算無法完成的。
近年來,大數(shù)據(jù)、互聯(lián)網(wǎng)等技術(shù)的快速發(fā)展催生了一類新型且前景廣闊的職業(yè)方向-數(shù)據(jù)分析師。綜合數(shù)據(jù)分析師的職業(yè)要求,可以發(fā)現(xiàn),這些職位大都要求從業(yè)者了解基本的統(tǒng)計學原理和方法,熟練掌握SPSSvSASvR等統(tǒng)計軟件工具,并應(yīng)用這些工具解決企業(yè)經(jīng)營管理面臨的實際問題。
2.3 注重知識考核,忽視項目訓練
受限于教學管理制度和考核手段等因素,目前管理統(tǒng)計學課堂教學考核方式大都以閉卷為主,主要考察學生對統(tǒng)計學基本知識點的掌握情況,以及學生應(yīng)用統(tǒng)計學知識解決簡單案例的綜合能力。
然而,在大數(shù)據(jù)時代背景下,除了要求掌握統(tǒng)計學基本原理,更應(yīng)培養(yǎng)學生應(yīng)用統(tǒng)計學知識解決實際問題的綜合能力,而這種綜合能力往往涉及數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索、統(tǒng)計建模、模型檢驗、模型評價、模型解釋、模型部署和模型修正等數(shù)據(jù)分析的全過程,這種綜合能力的掌握是無法通過現(xiàn)有的知識考核來達到的,這些必然要求學生通過參與實際項目或模擬情景來實現(xiàn)。
3 大數(shù)據(jù)背景下管理統(tǒng)計學教學模式探討
如何結(jié)合大數(shù)據(jù)時代的新要求設(shè)計合適的課堂教學模式,如何結(jié)合豐富的大數(shù)據(jù)應(yīng)用案例開展課堂教學活動,如何增強大數(shù)據(jù)背景下學生的數(shù)據(jù)驅(qū)動的管理決策意識,培養(yǎng)適應(yīng)大數(shù)據(jù)時代要求的高素質(zhì)人才,這些都是大數(shù)據(jù)背景下傳統(tǒng)的管理統(tǒng)計學課堂教學模式所面臨的問題和挑戰(zhàn)。而現(xiàn)有的管理統(tǒng)計學課堂教學模式難以匹配大數(shù)據(jù)時代對其提出的要求,這就要求對管理統(tǒng)計學的課堂教學模式進行進一步的發(fā)展與創(chuàng)新,以期適應(yīng)大數(shù)據(jù)背景下的新要求。
(兗州煤業(yè)榆林能化有限公司,陜西榆林719000)
[摘要]隨著信息技術(shù)的發(fā)展與應(yīng)用,各種數(shù)據(jù)信息通過互聯(lián)網(wǎng)、云終端、交際圈、物聯(lián)網(wǎng)等之間的大規(guī)模傳遞,人類進入到一個大數(shù)據(jù)時代,數(shù)據(jù)信息之間的傳遞影響著人們的決策成本,傳統(tǒng)的信息不對等所造成的差距條件已經(jīng)消失,而不起眼的數(shù)據(jù)卻能夠創(chuàng)造巨大的價值。本文對大數(shù)據(jù)時代背景下數(shù)據(jù)分析理念進行分析和指導。
[
關(guān)鍵詞 ]大數(shù)據(jù)時代;數(shù)據(jù)分析理念;分析
[DOI]10.13939/j.cnki.zgsc.2015.22.074
在傳統(tǒng)的商業(yè)運作模式中,在運營過程中對自身經(jīng)營發(fā)展的分析只停留在數(shù)據(jù)的簡單匯總層面,缺乏有效地對客戶網(wǎng)絡(luò)、業(yè)務(wù)范圍、營銷產(chǎn)品、競爭對手優(yōu)劣等方面進行深入解析;而在當今大數(shù)據(jù)時代,通過所接收的大量內(nèi)部和外部數(shù)據(jù)中所蘊含的信息中透露的市場彈性,可以預(yù)測市場需求,進行分析決策,從而制定更加行之有效的戰(zhàn)略發(fā)展計劃。“大數(shù)據(jù)”是一個量特別大,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對其內(nèi)容進行抓取、管理和處理。在當今信息時代,很多企業(yè)用戶在實際應(yīng)用中把多個數(shù)據(jù)集放在一起,已經(jīng)形成了PB級的數(shù)據(jù)量;數(shù)據(jù)類型廣,數(shù)據(jù)來源種類多,且數(shù)據(jù)種類和格式日漸豐富,囊括了半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),早已打破傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)范疇,如何在大數(shù)據(jù)時代背景下進行科學有效的數(shù)據(jù)分析這需要加強對市場的了解,對泡沫經(jīng)濟的規(guī)避,了解數(shù)據(jù)所傳遞的信息真假。
1數(shù)據(jù)化決策的興起與運用
在大數(shù)據(jù)時代,信息之間的爆炸增長,使得各種信息傳遞非常之快,只需要拿起網(wǎng)絡(luò)終端就可以了解到地球另一邊發(fā)生了什么。文字、圖形、影像都化作數(shù)據(jù)流在網(wǎng)絡(luò)中以電信號的方式傳遞著信息。數(shù)據(jù)流在傳遞各行各業(yè)的信息同時形成了滲透于各行業(yè)的核心資產(chǎn)和創(chuàng)新驅(qū)動力。在大數(shù)據(jù)時代,企業(yè)所擁有的數(shù)據(jù)集合規(guī)模及數(shù)據(jù)的分析和處理能力決定著企業(yè)在市場中的核心競爭力。
因此通過數(shù)據(jù)分析進行決策漸漸成為新的分析理念,例如,在支付寶上進行對電影票房的投資,這些投資通過對導演往期作品和演員的表演張力,及投資方的選角等數(shù)據(jù)進行分析,預(yù)測電影的票房,選取投資可獲利的電影,進行票房投資,從而獲取票房分紅。我國的石油油田根據(jù)地震技術(shù)的收集數(shù)據(jù),進行科學統(tǒng)一規(guī)劃的分析處理,形成對地下油田的分析建模,能夠有效直觀地展示地下油藏的分布情況,從而選擇油井的開采點。中國人民銀行通過對人民幣匯率的漲幅,進行數(shù)據(jù)分析,來制定符合中國國情的外匯貨幣政策,對貨幣進行宏觀調(diào)控,這能夠有力的保護人民幣升值時,在國際貿(mào)易市場中國進出口貿(mào)易所面臨的壓力。在大數(shù)據(jù)時代背景下,通過直覺和經(jīng)驗進行決策分析的優(yōu)勢不斷下降,在商業(yè)、政治及公共服務(wù)領(lǐng)域中,通過對大數(shù)據(jù)進行數(shù)據(jù)分析從而做出符合時代背景的決策,已成了目前的潮流。
2數(shù)據(jù)分析理念及方法
(1)數(shù)據(jù)分析要引入統(tǒng)計學思想。在大數(shù)據(jù)時代背景下,傳統(tǒng)的抽樣分析已經(jīng)并不適用于對大數(shù)據(jù)的分析中,在大數(shù)據(jù)時代應(yīng)當要轉(zhuǎn)變思維,轉(zhuǎn)變抽樣思想,樣本就是總體,要分析與某事物相關(guān)的所有數(shù)據(jù),而不是依靠少量數(shù)據(jù)樣本,這樣才能夠在最大限度地明白事物發(fā)展變更過程,能夠?qū)?shù)據(jù)所表露的信息進行更好地處理[1]。要更樂于接受數(shù)據(jù)的紛繁蕪雜,不再追求精確的數(shù)據(jù),這并不是說其嚴謹性降低了,而是往往不起眼,不符合常理的數(shù)據(jù)更能夠反映實際的情況。通過對數(shù)據(jù)網(wǎng)絡(luò)之間的聯(lián)系進行分析,不再探求難以捉摸的因果關(guān)系,通過數(shù)據(jù)的分析處理更能夠反應(yīng)數(shù)據(jù)的變更。這些想法都與統(tǒng)計學相關(guān)通過所收集的數(shù)據(jù),進行有效的分類處理,能夠更好地反應(yīng)事物的變化,更有利于做出決策[2]。
(2)數(shù)據(jù)分析流程。在實際的數(shù)據(jù)分析過程中,因大數(shù)據(jù)貫穿區(qū)域較廣,在地域和行業(yè)之間穿插交錯,顛覆了傳統(tǒng)的線性數(shù)據(jù)收集模式,而形成了顛覆傳統(tǒng)的、非線性的決策基礎(chǔ),這種決策方式要求我們通過對數(shù)據(jù)進行收集,將各行各業(yè)所收集的基本信息,轉(zhuǎn)化為數(shù)據(jù),將數(shù)據(jù)經(jīng)過初步的整合分類,做出符合當?shù)禺敃r的數(shù)據(jù)信息,將數(shù)據(jù)進行深層次的技術(shù)處理,將處理過后的信息化為知識,運用到實際的決策中去。在大數(shù)據(jù)時代,數(shù)據(jù)的積累并不會貶值,而且還會不斷增值,為了更全面、深入地了解研究對象,往往需要對數(shù)據(jù)進行整合,這就使得數(shù)據(jù)的積累尤為重要。
(3)數(shù)據(jù)分析對統(tǒng)計學的意義。在大數(shù)據(jù)時代背景下數(shù)據(jù)分析理念能夠有效地對數(shù)據(jù)流進行合理地分類處理,進行科學的統(tǒng)計行為,統(tǒng)計與分析主要利用分布式數(shù)據(jù)庫,或者分布式計算集群來對存儲于其內(nèi)的海量數(shù)據(jù)進行普通的分析和分類匯總等,這就意味著所有有用的數(shù)據(jù)信息均來源于數(shù)據(jù)分析處理之后的結(jié)果。大數(shù)據(jù)的數(shù)據(jù)分析理念擴寬了統(tǒng)計學的研究范圍,而不僅僅只是實現(xiàn)數(shù)據(jù)的對比,而是從根本上豐富了研究的內(nèi)容,如:一些實時性需求會用到EMC 的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright等,而一些批處理,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求可以使用Hadoop,滿足大多數(shù)常見的分析需求,對傳統(tǒng)的統(tǒng)計工作有著四個轉(zhuǎn)變。統(tǒng)計研究過程的轉(zhuǎn)變,使統(tǒng)計過程成為收集與研究。統(tǒng)計與分析這部分的主要特點和挑戰(zhàn)是分析涉及的數(shù)據(jù)量大,統(tǒng)計研究工作思想的轉(zhuǎn)變,數(shù)據(jù)的收集不斷增加,信息的錄入不斷升級,其對系統(tǒng)資源,特別是I/O會有極大的占用。這就使得能夠更好地進行數(shù)據(jù)分析處理決策[3]。
3數(shù)據(jù)分析過程中注意事項
3.1數(shù)據(jù)分析要明確變量
將數(shù)據(jù)收集進行處理是為了明確市場中的某一個變量意義,這就使得在進行數(shù)據(jù)分析的時候要能夠明確地找尋變量存在前后所發(fā)生的變化,通過數(shù)據(jù)對比可以知道該變量在大數(shù)據(jù)的市場中所存在的影響因素。是否對市場有著風險或有利于市場的開發(fā)利用,能夠在數(shù)據(jù)分析后做出合理決策。
3.2統(tǒng)計中不再追求精確的數(shù)據(jù)
大數(shù)據(jù)時代下,數(shù)據(jù)的不精確性不僅不會破壞總體信息可靠性,還有利于進行剝絲抽繭,從而了解總體情況。大數(shù)據(jù)時代,越來越多的數(shù)據(jù)提供越來越多的信息,也會讓人們越來越了解總體的真實情況。錯綜復雜的數(shù)據(jù)能夠反映數(shù)據(jù)之下到底是泥潭還是機遇。數(shù)據(jù)之間傳遞的信息良莠不齊,如果要一一追求準確性不利于統(tǒng)計工作的開展,因此可以將個別的異常值剔除。大數(shù)定律告訴我們,隨著樣本的增加,樣本平均數(shù)越來越接近總體,這就使得樣本與總體的差異性很小,更加符合實際情況。
4結(jié)論
綜上所述,大數(shù)據(jù)包含結(jié)構(gòu)內(nèi)外的海量數(shù)據(jù),隨著云計算平臺進行大規(guī)模收集處理,通過建立數(shù)據(jù)庫的手段,對數(shù)據(jù)分流,使用數(shù)據(jù)挖掘等方法進行處理、分析,使得所數(shù)據(jù)結(jié)果更加符合顯示狀況。數(shù)據(jù)分析理念是通過闡明存在于世界、物質(zhì)、感官享受上的復雜網(wǎng)絡(luò)關(guān)系,從而做出符合時代背景的分析決策。
參考文獻:
[1]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013.
關(guān)鍵詞:大數(shù)據(jù);大數(shù)據(jù)人才;發(fā)展戰(zhàn)略
人類進入信息時代,意味著大數(shù)據(jù)時代業(yè)已來臨。大數(shù)據(jù)時代將為人類社會帶來全新挑戰(zhàn)。大數(shù)據(jù),顧名思義,大就是海量,數(shù)量龐大。大數(shù)據(jù)時代信息容量更加巨大,數(shù)據(jù)類型趨于多樣化,要求更快的反應(yīng)速度和處理速度。
一、大數(shù)據(jù)人才重要性
“麥肯錫全球研究院將‘大數(shù)據(jù)’定義為‘無法在一定時間內(nèi)使用傳統(tǒng)數(shù)據(jù)庫軟件工具對其內(nèi)容進行獲取、管理和處理的數(shù)據(jù)集合’”[1]。新世紀以來,世界發(fā)達資本主義國家十分重視數(shù)據(jù)人才培養(yǎng)和相關(guān)科學問題的研究?!叭缑绹~約大學、英國鄧迪大學均從2013年起設(shè)立數(shù)據(jù)科學碩士學位,美國哥倫比亞大學將從2015年起設(shè)立數(shù)據(jù)科學博士學位”[2]?!霸趪鴥?nèi),香港中文大學自2008年起就設(shè)立了“數(shù)據(jù)科學商業(yè)統(tǒng)計”科學碩士學位,清華大學新近成立了數(shù)據(jù)科學研究院,自今年9月起開始招收研究生;西安交大、浙江大學、華東師大等高校也先后設(shè)立了數(shù)據(jù)科學研究中心”[2]。2013年《上海推進大數(shù)據(jù)研究和發(fā)展三年行動計劃》正式啟動。大數(shù)據(jù)時代去缺乏有深入的數(shù)據(jù)分析能力的人,在市場上是緊缺狀態(tài)。
明代高攀龍《答袁節(jié)寰中丞》:“今天下難聯(lián)者人心,難得者人才?!薄翱萍寂d國”的第一步是“人才發(fā)展戰(zhàn)略”,人才資源已經(jīng)成為“第一資源”,可見人才在大數(shù)據(jù)時代的重要性不容忽視。《國家中長期人才發(fā)展規(guī)劃綱要(2010-2020年)》具體包含12項重大人才工程??梢妵覍θ瞬艈栴}重視程度之高。大數(shù)據(jù)時代最重要的日程之一就是計算機人才培養(yǎng)問題。唯有解決好這一問題,中國才能在大數(shù)據(jù)浪潮中立于不敗之地。一個國家對大數(shù)據(jù)的掌握,甚至可以影響一個國家的綜合國力,對數(shù)據(jù)的占有權(quán)將成為國家競爭中的核心問題之一。
二、大數(shù)據(jù)人才是打破發(fā)展困局的關(guān)鍵
我國大數(shù)據(jù)雖然發(fā)展很快,但在智慧城市建設(shè)、基礎(chǔ)軟件研發(fā)、數(shù)據(jù)流動性等方而尚存在一些不足。
現(xiàn)階段中國僅處于大數(shù)據(jù)時代的萌芽階段。以往人們認知的傳統(tǒng)的數(shù)據(jù)并不能夠等同于大數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)分析和數(shù)據(jù)統(tǒng)計手段也并不適用于大數(shù)據(jù)領(lǐng)域。國內(nèi)企業(yè)在數(shù)據(jù)庫、數(shù)據(jù)倉庫、商業(yè)智能等領(lǐng)域基礎(chǔ)薄弱,大數(shù)據(jù)的意識和重視程度甚至創(chuàng)新精神,都較為薄弱或者有所或缺。現(xiàn)階段中國國內(nèi)缺乏領(lǐng)軍企業(yè)占據(jù)大數(shù)據(jù)生態(tài)系統(tǒng)主導地位。做大數(shù)據(jù)產(chǎn)業(yè)不難,但是真正做精做強,占據(jù)以核心軟件產(chǎn)品為主導地位的生態(tài)系統(tǒng)很難?,F(xiàn)階段中國數(shù)據(jù)獲取壁壘和行業(yè)間壁壘存在。
對大數(shù)據(jù)人才的培養(yǎng)力度不足、人力物力投入不夠,人才導致中國大數(shù)據(jù)發(fā)展陷入難題。人才發(fā)展是大數(shù)據(jù)發(fā)展的關(guān)鍵和重中之重。
三、 大數(shù)據(jù)時代的計算機人才發(fā)展戰(zhàn)略
大數(shù)據(jù)時代的計算機人才需求發(fā)展趨勢是復合型人才,與此同時,對數(shù)據(jù)科學家、數(shù)據(jù)分析師專門人才的極為渴求,而由于學校培養(yǎng)與企業(yè)環(huán)境經(jīng)常性脫節(jié),應(yīng)該大力加強校企合作,逐步形成產(chǎn)學研聯(lián)動發(fā)展。
(一)培育大數(shù)據(jù)復合型人才
“中國急需對數(shù)學、統(tǒng)計學、數(shù)據(jù)分析、機器學習和自然語言處理等多方面知識綜合掌控”[3]的復合型計算機人才。在傳統(tǒng)的大學培養(yǎng)和教育體制下,我們在一些與大數(shù)據(jù)相關(guān)的專業(yè)學科領(lǐng)域已經(jīng)儲備了大量人才,包括統(tǒng)計學、數(shù)學、人工智能、可視化等方面,但是大數(shù)據(jù)需要的是復合型的人才,需要將深厚的技術(shù)背景與所在行業(yè)和業(yè)務(wù)領(lǐng)域的需求相結(jié)合[4]。
(二) 培育數(shù)據(jù)科學家群體
大數(shù)據(jù)最關(guān)鍵的部分是數(shù)據(jù)分析和挖掘數(shù)據(jù)價值……就需要大量的數(shù)據(jù)科學家[3]?!皵?shù)據(jù)科學家……一定要懂得算法,知道用什么樣的方法可以更好地挖掘出大數(shù)據(jù)的價值。”[4]。在某種程度上,數(shù)據(jù)科學家就像是一個轉(zhuǎn)換器,在大數(shù)據(jù)項目中起到了承上啟下的作用。[4]。
(三) 強化數(shù)據(jù)分析隊伍力量
知其然而知其所以然,在當前,中國數(shù)據(jù)分析與管理人才極端緊缺,中國企業(yè)必須加大招聘和人才挽留力度,同時學校應(yīng)該加大這方面的專業(yè)教育力度。數(shù)據(jù)分析專業(yè)在高校的設(shè)立也是勢在必行,但目前這方面仍是大數(shù)據(jù)教育的軟肋。在學校的領(lǐng)導層決策層必須適時地重視數(shù)據(jù)分析專業(yè)的設(shè)立,重視數(shù)據(jù)分析專業(yè)學生的招收工作,實時跟進,不容懈怠。
(四) 利用校企合作作為有效途徑
僅僅依靠偏向于理論研究的大學教育,很難培養(yǎng)出更符合企業(yè)和市場實際需求的實用型的大數(shù)據(jù)人才,因為學校往往并沒有提供真正的大數(shù)據(jù)環(huán)境給學生。所以大數(shù)據(jù)技術(shù)與應(yīng)用必須特別強調(diào)與企業(yè)實踐的有機結(jié)合。具有大數(shù)據(jù)專業(yè)的學與大數(shù)據(jù)企業(yè)的互動聯(lián)合,將造成孵化大數(shù)據(jù)精英人才的最佳環(huán)境。一方面,積極聘請企業(yè)中的大數(shù)據(jù)專家到學校授課。以其大數(shù)據(jù)實踐經(jīng)驗為主要傳授內(nèi)容,使得學校的大數(shù)據(jù)教育能夠緊跟企業(yè)、社會發(fā)展速度,把握市場需求脈搏。另一方面希望大數(shù)據(jù)企業(yè)為大數(shù)據(jù)專業(yè)學生提供實習機會,給予優(yōu)先錄用的機會,以提高學生的積極性。
參考文獻:
[1]朱東華,張嶷,汪雪鋒.大數(shù)據(jù)環(huán)境下技術(shù)創(chuàng)新管理方法研究[J].科學學與科學技術(shù)管理,2013,(4):172-180.
[2]沈湫莎.上海啟動大數(shù)據(jù)人才培養(yǎng)計劃[J].現(xiàn)代人才,2014,(3):8.
[3]謝然.大數(shù)據(jù)人才“求賢若渴”[J].互聯(lián)網(wǎng)周刊.2014,(20):22-23.
關(guān)鍵詞:大數(shù)據(jù);小數(shù)據(jù);數(shù)據(jù)分析;發(fā)展;變革
中圖分類號:TP31 文獻標識碼:A 文章編號:1001-828X(2014)010-00-01
如果說互聯(lián)網(wǎng)的浪潮改變了人們的生活,那么大數(shù)據(jù)將再一次改變整個世界,只有擁有數(shù)據(jù)的人才有最終話語權(quán),眾多互聯(lián)網(wǎng)公司的巨頭們都紛紛追逐這夢想成為時代的弄潮兒,在原本近乎生疏的名詞“大數(shù)據(jù)”搖身一變,成了我們耳熟能詳?shù)脑~匯,無論是傳統(tǒng)企業(yè)或是互聯(lián)網(wǎng)公司都在邁開步伐向著大數(shù)據(jù)領(lǐng)域加速前進,然而現(xiàn)階段大數(shù)據(jù)的火熱程度如同盛夏的溫度一樣,大數(shù)據(jù)時髦,但非萬能,不必事事、時時與之相連。因此我們需要認清企業(yè)本身實際情況,不要盲目一味追求大數(shù)據(jù),而忽略了小數(shù)據(jù)所帶來更精準、精確的數(shù)據(jù)分析。
《美國計算機學會通訊》幾次刊文談到了小數(shù)據(jù),第一位意識到“小數(shù)據(jù)”重要性的是美國康奈爾大學教授德波哈爾?艾斯汀。他的父親去世之前幾個月,這位計算機科學教授就注意到老人在數(shù)字社會脈動中的些許不同,他不再發(fā)送電子郵件,不去超市買菜,散步的距離也越來越短。這種逐漸衰弱的狀態(tài),到醫(yī)院檢查時,不管是測脈搏還是查病歷,這位90歲的老人都沒有表現(xiàn)出特別明顯的異常??墒聦嵣?,追蹤他每時每刻的個體化數(shù)據(jù),他的生活其實已經(jīng)明顯與之前不同。這種日常小數(shù)據(jù)帶來的生命訊息的警示和洞察,啟發(fā)了這位計算機科學教授,小數(shù)據(jù)可以看作是一種新的醫(yī)學證據(jù),它是“your row of their data”。
一、大數(shù)據(jù)與小數(shù)據(jù)的對比
大數(shù)據(jù)技術(shù)(Big Data),或稱巨量資料,指的是所涉及的資料兩規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營更積極目的的資訊。大數(shù)據(jù)的特點,簡單總結(jié)為高容量、多元化、持續(xù)性、高價值。
小數(shù)據(jù)(iData),并不是指數(shù)據(jù)量小,而是圍繞個人為中心全方位的數(shù)據(jù),及其配套的收集、處理、分析和對外交互的綜合系統(tǒng)。人產(chǎn)生的數(shù)據(jù),包括生活習慣、社交、財務(wù)、行為等,全部被收集和利用進行分析,并對外形成一個富有個人色彩的數(shù)據(jù)系統(tǒng),小數(shù)據(jù)的特點在于以單個人為對象,重點在于深度,對個人數(shù)據(jù)全方位全天候的挖掘利用。
大數(shù)據(jù)和小數(shù)據(jù)有些本質(zhì)的區(qū)別,雖然以創(chuàng)造數(shù)據(jù)價值為目的思維和大數(shù)據(jù)是相似的,但是在具體方式上,還是有些不同的區(qū)別:
1.數(shù)據(jù)處理方式:大數(shù)據(jù)強調(diào)標準化,只有數(shù)據(jù)標準化,才能大規(guī)模采集,以后的數(shù)據(jù)處理概率統(tǒng)計才有了可能??墒菙?shù)據(jù)一標準化,就失去了其數(shù)據(jù)產(chǎn)生時的特性和背景。而小數(shù)據(jù)的用戶數(shù)據(jù)的最大特點就是來源和使用者是同一人,只不過存和取時間和背景不一樣。
2.人的作用:在大數(shù)據(jù)模式下,數(shù)據(jù)從人身上產(chǎn)生被收集后,接下來的數(shù)據(jù)處理分析,就再也跟數(shù)據(jù)的主人無關(guān)了。而在小數(shù)據(jù)里,所有數(shù)據(jù)都圍繞一個人產(chǎn)生,所以人在系統(tǒng)發(fā)揮中心作用。
3.其他數(shù)據(jù)性質(zhì)的區(qū)別:比如小數(shù)據(jù)的數(shù)據(jù)量相對大數(shù)據(jù)的數(shù)據(jù)量小。小數(shù)據(jù)對數(shù)據(jù)不需要全部快速反應(yīng),相反大數(shù)據(jù)對數(shù)據(jù)需要做出快速反應(yīng)。小數(shù)據(jù)更加注重非結(jié)構(gòu)化數(shù)據(jù)之間的關(guān)聯(lián),重視深度挖掘,而大數(shù)據(jù)重在包容所有個體的數(shù)據(jù),數(shù)據(jù)覆蓋面廣。
二、利用大數(shù)據(jù)中的小數(shù)據(jù)分析
Amazon(亞馬遜)的一句名言“最成功書籍應(yīng)該只有一本書,就是用戶要買的下一本書”,即使大數(shù)據(jù)的先行者Amazon,預(yù)測用戶要買的下一本數(shù)也并不容易。然而Amazon一向敢于嘗試新的商業(yè)模式,Amazon正利用其數(shù)據(jù)優(yōu)勢,基于各種小數(shù)據(jù)分析,通過了解客戶平時關(guān)注商品、新聞、愛好等信息,提前預(yù)測客戶需求,可以在顧客購物確定下單前預(yù)先發(fā)貨。
北京朝陽大悅城也有類似研究結(jié)果,信息研策部發(fā)現(xiàn),平均每個駕車用戶一次可為商場貢獻約700元的收入,銷售變化與車流變化幅度的相關(guān)性接近92%。這都是小數(shù)據(jù)的魅力,相比電商背后的云數(shù)據(jù),朝陽大悅城10萬人的數(shù)據(jù)樣本只算是小數(shù)據(jù),但對于一家要自我革命的購物中心而言足夠了。這對于任何一個可進行數(shù)據(jù)分析的企業(yè)來說,極具借鑒意義。
三、小數(shù)據(jù)時代的發(fā)展未來
1.小數(shù)據(jù)的未來趨勢
通過數(shù)據(jù)分析提高銷售水平和服務(wù)質(zhì)量,是任何公司未來發(fā)展的重要手段。目前國內(nèi)對于小數(shù)據(jù)的分析和利用仍處于起步階段,企業(yè)可利用現(xiàn)有數(shù)據(jù)進行全面分析,并對數(shù)據(jù)中變量的全面把握,充分利用小數(shù)據(jù)分析結(jié)果對公司進行發(fā)展預(yù)測;考慮小數(shù)據(jù)的人文因素,在數(shù)據(jù)分析日益完善的基礎(chǔ)上,引入社會、心里、人文等因素,能夠多方位、多維度的進行分析,使分析結(jié)果更加準確。
2.小數(shù)據(jù)預(yù)測對人才的要求
為了使得數(shù)據(jù)分析的結(jié)果更加精準、精確,從而做出有預(yù)測性、有價值的分析。小數(shù)據(jù)分析人員要求具有統(tǒng)計學、商業(yè)分析和自然語言處理能力,能夠?qū)?shù)學、統(tǒng)計學、計算機等多方面知識的全方位掌握。
3.小數(shù)據(jù)的大服務(wù)
小數(shù)據(jù)作為數(shù)據(jù)時代的重要組成部分,任何銷售、服務(wù)、金融企業(yè)可以充分利用數(shù)據(jù)資源,在做好大數(shù)據(jù)的基礎(chǔ)上,提取具有鮮明特征且具有價值的小數(shù)據(jù),挖掘可利用的客戶個人信息,獲取有價值的客戶信息,降低公司成本,提高運行效率,曾加銷量,更好地為客戶提供量身訂做的優(yōu)質(zhì)服務(wù)。
一切數(shù)據(jù)存在的根本在于人。人的需求是所有科技變革發(fā)展的動力。不遠的將來,數(shù)據(jù)變革下一步將從大數(shù)據(jù)時代進入以人為本的小數(shù)據(jù)時代。
參考文獻:
[1]董奎勇.說說小數(shù)據(jù)[M].紡織導報,2014,8.
[2]楊旭珠,岳亞楠.小數(shù)據(jù)早就大未來[J].環(huán)球市場信息導報,2014,4.
[3]王成文.數(shù)據(jù)力:“大數(shù)據(jù)”PK“小數(shù)據(jù)”[J].中國傳媒科技,2013,19.
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計學;教學改革
中圖分類號:C829.29 文獻識別碼:A 文章編號:1001-828X(2015)024-000-01
一、引言
最早提出“大數(shù)據(jù)”時代到來的是全球知名咨詢公司麥肯錫,現(xiàn)在的社會是一個高速發(fā)展的社會,科技發(fā)達,信息流通,人們之間的交流越來越密切,生活也越來越方便,大數(shù)據(jù)就是這個高科技時代的產(chǎn)物。大數(shù)據(jù)具有以下的鮮明特點:第一個特征是數(shù)據(jù)量大。第二個特征是數(shù)據(jù)類型繁多,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。第三個特征是數(shù)據(jù)價值密度相對較低,如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”,是大數(shù)據(jù)時代亟待解決的難題。第四個特征是處理速度快,時效性要求高,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
統(tǒng)計學專業(yè)是與數(shù)據(jù)分析處理聯(lián)系最為緊密的學科之一。大數(shù)據(jù)時代的到來不僅為統(tǒng)計學專業(yè)的發(fā)展帶來的前所未有的機遇,同時也帶來了巨大挑戰(zhàn)。傳統(tǒng)的統(tǒng)計學專業(yè)已不再適應(yīng)大數(shù)據(jù)時代的信息爆發(fā)式增長的要求,這就要求我們應(yīng)該對統(tǒng)計學專業(yè)進行重新定位,并在此基礎(chǔ)上調(diào)整相關(guān)課程,改革傳統(tǒng)的教學手段以及完善教學評價體系,以適應(yīng)大數(shù)據(jù)時代的到來。
二、統(tǒng)計學專業(yè)改革的建議
(一)人才培養(yǎng)目標的重新定位
如果說以往的統(tǒng)計學專業(yè)是以培養(yǎng)簡單的“應(yīng)用型”人才為目標,那么隨著大數(shù)據(jù)時代的到來,社會不僅僅需要會應(yīng)用基礎(chǔ)統(tǒng)計知識處理相關(guān)領(lǐng)域的問題的單一的應(yīng)用型人才,而是對人才提出了更高的要求:大數(shù)據(jù)時代下的統(tǒng)計學專業(yè)的人才除了應(yīng)該具備基礎(chǔ)的數(shù)據(jù)收集,處理和分析的能力之外,還應(yīng)該了解相關(guān)應(yīng)用領(lǐng)域的背景知識,而且應(yīng)具備很強的自我學習能力,以適應(yīng)大數(shù)據(jù)時代數(shù)據(jù)量大,總類繁多,時效性高等發(fā)展特點。因此,統(tǒng)計學人才培養(yǎng)目標應(yīng)該重新作出調(diào)整,應(yīng)該以培養(yǎng)全新的“復合型”統(tǒng)計人才為新的目標。
(二)課程設(shè)置的調(diào)整
隨著人才培養(yǎng)目標的重新定位,隨之而來的就是應(yīng)該對不再適應(yīng)時展要求的課程進行必要的調(diào)整。
首先,大數(shù)據(jù)的分析和處理與以往的經(jīng)典分析方法有很大不同,以往的統(tǒng)計分析方法主要是建立在抽樣基礎(chǔ)之上,而大數(shù)據(jù)時代信息處理迅速,信息獲得途徑廣泛,而且信息價值密度低,這就要求數(shù)據(jù)處理時,可以以全體作為樣本,而不是進行抽樣;分析時必須考慮所有數(shù)據(jù)而不是剔除所謂的異常數(shù)據(jù)。因此,以往的經(jīng)典統(tǒng)計分析方法已不再適應(yīng)大數(shù)據(jù)的處理和分析,必須適當?shù)恼{(diào)整經(jīng)典分析方法的課程設(shè)置,增加新的適用于大數(shù)據(jù)分析的課程。
其次,隨著數(shù)據(jù)量的爆發(fā)式增長,所有的統(tǒng)計工作對計算機的依賴程度越來越高,這就要求統(tǒng)計學專業(yè)的學生不僅掌握統(tǒng)計學專業(yè)的基礎(chǔ)知識,同時應(yīng)該熟練掌握計算機專業(yè)知識相關(guān)知識,因此,在課程安排時,應(yīng)注意計算機相關(guān)課程的適當增加。
基于上述原因,可以考慮增加如下課程:機器學習,模擬算法,數(shù)據(jù)挖掘,R語言軟件分析等課程,同時適當降低傳統(tǒng)分析方法課程的學時比重。此外,為了使學生能夠?qū)ο嚓P(guān)應(yīng)用領(lǐng)域的背景知識有所了解,可適當增設(shè)與應(yīng)用領(lǐng)域相關(guān)的通識課程。
(三)教學模式與手段的創(chuàng)新
以往的教學模式,通常是以課堂教學,掌握書本經(jīng)典理論為主。雖然,傳統(tǒng)教學手段有著學生理論基礎(chǔ)扎實等諸多優(yōu)點,但是同時也存才學生過于偏重理論知識的掌握,動手能力不足,理論與實踐脫節(jié)等缺點。隨著社會的發(fā)展,尤其統(tǒng)計學專業(yè)自身具有鮮明的應(yīng)用專業(yè)特點。只采用傳統(tǒng)的教學模式和手段顯然不再適合大數(shù)據(jù)時代的需要;同時,隨著大數(shù)據(jù)時代的到來,多媒體手段日益豐富多彩,為傳統(tǒng)教學的創(chuàng)新提供了必要的支持。因此,為了適應(yīng)大數(shù)據(jù)時代人才的要求,必須改革傳統(tǒng)的教學手段和模式,在傳統(tǒng)教學基礎(chǔ)上,加大實驗教學的比重,在傳統(tǒng)教學外,增加社會實踐環(huán)節(jié),引入微課慕課,翻轉(zhuǎn)課堂等全新教學模式,以提高學生的學習興趣,鍛煉學生理論應(yīng)用于實踐的能力,從而為以后使用大數(shù)據(jù)時代的工作打下堅實的基礎(chǔ)。
(四)教學評價體系的完善
傳統(tǒng)的教學評價體系,通常是采用書面考核的方式對學生的學習進行評價,隨著時代的發(fā)著,單純的筆試評價不足以衡量學生的全面能力,最后導致出現(xiàn)高分低能的情況的出現(xiàn)。
為了適應(yīng)大數(shù)據(jù)時代對人才多方面能力的需求,必須對傳統(tǒng)的考核評價體系做出適當?shù)恼{(diào)整,以評價學生的多方面能力,尤其是動手能力,學習能力和應(yīng)用相關(guān)理論處理實際問題的能力。具體可以采用多種考核方法相結(jié)合的方式。如:增加平時的考核力度,增加實踐項目的考核,通過布置適當?shù)捻椖空撐?,采用答辯的形式,以鍛煉學生適應(yīng)以后工作,獨立分析解決問題的能力。
此外,傳統(tǒng)教學評價體系通常是單方面的,只有對學生成績的評價,為了適應(yīng)大數(shù)據(jù)時代的到來,全面提高教學質(zhì)量,可采取雙向教學評價體系,如:增加學生對教學環(huán)節(jié)的評價體系。以及教師間同行間的評價體系等。
關(guān)鍵詞:大數(shù)據(jù);經(jīng)管類專業(yè);課程體系
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2016)13-0054-02
大數(shù)據(jù)時代給社會經(jīng)濟發(fā)展帶來了機遇和挑戰(zhàn),社會各行各業(yè)對數(shù)據(jù)分析需求大幅上升,需要借助數(shù)據(jù)分析實現(xiàn)數(shù)據(jù)的增值,挖掘數(shù)據(jù)背后的潛在價值,為其經(jīng)營管理決策、投資決策提供智力支持。隨著社會經(jīng)濟發(fā)展對具有數(shù)據(jù)管理和數(shù)據(jù)分析能力的應(yīng)用創(chuàng)新型經(jīng)濟管理人才的需求逐漸攀升,也引發(fā)了對高校經(jīng)管類專業(yè)學生能力的更高要求。面對紛繁復雜的社會經(jīng)濟環(huán)境,經(jīng)管類專業(yè)學生必須能夠廣泛應(yīng)用定量分析技術(shù),能夠從海量數(shù)據(jù)中獲取有效數(shù)據(jù),運用科學的方法從這些數(shù)據(jù)中提取出有用信息,建立相應(yīng)的模型,作出最優(yōu)決策。
統(tǒng)計學是培養(yǎng)經(jīng)管類專業(yè)學生定量分析能力的一門重要課程,是眾多高等院校經(jīng)管類專業(yè)的專業(yè)基礎(chǔ)必修課,是以后深入學習相關(guān)定量方法類課程(諸如計量經(jīng)濟學、管理運籌學、市場調(diào)查與預(yù)測等)的基礎(chǔ)。因此,統(tǒng)計學課程體系設(shè)置是否合理,將直接影響到學生獲取有效數(shù)據(jù)和分析數(shù)據(jù)應(yīng)用能力的培養(yǎng),進而影響學生定量分析能力的培養(yǎng)。
一、經(jīng)管類專業(yè)統(tǒng)計學課程體系存在的問題
1.課程教學定位模糊。我國高等院校經(jīng)管類專業(yè)統(tǒng)計學教學中的最大弊端在于一直按照前蘇聯(lián)劃分方式將其歸類為一門偏重于簡單數(shù)據(jù)整理課程,而將相應(yīng)的統(tǒng)計分析所采用方法和理論歸為數(shù)理統(tǒng)計,因此在教學中不重視對后者的學習。然而,西方發(fā)達國家的統(tǒng)計學課程是同時包括這兩個部分內(nèi)容的,尤其是后一個部分內(nèi)容是定量分析的重要基礎(chǔ)。因此,在傳統(tǒng)統(tǒng)計學教學定位下,學生只認識了基本理論與概念,卻掌握不了處理和分析數(shù)據(jù)的能力,這與經(jīng)管類專業(yè)應(yīng)用型人才培養(yǎng)目標相背離,難以適應(yīng)大數(shù)據(jù)時代社會各領(lǐng)域?qū)?jīng)濟管理人才素質(zhì)的新需求。
2.課程體系有待完善,與經(jīng)管類專業(yè)融合不夠。目前,大多數(shù)高等院校經(jīng)管類專業(yè)統(tǒng)計學課程設(shè)置只涉及理論統(tǒng)計學這一領(lǐng)域,未將統(tǒng)計分析方法與相關(guān)經(jīng)管類專業(yè)知識有機結(jié)合。在這樣的課程體系安排下,學生雖然掌握了統(tǒng)計基本理論和方法,但難以體會到統(tǒng)計在本專業(yè)學習中的應(yīng)用價值,當面臨現(xiàn)實的經(jīng)濟、管理問題卻無能為力,不會運用所學統(tǒng)計方法,結(jié)合專業(yè)知識對實際問題進行定量分析。這種狀況與經(jīng)管類人才定量分析能力培養(yǎng)目的相違背,難以實現(xiàn)具有創(chuàng)新能力的經(jīng)管類人才的培養(yǎng)目標。
因此,如能結(jié)合經(jīng)管類專業(yè)特點,對統(tǒng)計學的課程體系進行優(yōu)化建設(shè),勢必能夠培養(yǎng)出具有定量分析技能,滿足社會需求和企業(yè)需求,符合大數(shù)據(jù)時代人才素質(zhì)要求的經(jīng)濟管理人才。
二、大數(shù)據(jù)時代經(jīng)管類專業(yè)統(tǒng)計學課程體系構(gòu)建
1.明確課程教學定位。目前,統(tǒng)計學教學中偏重于統(tǒng)計學基本概念、基本模型和基本方法的理論知識學習,系統(tǒng)性較強,有利于學生全面了解統(tǒng)計學的知識體系,但是對統(tǒng)計思維能力的培養(yǎng)和統(tǒng)計方法的應(yīng)用重視不夠,這不僅會讓學生望而生畏,從而失去學習的主動性與積極性,更為重要的是學生不能夠?qū)W以致用,在自己本專業(yè)深入學習過程中不會運用統(tǒng)計學知識來解決實際的經(jīng)濟管理問題,而在教與學中出現(xiàn)的這些問題源頭在于教學定位不夠準確。因此,本文提出新的課程教學定位:以應(yīng)用創(chuàng)新型人才培養(yǎng)為導向,提高經(jīng)管類專業(yè)學生定量分析能力為目標,結(jié)合經(jīng)濟學科和管理學科的特點,通過統(tǒng)計學的理論教學、案例分析、課程設(shè)計、實驗(踐)等教學環(huán)節(jié),培養(yǎng)學生統(tǒng)計思維能力和統(tǒng)計應(yīng)用能力,具備運用統(tǒng)計學理論與方法,研究社會經(jīng)濟管理領(lǐng)域有關(guān)數(shù)據(jù)收集、整理、分析等解決實際問題的綜合能力,以適應(yīng)大數(shù)據(jù)時代對經(jīng)濟管理人才的新需求。
2.課程體系優(yōu)化建設(shè)。根據(jù)新的教學定位,統(tǒng)計學課程體系優(yōu)化建設(shè)的基本思路:一是課程體系設(shè)置要強調(diào)基礎(chǔ)知識、注重靈活應(yīng)用、突出定量分析的教學理念和教學目標;二是課程結(jié)構(gòu)上,突出專業(yè)針對性,強調(diào)統(tǒng)計學科和經(jīng)濟學科、管理學科的有機結(jié)合,使課程特色化;三是建立實踐教學體系,加強學生實踐能力的鍛煉,為學生提供綜合素質(zhì)和能力提高的實訓平臺;四是將統(tǒng)計分析軟件的運用融入到課程體系之中,加強統(tǒng)計分析軟件的技能培養(yǎng)。
因此,本文將運用模塊化系統(tǒng)集成思想,根據(jù)經(jīng)濟與管理類各專業(yè)的要求,提出按專業(yè)分模塊,按模塊分層次,按層次定內(nèi)容的改革方案,構(gòu)建“課程體系課程子系統(tǒng)課程模塊具體內(nèi)容”的遞階控制結(jié)構(gòu)模型,具體如圖1所示。
在統(tǒng)計學課程體系優(yōu)化建設(shè)中,我們運用系統(tǒng)科學的方法構(gòu)建出模塊化、層次化集成的課程體系在整體功能上達到了最佳狀態(tài)。
課程基礎(chǔ)子系統(tǒng)是統(tǒng)計學理論基礎(chǔ)和統(tǒng)計思維培養(yǎng)階段,由統(tǒng)計學基本原理和基本理論構(gòu)成,體現(xiàn)了“厚基礎(chǔ)”的功能。課程應(yīng)用子系統(tǒng)和課程案例子系統(tǒng)是統(tǒng)計分析能力訓練階段,首先結(jié)合認知性案例模塊系統(tǒng)介紹統(tǒng)計分析方法,讓經(jīng)管類專業(yè)學生了解統(tǒng)計分析方法的基本原理,其次進一步結(jié)合專業(yè)特色案例模塊和統(tǒng)計分析軟件模塊,通過分專業(yè)教學方式,使不同專業(yè)學生能夠體會到統(tǒng)計學在本專業(yè)中的應(yīng)用,增強學生的學習興趣,體現(xiàn)了“強能力”的功能。課程實踐子系統(tǒng)是統(tǒng)計應(yīng)用能力實踐階段,是培養(yǎng)大數(shù)據(jù)時代應(yīng)用型經(jīng)管人才的重要環(huán)節(jié)。課程實踐主要包括課堂實踐和實驗室模擬,課外實踐主要包括社會實踐活動、實訓實習和相關(guān)競賽,通過課程實踐和課外實踐兩大平臺訓練學生運用所學統(tǒng)計調(diào)查、統(tǒng)計整理和統(tǒng)計分析等知識解決實際問題的綜合能力。課程選修子系統(tǒng)是統(tǒng)計應(yīng)用能力擴展階段,該階段在學生掌握統(tǒng)計學相關(guān)知識的基礎(chǔ)上,通過選修統(tǒng)計預(yù)測與統(tǒng)計決策兩大模塊,進一步培養(yǎng)學生的定量分析能力。
三、結(jié)束語
大數(shù)據(jù)時代經(jīng)管類專業(yè)統(tǒng)計學課程體系構(gòu)建,應(yīng)注重強化基礎(chǔ)理論,突出知識的實用性和創(chuàng)新性,做到統(tǒng)計知識與實例分析相結(jié)合,與軟件應(yīng)用相結(jié)合,理論教學與實踐教學相結(jié)合,與實際應(yīng)用相結(jié)合。根據(jù)經(jīng)管類各專業(yè)特色,以“知識+能力+應(yīng)用”模式進行模塊化、層次化課程體系設(shè)置,從本質(zhì)上提升學生的數(shù)據(jù)素養(yǎng)和信息素養(yǎng),提高解決實際問題的定量分析能力,以適應(yīng)大數(shù)據(jù)時代對人才素質(zhì)的新需求,使具有數(shù)據(jù)管理和數(shù)據(jù)分析能力的經(jīng)濟管理人才在就業(yè)市場上更具有競爭力。
參考文獻:
[1]孫根年.課程體系優(yōu)化的系統(tǒng)觀及系統(tǒng)方法[J].高等教育研究,2001,(2).
[2]曾五一,肖紅中、龐皓,朱建平.經(jīng)濟管理類統(tǒng)計學專業(yè)教學體系的改革與創(chuàng)新[J].統(tǒng)計研究,2012,(2).
[3]姚壽福.經(jīng)濟管理類本科專業(yè)統(tǒng)計學課程教學改革思考[J].高等教育研究(成都),2012,(3).
[4]朱懷慶.大數(shù)據(jù)時代對本科經(jīng)管類統(tǒng)計學教學的影響及對策[J].高等教育研究(成都),2014,(3).