數(shù)據(jù)素養(yǎng)是伴隨著近年來迅猛發(fā)展的數(shù)據(jù)技術(shù)和人工智能技術(shù)而產(chǎn)生的提法,是此前的信息素養(yǎng)、數(shù)字素養(yǎng)的升級版,因應(yīng)著信息技術(shù)、數(shù)字技術(shù)到數(shù)據(jù)技術(shù)快速迭代、優(yōu)化發(fā)展的進(jìn)程。數(shù)字人文是人文學(xué)科與數(shù)據(jù)技術(shù)交叉產(chǎn)生數(shù)字人文資源,形成新人文知識組織模式、方法論和認(rèn)識論范式的交叉領(lǐng)域。加快我國數(shù)字人文發(fā)展,就必須重視數(shù)據(jù)素養(yǎng)教育——理解、掌握和應(yīng)用數(shù)字技術(shù)及其在人文學(xué)科中的應(yīng)用。數(shù)字人文發(fā)展與數(shù)據(jù)素養(yǎng)兩者是相輔相成的。縱觀我國人文學(xué)科高等教育領(lǐng)域數(shù)據(jù)素養(yǎng)教育的具體實(shí)施,與社會科學(xué)和理工科不同,數(shù)字人文不僅是“新文科”的重要組成部分,也是人文學(xué)科數(shù)據(jù)素養(yǎng)教育的實(shí)施路徑。這反映了兩個重要的事實(shí):一是人文學(xué)科與其他學(xué)科數(shù)據(jù)素養(yǎng)教育實(shí)施路徑上的分化和差異;二是隨著過去20年人文資源向數(shù)據(jù)化技術(shù)的升級,人文學(xué)科同樣面臨著從傳統(tǒng)的文獻(xiàn)資源密集型向數(shù)據(jù)密集型轉(zhuǎn)換,人文學(xué)研究從傳統(tǒng)的文本驅(qū)動向數(shù)據(jù)驅(qū)動轉(zhuǎn)變。因此,加強(qiáng)人文學(xué)科數(shù)據(jù)素養(yǎng)教育變得非常重要。
多樣化開展人文學(xué)科數(shù)據(jù)素養(yǎng)教育
國內(nèi)一些研究型大學(xué)開辟了多層次人文學(xué)科學(xué)生數(shù)字素養(yǎng)教育的實(shí)施路徑。其一,開設(shè)專門課程教學(xué),如南京大學(xué)歷史學(xué)院的“數(shù)字工具與世界史研究”課程,北京大學(xué)信息管理系的“數(shù)字人文”課程,中國人民大學(xué)信息資源管理學(xué)院的“數(shù)字人文榮譽(yù)研究輔修學(xué)位”等。清華大學(xué)圖書館常年開設(shè)多門信息素養(yǎng)課程,包括“圖書館概論”、“文獻(xiàn)檢索與利用”、“信息素養(yǎng)——學(xué)術(shù)研究的必備能力”等。作為先行的實(shí)踐者,它們在課程定位、培養(yǎng)目標(biāo)、課程內(nèi)容、教學(xué)和考核方式等方面的設(shè)計具有較大的參考價值。其二,以大學(xué)圖書館為主導(dǎo)舉辦針對數(shù)據(jù)素養(yǎng)的“學(xué)術(shù)訓(xùn)練營”,如復(fù)旦大學(xué)圖書館等聯(lián)合舉辦的包括學(xué)術(shù)訓(xùn)練營、競賽環(huán)節(jié)和成果孵化三個階段的“慧源共享”上海高校開放數(shù)據(jù)創(chuàng)新研究大賽,上海外國語大學(xué)圖書館舉辦的“大數(shù)據(jù)視域下人文學(xué)科的數(shù)字人文研究”與“Python程序設(shè)計基礎(chǔ)”等。其三,隨著數(shù)字資源和數(shù)據(jù)庫資源成為圖書館服務(wù)的重要部分,圖書館為大學(xué)生和研究生開設(shè)文獻(xiàn)和數(shù)據(jù)庫應(yīng)用培訓(xùn),圖書館主導(dǎo)的數(shù)字人文、大數(shù)據(jù)和人工智能相關(guān)講座,也成為大學(xué)人文學(xué)科推進(jìn)數(shù)字素養(yǎng)教育的“第二課堂”。數(shù)據(jù)素養(yǎng)教育的已有實(shí)踐為數(shù)據(jù)素養(yǎng)教育的進(jìn)一步發(fā)展提供了基本課程體系、教學(xué)教法和具體實(shí)施路徑的參考。其中有兩個值得關(guān)注的現(xiàn)象:一是圖書館已經(jīng)成為提升大學(xué)生數(shù)據(jù)素養(yǎng)的主陣地,是計算機(jī)與數(shù)字、數(shù)據(jù)技術(shù)與數(shù)字人文的融合點(diǎn);二是國內(nèi)人文學(xué)科數(shù)據(jù)素養(yǎng)教育有待深化,分層次開設(shè)體系性課程,課程內(nèi)容進(jìn)一步偏重有深度的數(shù)據(jù)技術(shù)和編程實(shí)操訓(xùn)練。
數(shù)據(jù)素養(yǎng)與發(fā)展數(shù)字人文面臨瓶頸
目前學(xué)界認(rèn)為,數(shù)據(jù)素養(yǎng)由三個部分構(gòu)成,即基礎(chǔ)能力,包括數(shù)據(jù)認(rèn)知、數(shù)據(jù)工具、數(shù)據(jù)文化、數(shù)據(jù)倫理;核心能力,包括數(shù)據(jù)發(fā)現(xiàn)和收集、數(shù)據(jù)質(zhì)量評估、數(shù)據(jù)分析、數(shù)據(jù)可視化呈現(xiàn);高級能力,包括元數(shù)據(jù)創(chuàng)建和使用、數(shù)據(jù)共享和重用、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)保存。2022年教育部發(fā)布的《教師數(shù)字素養(yǎng)》提出,教師數(shù)字素養(yǎng)框架包括數(shù)字化意識、數(shù)字技術(shù)知識和技能、數(shù)字化應(yīng)用、數(shù)字社會責(zé)任和專業(yè)發(fā)展五個方面,學(xué)界關(guān)于數(shù)據(jù)素養(yǎng)的觀點(diǎn)與教師數(shù)字素養(yǎng)標(biāo)準(zhǔn)有很高的匹配度。
數(shù)字人文從業(yè)者要不要學(xué)編程?數(shù)字人文學(xué)者的回答是肯定的。這指向了數(shù)字人文開展中數(shù)據(jù)素養(yǎng)面臨的技術(shù)瓶頸。但已有數(shù)字人文領(lǐng)域的學(xué)者認(rèn)為,數(shù)字人文本身必須提出自身的人文問題并作出有效回答,要突破其人文性欠佳的瓶頸。那么,什么是好的數(shù)字人文?如果說基于文本驅(qū)動的人文學(xué)科的人文性,體現(xiàn)在資源意識、問題意識、方法意識和意義闡釋四個層面結(jié)合的范式中,那么數(shù)字人文則是在數(shù)據(jù)驅(qū)動下,在重建資源意識、問題意識、方法意識和意義闡釋等方面進(jìn)一步擴(kuò)展,促進(jìn)數(shù)據(jù)技術(shù)與人文性的深度融合。在數(shù)據(jù)架構(gòu)編程腳本和數(shù)字人文研究者的搜索腳本中,一半是腳本程序,一半是文化、文學(xué)、歷史概念,兩者的結(jié)合構(gòu)成了新的知識組織、知識生產(chǎn)和認(rèn)識論。
“好的數(shù)字人文”要求更高的數(shù)據(jù)素養(yǎng)
“好的數(shù)字人文”具備以下幾個方面的特點(diǎn):其一,在資源意識方面,數(shù)據(jù)技術(shù)在數(shù)據(jù)庫建設(shè)中對人文學(xué)科資源進(jìn)行數(shù)據(jù)化轉(zhuǎn)換,把海量的跨界、跨語種、超文本的人文資源關(guān)聯(lián)在一起,資源意識突破了以文本及其闡釋為核心的范圍,形成了以“歷史流傳物+檔案+語料庫”所構(gòu)成的數(shù)據(jù)資源。數(shù)據(jù)替換了文本,擴(kuò)展和加深了“博學(xué)”概念的內(nèi)涵。其二,在問題意識方面,數(shù)據(jù)技術(shù)驅(qū)動下的數(shù)字人文給人文學(xué)科開辟了新的提問方式,更適合開展“大人文”、“長時段”和預(yù)測決策等方面的問題研究,在揭示深層規(guī)律方面更具優(yōu)勢。如基于中國歷史地理信息系統(tǒng),文學(xué)地理學(xué)和歷史地理學(xué)研究得到擴(kuò)展,這是常規(guī)文學(xué)社會學(xué)所意想不到的方法論和領(lǐng)域擴(kuò)展。再如,國外學(xué)者對1785—1900年海量小說語料庫中的謙遜、尊重、德性抽象價值的“語義場”進(jìn)行研究,發(fā)現(xiàn)了它們發(fā)生衰變的歷程。這展示了數(shù)字人文為超越個體文本閱讀的局限而提出更具想象力的問題開辟了可能性。其三,數(shù)字人文形成了基于數(shù)據(jù)驅(qū)動的研究方法,一是人文計算、知識圖譜、可視化映射、數(shù)據(jù)挖掘、超文本檢索、語義生成等具有推論性的實(shí)證方法論,大大擴(kuò)展了語文學(xué)或考據(jù)學(xué)提供實(shí)證方法的范圍。二是數(shù)據(jù)驅(qū)動的數(shù)字人文形成了國際上被普遍認(rèn)可的閱讀和觀看方式,如“遠(yuǎn)讀”和“計算機(jī)視覺”。意大利弗朗哥·莫雷蒂從歷史學(xué)研究中獲得靈感,提出了基于數(shù)據(jù)技術(shù)研究的“遠(yuǎn)讀”法。如果說傳統(tǒng)人文研究是“個體研究者+文本閱讀+意義闡釋”模式的話,那么基于數(shù)據(jù)驅(qū)動的“遠(yuǎn)讀”法,就是“數(shù)據(jù)資源+語義搜索腳本+數(shù)據(jù)搜索+結(jié)果映射”模式,即人機(jī)互動的閱讀。強(qiáng)大的搜索引擎對巨量的跨界、跨領(lǐng)域、跨文化數(shù)據(jù)或信息搜索和挖掘所具有的宏闊視野,超越了個體閱讀的局限,并重新定義了閱讀概念。這種“遠(yuǎn)讀”法為世界史、世界文學(xué)研究帶來了廣闊的前景?!坝嬎銠C(jī)視覺”或“數(shù)據(jù)技術(shù)視覺”利用光學(xué)識別技術(shù)、計算機(jī)圖形學(xué)等對文化器物(歷史遺跡、考古材料和藝術(shù)圖像)進(jìn)行數(shù)據(jù)呈現(xiàn)、數(shù)據(jù)測量和分析,給歷史和藝術(shù)研究帶來一種超越肉眼的視覺和數(shù)據(jù)技術(shù)聽覺。就像望遠(yuǎn)鏡和顯微鏡延伸了人的視覺一樣,計算機(jī)視覺、音樂信息檢索和地理空間計算中使用的模擬文化器物的數(shù)據(jù)呈現(xiàn)方法,為我們理解這些器物提供了更好的語言。數(shù)據(jù)圖像在呈現(xiàn)藝術(shù)圖像時不僅達(dá)到了比原作更清晰的程度,而且提供了超越肉眼進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)測量的功能。目前,已有不少研究人員利用數(shù)據(jù)技術(shù)的圖像處理、計算機(jī)視覺和計算機(jī)圖形學(xué)方法,針對藝術(shù)史和考古學(xué)進(jìn)行了新的研究,如對藝術(shù)圖像的各種特征(如筆畫、燈光和構(gòu)圖)進(jìn)行數(shù)學(xué)描述,對考古學(xué)器物進(jìn)行跨文化圖形學(xué)比對等,正在改變考古、圖像學(xué)和藝術(shù)史研究的范式。其四,從意義闡釋來說,在編寫“搜索腳本”時對數(shù)據(jù)庫的選擇、問題設(shè)定、分析設(shè)定和數(shù)據(jù)驗(yàn)證等環(huán)節(jié),研究者的主體性和意義闡釋從不缺席,其中蘊(yùn)含著數(shù)字人文維度展開的“闡釋學(xué)循環(huán)和對話”,即把基于數(shù)據(jù)驅(qū)動的實(shí)證的再現(xiàn)實(shí)踐與人文性闡釋融合起來。數(shù)字人文應(yīng)該把基于數(shù)據(jù)技術(shù)的知識組織和擴(kuò)展出的認(rèn)識論納入“擴(kuò)大的認(rèn)識論”范圍,以便揭示算法技術(shù)與人文知識結(jié)合中顯露的知識本體,并提供基于認(rèn)識論的人文批判,這也正是媒介技術(shù)哲學(xué)和信息哲學(xué)所展開的工作。
從上述“好的數(shù)字人文”所展現(xiàn)的四個方面來看,數(shù)字人文從業(yè)者和“預(yù)備役”學(xué)生數(shù)據(jù)素養(yǎng)的核心能力中,應(yīng)該納入對數(shù)據(jù)技術(shù)在知識組織和方法論及其認(rèn)識論層面的自覺意識、數(shù)據(jù)技術(shù)驅(qū)動下數(shù)字人文的提問方式,知識論目標(biāo)的自覺、算法技術(shù)或編程的熟知與人文批判相結(jié)合的自覺。只有這樣,才能真正推動數(shù)字人文的高質(zhì)量發(fā)展。
(作者系中國人民大學(xué)圖書館文科服務(wù)組組長、北京地區(qū)高校圖書館工作委員會秘書處副秘書長兼辦公室主任)
《中國教育報》2024年06月20日第6版
工信部備案號:京ICP備05071141號
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120170024
中國教育報刊社主辦 中國教育新聞網(wǎng)版權(quán)所有,未經(jīng)書面授權(quán)禁止下載使用
Copyright@2000-2022 www.pdsfzw.cn All Rights Reserved.