一、研究進(jìn)展情況
主要內(nèi)容:
一、研究計(jì)劃總體執(zhí)行情況及各子課題進(jìn)展情況
1 研究計(jì)劃總體執(zhí)行情況
第一階段(2017年11月立項(xiàng)—2018年10月):繼續(xù)完善研究的總體設(shè)計(jì)與各子課題的具體設(shè)計(jì);進(jìn)行與文本可讀性研究相關(guān)的中英文文獻(xiàn)收集和整理;開始采集中小學(xué)語文教材課文語料、課外讀物語料;為項(xiàng)目開題做準(zhǔn)備。
第二階段(2018年11月開題—2019年7月中檢):1)舉行項(xiàng)目開題咨詢會。課題組在第一個(gè)階段研究工作的基礎(chǔ)上,于2018年11月5日召開項(xiàng)目開題咨詢會,楊玉芳、儲澤祥、張赪、崔永華、宋柔等五位專家以及張旺喜副校長、科研處張健處長出席會議。首席專家、五位子課題負(fù)責(zé)人以及課題組主要成員、碩博研究生共六十余人參加了會議。2)課題組在已有研究計(jì)劃的基礎(chǔ)上,積極吸收開題咨詢會專家的意見和建議,對研究設(shè)計(jì)進(jìn)行了微調(diào),繼續(xù)推進(jìn)各項(xiàng)研究工作,并取得了初步的研究成果。
目前課題總體上已經(jīng)完成的研究工作包括以下幾個(gè)方面:
(1)系統(tǒng)收集和整理了相關(guān)的中英文文獻(xiàn)資料。
課題組通過多種途徑和方法,完成了有關(guān)文本可讀性研究的國內(nèi)外文獻(xiàn)(主要為中英文文獻(xiàn))資料的收集和整理工作,包括中英文期刊論文、會議論文、碩博論文等5000余篇,圖書(包括電子書)1000余冊,為進(jìn)一步的研究積累了豐富的文獻(xiàn)資料。
(2)自建了6個(gè)漢語文本語料庫。
大規(guī)模文本語料庫的建設(shè)是本課題研究的基礎(chǔ)。從立項(xiàng)至今(共20個(gè)月),課題組花費(fèi)了大量的人力、物力和財(cái)力,自建了課題研究急需的6個(gè)漢語文本語料庫,語料規(guī)模達(dá)1280萬字。其中,漢語母語文本語料庫3個(gè):分別為《中小學(xué)語文教材文本語料庫》(224萬字)、《中小學(xué)課外讀物文本語料庫》(871萬字)和《漢語句子難度標(biāo)注語料庫》(61萬字);漢語二語文本語料庫3個(gè):分別為《對外漢語教材文本語料庫》(85萬字)、《對外漢語課外讀物文本語料庫》(27萬字)和《新HSK閱讀文本語料庫》(12萬字)。
這6個(gè)語料庫的具體信息如下:
《中小學(xué)語文教材文本語料庫》:共105冊,3,773篇,2,561,439字。涵蓋現(xiàn)行主流的語文教材版本,三個(gè)出版社(北師大版、人教版和蘇教版)、兩個(gè)系列(義務(wù)教育課程標(biāo)準(zhǔn)、實(shí)驗(yàn)教科書)。
《中小學(xué)課外讀物文本語料庫》:共212冊,7,895,617字。包括人民教育出版社出版的《語文素養(yǎng)讀本(叢書)》(北京大學(xué)語文教育研究所,2015)中的讀物以及楊紅櫻、鄭淵潔、曹云軒等著名兒童作家的作品。
《句子難度標(biāo)注語料庫》:18,411句,615,314字。句子來源于中小學(xué)語文教材文本語料庫,剔除使用特殊語言的和不完整的文本,如文言文、詩歌、詩詞、劇本、識字文本等。對句子進(jìn)行去重后,1392篇課文共產(chǎn)生51,298個(gè)句子,句子的平均長度為24.6字。使用成對比較的標(biāo)注任務(wù),通過眾包標(biāo)注確定大規(guī)模句子的難度級別。每個(gè)句子被標(biāo)注為1到5共5個(gè)難度級別,級別1表示很簡單,級別5表示很難。
《對外漢語教材文本語料庫》:1690篇,856,416字,562,457個(gè)詞,73,959個(gè)句子。涵蓋最近10年(2008年—2018年)出版或修訂的主流代表性漢語精讀教材9套,共計(jì)68冊。包括北京語言大學(xué)出版社出版的《成功之路》《發(fā)展?jié)h語》《爾雅中文》《HSK標(biāo)準(zhǔn)教程》《漢語教程》《新實(shí)用漢語課本》(6套),北京大學(xué)出版社出版的《博雅漢語》(1套)、華語教學(xué)出版社出版的《當(dāng)代中文》(1套)、美國波士頓劍橋出版社出版的《中文聽說讀寫》(1套)。
《對外漢語課外讀物文本語料庫》:493篇,270,153字。所選讀物包括《中文天天讀》(外語教學(xué)與研究出版社)、《漢語閱讀速成》(北京語言大學(xué)出版社)、《階梯漢語(中級閱讀)》(華語教學(xué)出版社)、《實(shí)用漢語分級閱讀叢書》(北京語言大學(xué))等8套課外讀物中的16冊。
《新HSK閱讀文本語料庫》:500篇,12萬字。包括2010年到2018年59套新HSK考試真題的閱讀測試文本(部分年份有缺失),其中5級18套、6級31套。
上述語料庫的建設(shè),為課題開展下一步的研究奠定了基礎(chǔ)。
(3)各子課題根據(jù)研究任務(wù)開展實(shí)證研究,目前已經(jīng)初步實(shí)現(xiàn)對母語者文本可讀性的量化測評。
各個(gè)子課題分別開展語料分析、實(shí)驗(yàn)研究、調(diào)研、預(yù)測試、計(jì)算建模等實(shí)證研究工作。包括面向可讀性研究的文本語言特征定性分析、漢語文本閱讀理解機(jī)制及其影響因素的心理語言學(xué)實(shí)驗(yàn)、漢語閱讀能力測驗(yàn)的設(shè)計(jì)和預(yù)測試、可讀性自動(dòng)化分析的指標(biāo)體系設(shè)計(jì)和漢語文本可讀性計(jì)算模型的初步建立等。目前已經(jīng)通過多元回歸方程建立了的漢語文本可讀性公式,并建立了基于字、詞、句和語篇四個(gè)層面特征的可讀性預(yù)測模型,已經(jīng)初步實(shí)現(xiàn)對母語者文本可讀性的量化測評。
(4)取得了豐富的階段性研究成果。
課題組出版了專著1部,英文編著1部(由國際知名出版社Routledge出版);共完成論文36篇,其中在國際國內(nèi)權(quán)威期刊上發(fā)表了17篇論文(含錄用3篇),已給期刊投稿4篇,在國際國內(nèi)會議上發(fā)表論文15篇;自建了6個(gè)漢語文本語料庫(共計(jì)1280萬字)。
此外,指導(dǎo)課題組的研究生完成與課題相關(guān)的碩士、博士論文10余篇。
2 各子課題進(jìn)展情況
(1)子課題一:面向可讀性測評的漢語文本語言特征分析
該子課題從語言學(xué)的角度,在漢字、詞語、句子、語篇等層面對不同難度的漢語文本語言特征進(jìn)行描寫分析,全面考察影響文本可讀性的語言因素,分析不同語言因素對文本可讀性的影響力強(qiáng)弱,為漢語文本可讀性測評奠定語言學(xué)基礎(chǔ)。
目前該子課題已完成以下幾項(xiàng)工作:1)完成了低、中、高三級文本庫的建設(shè)工作,并在子課題組內(nèi)部實(shí)現(xiàn)了語料共享。2)對不同難度等級的漢語文本在漢字、詞匯、語法、語篇等特征上的研究方案進(jìn)行了總體設(shè)計(jì)和組內(nèi)的交流討論。3)課題組成員分頭進(jìn)行面向可讀性測評的漢字特征分析、漢語詞匯特征分析、語法特征分析和語篇特征分析。
目前已完成研究論文5篇,另有2篇文章正在撰寫中,包括:
孟 凱(2019)現(xiàn)代漢語詞法中虛義動(dòng)詞性成分的功能分工與語義作用,《世界漢語教學(xué)》第1期。
田 然(2018)基于語篇的“你好嗎”“你好”對比研究,《國際漢語教學(xué)研究》第4期。
此外,該子課題組成員參加國內(nèi)外會議6場次,舉辦學(xué)術(shù)講座4場次。
(2)子課題二:面向可讀性測評的漢語閱讀認(rèn)知機(jī)制研究
該子課題從心理學(xué)的角度,針對漢語文本閱讀理解的認(rèn)知機(jī)制問題,以漢語母語者和二語學(xué)習(xí)者為實(shí)驗(yàn)研究的對象,完成了一系列反應(yīng)時(shí)實(shí)驗(yàn)、眼動(dòng)跟蹤實(shí)驗(yàn)和腦電實(shí)驗(yàn),從字、詞、句三個(gè)層面探究影響漢語母語者和二語學(xué)習(xí)者閱讀理解難度的文本因素,為漢語文本可讀性測評奠定心理學(xué)的理論基礎(chǔ)。
目前該子課題已完成的工作包括:1)從理論和應(yīng)用兩個(gè)角度切入,具體從可讀性定義及相關(guān)研究、影響可讀性的因素,以及閱讀文本的可讀性測評及閱讀文本的分級等方面收集文獻(xiàn)資料。2)對文獻(xiàn)資料進(jìn)行梳理,將其整理為以下幾個(gè)方面:字、詞、句子、段落、篇章、概念、內(nèi)容及運(yùn)用、可讀性的度量及閱讀材料分級、讀者閱讀能力與閱讀文本的匹配、可讀性應(yīng)用實(shí)例。3)完成有關(guān)的實(shí)驗(yàn)研究4項(xiàng),目前已完成論文4篇,其中,論文Effects of self-enhancement on eye movements during reading已在國際權(quán)威期刊Frontiers in Psychology(SSCI期刊,影響因子2.129)發(fā)表,另有3篇論文已經(jīng)給國際期刊投稿。
(3)子課題三:漢語文本可讀性測評公式和計(jì)算模型研究
該子課題在子課題一、二研究的基礎(chǔ)上,進(jìn)行漢語文本可讀性公式和計(jì)算模型研究。主要包括漢語母語者文本可讀性公式和計(jì)算模型研究、漢語二語文本可讀性公式和計(jì)算模型研究。
目前已經(jīng)完成的工作分為以下兩個(gè)方面:
第一,面向可讀性測評的文本閱讀理解和認(rèn)知加工的心理學(xué)研究。通過一系列實(shí)驗(yàn),從字、詞、句三個(gè)層面,研究了影響漢語母語者和二語學(xué)習(xí)者文本閱讀理解和認(rèn)知加工的因素,為可讀性公式和模型的建立奠定基礎(chǔ)。目前共完成了10項(xiàng)實(shí)驗(yàn),測試漢語母語者和二語學(xué)習(xí)者被試共計(jì)800多人次。
第二,子課題一、五的團(tuán)隊(duì)合作,建立了6個(gè)漢語文本語料庫(具體如前所述),并以此為基礎(chǔ)開展了可讀性公式和模型的建構(gòu)工作。這些工作包括:
1)以《中小學(xué)語文教材文本語料庫》為基礎(chǔ),利用機(jī)器學(xué)習(xí)初步建構(gòu)了漢語母語者文本可讀性自動(dòng)化分析模型。
2)以《中小學(xué)課外讀物文本語料庫》和文本難度的人工評定為基礎(chǔ),并且通過人工評定獲取讀物中常見的3000多個(gè)詞的語義指標(biāo)(具體性、透明度),利用多元回歸模型建構(gòu)了一個(gè)中小學(xué)生課外讀物的可讀性公式。通過這一文本可讀性公式,目前可以初步實(shí)現(xiàn)對母語者文本可讀性的量化測評。
3)在《對外漢語教材文本語料庫》的基礎(chǔ)上,完成了其中1690多篇文本難度的人工評定(6個(gè)等級,與《歐洲語言共同參考框架》對應(yīng)),并對人工評定的效度和信度進(jìn)行多維度檢驗(yàn)。
4)開始嘗試建立針對漢語二語學(xué)習(xí)者的可讀性特征體系,并對一些特殊特征或指標(biāo)進(jìn)行量化和提取,為下一步建立漢語二語學(xué)習(xí)者的文本可讀性公式和計(jì)算模型奠定基礎(chǔ)。
子課題團(tuán)隊(duì)目前已經(jīng)完成了有關(guān)論文11篇,其中已在核心期刊發(fā)表論文5篇(含錄用1篇),在國際國內(nèi)學(xué)術(shù)會議發(fā)表論文6篇。
目前部分實(shí)驗(yàn)研究工作集中在探究能夠預(yù)測不同水平漢語學(xué)習(xí)者閱讀加工的認(rèn)知變量上,已經(jīng)收集了部分?jǐn)?shù)據(jù),基于這些數(shù)據(jù)的兩篇文章正在投稿中。
(4)子課題四:漢語閱讀能力測評研究
該子課題研究漢語閱讀能力測評方法,包括漢語母語者閱讀能力測試和漢語二語者閱讀能力測試,目的是將讀者/學(xué)習(xí)者的閱讀能力和讀物的難度等級進(jìn)行匹配。
目前該子課題已經(jīng)取得了以下幾個(gè)方面的進(jìn)展:1)完成了文獻(xiàn)搜集和整理工作。2)對漢語閱讀能力的測評體系進(jìn)行了充分的調(diào)研和論證。3)編制了針對本科來華留學(xué)預(yù)科生(漢語二語學(xué)習(xí)者)的漢語閱讀能力測驗(yàn),并對國內(nèi)10所高等院校的2650名本科來華留學(xué)預(yù)科生的漢語閱讀能力進(jìn)行了預(yù)測試,對測試數(shù)據(jù)進(jìn)行了初步分析。4)在系統(tǒng)考察現(xiàn)有的英語閱讀能力測驗(yàn)和漢語閱讀能力測驗(yàn)的基礎(chǔ)上,以英語Lexile閱讀能力測試為藍(lán)本,正在編制針對中小學(xué)生(漢語母語者)的漢語閱讀能力測驗(yàn)。
目前已經(jīng)出版《第二語言閱讀測試問題研究》專著1部(33萬字)。
(5)子課題五:基于文本可讀性和閱讀能力測評的分級閱讀網(wǎng)絡(luò)平臺建設(shè)
該子課題有兩個(gè)任務(wù):一是與子課題三的團(tuán)隊(duì)合作,研究和建立漢語可讀性自動(dòng)化分析系統(tǒng);二是在子課題三、子課題四研究成果的基礎(chǔ)上,實(shí)現(xiàn)文本可讀性算法和閱讀能力測試算法的集成,以及有關(guān)數(shù)據(jù)、服務(wù)的整合,研制面向公眾開放的服務(wù)平臺。
目前該子課題已經(jīng)完成的工作包括:1)文獻(xiàn)收集:整理了可讀性相關(guān)的文獻(xiàn)近400篇。2)文獻(xiàn)綜述:課題組對近年來文本可讀性的自動(dòng)分析工作進(jìn)行了綜述,并從特征選擇方式和應(yīng)用領(lǐng)域兩個(gè)角度分析了漢語可讀性研究的現(xiàn)狀,并將綜述撰寫成文,發(fā)表在《中文信息學(xué)報(bào)》上。3)數(shù)據(jù)庫建設(shè):建立了《中小學(xué)語文教材文本語料庫》和《漢語句子難度標(biāo)注語料庫》兩個(gè)數(shù)據(jù)庫(參見“研究計(jì)劃總體執(zhí)行情況)。4)構(gòu)建了表征漢語文本可讀性的特征集合,基于機(jī)器學(xué)習(xí)模型驗(yàn)證了特征集合的效度。5)面向篇章級和句子級的漢語文本,構(gòu)建了基于特征工程的自動(dòng)評價(jià)模型。
目前已經(jīng)完成的成果:1)完成論文4篇,其中正式發(fā)表1篇,投稿1篇,在會議上發(fā)表論文2篇。2)建立《中小學(xué)語文教材文本語料庫》1個(gè),《對外漢語教材文本語料庫》1個(gè);3)建立《漢語句子難度標(biāo)注語料庫》1個(gè)。
二、調(diào)查研究及學(xué)術(shù)交流情況
1 調(diào)查研究
(1)文獻(xiàn)資料的收集整理。課題組總共收集和整理了可讀性和閱讀能力測驗(yàn)方面的中英文期刊論文、會議論文和碩博論文5000余篇,中英文圖書(含電子書)近1000余冊。
(2)漢語文本語料的收集和語料庫建設(shè)。建設(shè)了6個(gè)語料庫,共計(jì)1280萬字,包括:《中小學(xué)語文教材文本語料庫》《中小學(xué)課外讀物文本語料庫》《漢語句子難度標(biāo)注語料庫》《對外漢語教材文本語料庫》《對外漢語課外讀物文本語料庫》《新HSK閱讀文本語料庫》。
(3)文本閱讀理解實(shí)驗(yàn)數(shù)據(jù)的收集。完成了針對漢語母語兒童、成人和漢語二語學(xué)習(xí)者的14項(xiàng)實(shí)驗(yàn)研究,參加實(shí)驗(yàn)的被試近1300名。
(4)閱讀能力測試的預(yù)測數(shù)據(jù)收集。對國內(nèi)10所高等院校的2650名本科來華留學(xué)預(yù)科生的漢語閱讀能力進(jìn)行了預(yù)測試。
(5)文本難度人工評定數(shù)據(jù)的收集。完成了1690多篇漢語二語教材文本的難度評定,每篇文本有10名評定者;完成了120多篇中小學(xué)課外讀物的難度評定,每篇文本有3名評定者。
(6)句子難度人工評定數(shù)據(jù)的收集。使用成對比較的標(biāo)注任務(wù),通過眾包標(biāo)注確定大規(guī)模句子的難度級別。
(上述具體內(nèi)容參見“研究進(jìn)展”)
2 學(xué)術(shù)交流情況(學(xué)術(shù)會議、學(xué)術(shù)交流、國際合作等)
(1)學(xué)術(shù)會議和學(xué)術(shù)交流
立項(xiàng)以來,首席專家、各個(gè)子課題負(fù)責(zé)人、課題組成員和研究生圍繞課題研究工作,參加了主題豐富、形式多樣的學(xué)術(shù)會議和學(xué)術(shù)交流活動(dòng),具體如下:
首席專家參加的學(xué)術(shù)會議和學(xué)術(shù)交流:
1)2017年11月22日,江新教授應(yīng)邀在中央民族大學(xué)國際教育學(xué)院舉辦了題為“漢語第二語言學(xué)習(xí)者語塊加工研究”的學(xué)術(shù)講座。
2)2017年11月23日,江新教授應(yīng)邀出席國家開放大學(xué)《第二語言習(xí)得》課程教學(xué)大綱審定會。
3)2017年12月7日,江新教授應(yīng)邀在首都師范大學(xué)國際文化學(xué)院舉辦了題為“漢語語塊認(rèn)知加工研究”的學(xué)術(shù)講座。
4)2017年12月9日至10日,江新教授應(yīng)邀赴西北師范大學(xué)做系列學(xué)術(shù)報(bào)告,報(bào)告的題目分別為“漢語第二語言認(rèn)知加工的研究方法” “漢語語塊認(rèn)知加工研究”。
5)2017年12月2日,江新教授應(yīng)邀出席北京大學(xué)對外漢語教育學(xué)院舉辦的“黌門對話”專家主題論壇“漢語作為第二語言的認(rèn)知與習(xí)得”,并在論壇上作了題為“漢語第二語言學(xué)習(xí)者閱讀知覺廣度的眼動(dòng)研究”的主題發(fā)言。
6)2018年5月26日至28日,江新教授和碩士生史未卿、張嫚?wèi)?yīng)邀參加了在南京師范大學(xué)舉辦的“第八屆中國國際眼動(dòng)研究研討會”。
7)2018年5月28日至31日,張博教授、江新教授應(yīng)邀參加了在新疆喀什大學(xué)舉辦的“一帶一路”核心區(qū)語言教育與服務(wù)高端論壇,并在會上做了大會報(bào)告。
8)2018年6月7日,江新教授應(yīng)邀到中國人民大學(xué)舉辦了題為“漢語第二語言學(xué)習(xí)者語塊加工和學(xué)習(xí)研究”的講座。這是該!靶睦碚Z言學(xué)系列講座”的第四場報(bào)告。
9)2018年6月22日至24日,江新教授和近10名碩士、博士研究生一起赴天津參加了在天津師范大學(xué)舉辦的“語言發(fā)展評估研討會”。
10)2018年11月3日至4日,江新教授及其課題組研究生應(yīng)邀參加了中國心理學(xué)會舉辦的“第二十一屆全國心理學(xué)學(xué)術(shù)會議”,江新教授組織并主持了“漢語第二語言字詞和閱讀認(rèn)知加工”的專題報(bào)告。
11)2018年11月8日至9日,江新教授應(yīng)邀出席北京大學(xué)和中國國家漢辦/孔子學(xué)院總部聯(lián)合舉辦的“北京大學(xué)首屆世界漢語研討會暨第十三屆國際漢語教學(xué)研討會”,并在北京大學(xué)首屆世界漢語研討會做了題為“漢語教學(xué)的跨學(xué)科研究:現(xiàn)狀與發(fā)展”的特邀發(fā)言。
12)2019年4月13日至14日,江新教授、田然教授以及碩士生袁若琳參加了“首屆新西蘭漢語作為第二語言教學(xué)與研究國際研討會”,并應(yīng)邀在會上做了題為“語素位置信息對漢語二語學(xué)習(xí)者閱讀影響的眼動(dòng)研究”、“二語學(xué)習(xí)者漢語語篇話題鏈習(xí)得研究”、 “漢語兒童和二語學(xué)習(xí)者圖畫書閱讀的眼動(dòng)研究”的學(xué)術(shù)報(bào)告。
13)2019年5月18日至19日,江新教授應(yīng)邀在中山大學(xué)“第一屆語言與語言習(xí)得研究工作坊”作主題報(bào)告,報(bào)告的題目為“漢語二語學(xué)習(xí)者語塊加工優(yōu)勢的眼動(dòng)研究”。工作坊結(jié)束后,江新教授還應(yīng)邀為中文系(珠海)的研究生和本科生作了題為“漢語二語學(xué)習(xí)者名名復(fù)合詞認(rèn)知加工和學(xué)習(xí)研究”的學(xué)術(shù)講座。
14)2019年5月31日至6月1日,江新教授應(yīng)邀在浙江師范大學(xué)國際文化與教育學(xué)院作了題為“漢語二語學(xué)習(xí)者名名復(fù)合詞認(rèn)知加工和學(xué)習(xí)研究”的學(xué)術(shù)講座,并出席了首屆“一帶一路”華僑華人與華文教育研討會。
15)2019年7月5日至7日,江新教授應(yīng)邀赴英國蘭卡斯特大學(xué)參加“第17屆英國漢語教學(xué)國際研討會暨2019年英國漢語教學(xué)研究會”,并在會上做了題為“語塊分行呈現(xiàn)對漢語母語者和二語學(xué)習(xí)者閱讀中語塊加工影響的眼動(dòng)研究”的學(xué)術(shù)報(bào)告。
子課題一的學(xué)術(shù)會議和學(xué)術(shù)交流:
近兩年來,子課題組負(fù)責(zé)人、成員多次參加國內(nèi)外學(xué)術(shù)會議和學(xué)術(shù)交流,例如:
1)2018年5月,田然教授參加美國哥倫比亞大學(xué)漢語教學(xué)會議。
2)2018年6月,田然教授參加悉尼大學(xué)會議,宣讀了本課題論文《基于語篇的“你好嗎”、“你好”對比研究》,并與參會學(xué)者進(jìn)行了討論。
3)2018年6月15日至17日,孟凱副教授應(yīng)邀參加《語言教學(xué)與研究》編輯部和安徽師范大學(xué)文學(xué)院聯(lián)合主辦的“第二屆語言教學(xué)與研究國際學(xué)術(shù)研討會”,并做了題為“現(xiàn)代漢語詞法中虛義動(dòng)詞性成分的功能分工與語義作用”的報(bào)告。
4)2018年11月18日,孟凱副教授應(yīng)邀參加中國人民大學(xué)文學(xué)院主辦的“第五屆北京青年語言學(xué)者(U50)學(xué)術(shù)交流會”。
5)2017年11月3日至5日,張博教授赴美國塔夫茨大學(xué)參加由北京師范大學(xué)、塔夫茨大學(xué)和俄克拉荷馬大學(xué)共同主辦的“第三屆國際漢字漢語文化研討會”,做了題為“提高漢語第二語言詞匯教學(xué)效率的兩個(gè)前提”的報(bào)告。
6)2018年5月10日,張博教授應(yīng)邀在上海外國語大學(xué)國際文化交流學(xué)院作學(xué)術(shù)報(bào)告,題目是“漢語外來詞的界定原則與基于借用等級的判定方法”。
7)2019年4月26日,張博應(yīng)邀到北京大學(xué)對外漢語教育學(xué)院做題為《漢語并合造詞法對詞義結(jié)構(gòu)與詞義發(fā)展的影響》的講座。
子課題一舉辦學(xué)術(shù)交流活動(dòng)4次:
1)2018年9月25日,香港教育大學(xué)中國語言學(xué)系朱慶之教授應(yīng)邀做學(xué)術(shù)講座,講座題目為“佛教文獻(xiàn)與漢語詞匯史研究”。
2)2018年10月24日,北京大學(xué)中文系董秀芳教授應(yīng)邀做學(xué)術(shù)講座,講座題目為“漢語詞法的幾個(gè)突出特征及其歷史根源”。
3)2018年11月8日,中國社會科學(xué)院語言研究所譚景春研究員應(yīng)邀做學(xué)術(shù)講座,講座題目為“動(dòng)詞的目的義和名詞的用途義及其在詞典釋義中的處理”。
4)2019年5月16日,浙江理工大學(xué)王艷助理研究員應(yīng)邀做學(xué)術(shù)講座,講座題目為“漢語OVX結(jié)構(gòu)的語義條件——兼論OVX結(jié)構(gòu)與VOX結(jié)構(gòu)的指稱化路徑”。
子課題二的學(xué)術(shù)會議和學(xué)術(shù)交流:
1)2018年4月26日至28日,李興珊教授應(yīng)邀在澳大利亞悉尼市舉辦的澳大利亞眼動(dòng)大會上作題為“中文閱讀過程中的眼動(dòng)控制”的報(bào)告。
2)2018年5月26日至28日,李興珊教授在江蘇南京舉辦的第8屆中國國際眼動(dòng)大會上做了題為“中文閱讀中的字的位置編碼”的重點(diǎn)報(bào)告。
3)2018年6月25日至30日,李興珊教授應(yīng)邀在加拿大蒙特利爾舉辦的第29屆國際應(yīng)用心理學(xué)大會做了題為“中文閱讀特異性的認(rèn)知機(jī)制”的特邀報(bào)告。
子課題三的學(xué)術(shù)會議和學(xué)術(shù)交流:
1)Jin, L., Ren, Q., & Wang, J. (2019). Multimodal Measures for Writing Curriculum in a University Setting in Southwest China, 2019 Conference of College Composition & Communication, Pittsburgh.
2)Zhang, M., & Jiang, X. (2018). The effects of word segmentation on Chinese Pinyin text reading: Evidence from eye movements, CICEM2018, Psychological college of Nanjing Normal University.
3)Yuan, R. Y., & Jiang, X. (2019). Eye movements on picture book reading with Chinese elementary school students and second language learners of Chinese, Acquisition of Chinese: Bilingualism and Multilingualism, University of Cambridge, United Kingdom.
4)蔡建永、江新(2018)完形填空測驗(yàn)和漢語二語者語言水平的相關(guān)研究,北京語言大學(xué)第12屆科研報(bào)告會,三等獎(jiǎng),北京。
5)蔡建永、江新(2018)完形填空測驗(yàn)在漢語二語者語言水平測評中的作用,第六屆國際漢語應(yīng)用語言學(xué)研討會,美國愛荷華。
6)曹藝凡、江新(2018)字音和字形在漢語二語者雙字詞加工中的作用,第二十一屆全國心理學(xué)學(xué)術(shù)會議,北京。
7)侯楓蕓、江新(2018)部件標(biāo)識和筆順動(dòng)畫對二語學(xué)習(xí)者漢字學(xué)習(xí)的影響——來自反應(yīng)時(shí)和ERP的證據(jù),第三屆《當(dāng)代外語研究》二語加工國際學(xué)術(shù)研討會,哈爾濱。
8)侯楓蕓、江新(2018)部件標(biāo)識和筆順動(dòng)畫對漢語二語者漢字學(xué)習(xí)的影響,第二十一屆全國心理學(xué)學(xué)術(shù)會議,北京。
9)史未卿、江新(2018)使用篇章閱讀中的眼動(dòng)指標(biāo)區(qū)分讀者的閱讀理解水平:來自漢語母語者和二語者的證據(jù),第八屆中國國際眼動(dòng)研討會,南京。
10)史未卿、江新(2018)預(yù)測漢語二語者閱讀理解水平的眼動(dòng)指標(biāo)體系的研究,第二十一屆全國心理學(xué)學(xué)術(shù)會議,北京。
11)史未卿、江新(2018)預(yù)測漢語學(xué)習(xí)者閱讀水平的眼動(dòng)指標(biāo)體系的研究,第六屆國際漢語應(yīng)用語言學(xué)研討會,美國愛荷華。
12)邢濱鈺(2018)漢字位置信息對閱讀影響的眼動(dòng)研究,2018對外漢語博士生論壇暨第十一屆對外漢語教學(xué)研究生學(xué)術(shù)論壇,一等獎(jiǎng),北京大學(xué)。
13)邢濱鈺、江新(2018)語素位置信息對漢語母語者和二語學(xué)習(xí)者閱讀影響的眼動(dòng)研究,第三屆《當(dāng)代外語研究》二語加工國際研討會,哈爾濱。
14)邢濱鈺、江新(2018)語素位置信息對漢語母語者閱讀影響的眼動(dòng)研究,第二十一屆全國心理學(xué)學(xué)術(shù)會議,北京。
15)邢濱鈺、江新(2019)語素位置顛倒對漢語二語學(xué)習(xí)者閱讀影響的眼動(dòng)研究,The First Symposium on Chinese as Second Language Teaching and Research in New Zealand: Inheritance and Innovation, University of Auckland.
16)徐晶晶、江新(2018)漢語二語者注音文本閱讀的眼動(dòng)模式研究,《世界漢語教學(xué)》青年學(xué)者論壇(第6屆),北京。
17)徐晶晶、江新(2018)文本類型對漢語二語者眼跳目標(biāo)選擇的影響,第二十一屆全國心理學(xué)學(xué)術(shù)會議,北京。
18)徐晶晶、江新(2018)文本類型對漢語母語者和二語者眼跳目標(biāo)選擇的影響,語言教學(xué)與研究國際學(xué)術(shù)研討會(2018),安徽。
19)徐晶晶、江新(2019)漢字和拼音文本閱讀效率的眼動(dòng)研究,雙語與多語語境下的漢語習(xí)得研討會,英國劍橋大學(xué)丘吉爾學(xué)院。
20)徐晶晶、江新(2019)文字呈現(xiàn)形式對漢語母語者和二語者閱讀效率的影響,第十七屆英國漢語教學(xué)研究會年會,英國蘭卡斯特大學(xué)孔子學(xué)院。
21)許宏鑒(2018)大會報(bào)告點(diǎn)評,第五屆北京青年學(xué)者(G50)學(xué)術(shù)交流會, 中國人民大學(xué)。
22)許宏鑒(2018)對外漢語進(jìn)修課程學(xué)習(xí)成績和漢語水平考試成績的相關(guān)性研究,首屆漢語進(jìn)修教育研討會,北京語言大學(xué)
23)許宏鑒、江新(2018)漢語第二語言學(xué)習(xí)者語塊使用及其與作文質(zhì)量關(guān)系的研究,北京語言大學(xué)第十二屆科研報(bào)告會,北京語言大學(xué)。
24)袁若琳、江新(2019)漢語兒童和二語學(xué)習(xí)者圖畫書閱讀的眼動(dòng)研究,首屆新西蘭漢語作為第二語言教學(xué)與研究國際研討會,新西蘭奧克蘭大學(xué)。
25)張嫚、江新(2018)分詞呈現(xiàn)對漢語拼音文本閱讀影響的眼動(dòng)研究,2018對外漢語博士生論壇暨第十一屆對外漢語教學(xué)研究生學(xué)術(shù)論壇,北京大學(xué)。
26)2018年10月8日至11日,課題組主要成員蔡建永以及課題組研究生吳思遠(yuǎn)和姜悅赴湖北武漢參加了由華中師范大學(xué)心理學(xué)院主辦的第六屆“網(wǎng)絡(luò)時(shí)代的心理與行為研究前沿”研討會。會議專門開設(shè)主題為“文本分析工具Coh-Metrix的理論基礎(chǔ)及應(yīng)用”的工作坊。Coh-Metrix團(tuán)隊(duì)核心成員——美國孟菲斯大學(xué)蔡志強(qiáng)教授作為工作坊主講人系統(tǒng)介紹了該工具的研發(fā)歷史、理論基礎(chǔ)、指標(biāo)體系以及具體應(yīng)用,而且特別提到了中文Coh-Metrix工具的研發(fā)情況。這些最新的學(xué)術(shù)前沿信息極大地加深了課題組成員對Coh-Metrix的深層理解,對于研發(fā)具有漢語特點(diǎn)的文本可讀性分析工具有重要的借鑒意義。
子課題四的學(xué)術(shù)會議和學(xué)術(shù)交流:
1)課題組召開內(nèi)部研討會6次,每次研討會要求課題組全員參加,并先后邀請課題組以外的漢語閱讀測試專家8人次,高校漢語閱讀教學(xué)專任教師15人次參與課題研究意見征求會議,并將專家調(diào)查問卷數(shù)據(jù)進(jìn)行了錄入、整理和分析。
2)召開2次關(guān)于漢語閱讀能力測評方面的專題學(xué)術(shù)會議,重點(diǎn)探討了漢語閱讀能力測評體系的構(gòu)想、測量對象、測量目標(biāo)、測試內(nèi)容、測試方式以及項(xiàng)目分析和分?jǐn)?shù)體系等問題,對于測評體系的主要問題已經(jīng)達(dá)成了共識。
3)課題組負(fù)責(zé)人和成員先后參加了兩次國際學(xué)術(shù)會議,并提交了與漢語能力測評有關(guān)的論文,同時(shí)還邀請西班牙、英國等語言測試專家開展學(xué)術(shù)講座。
子課題五的學(xué)術(shù)交流:
1)于東、吳思遠(yuǎn)、江新,漢語文本可讀性特征體系構(gòu)建及其效度驗(yàn)證,榮獲2018年北京語言大學(xué)第十二屆科研報(bào)告會二等獎(jiǎng)。
2)吳思遠(yuǎn)、蔡建永、于東、江新,文本可讀性的自動(dòng)分析研究綜述,第十七屆中國計(jì)算語言學(xué)大會(CCL2018)。
3)吳思遠(yuǎn)、耿朝陽、唐玉玲、于東 (已投稿)基于眾包標(biāo)注的語文教材句子難易度評估研究,第十八屆中國計(jì)算語言學(xué)大會(CCL2019)。
(2)國際合作
課題組邀請了美國卡內(nèi)基梅隆大學(xué)Keiko Koda教授、馬里蘭大學(xué)蔣楠教授、賓夕法尼亞州立大學(xué)李平教授等來訪,舉辦學(xué)術(shù)講座,并與課題組研究人員和研究生座談。通過這些活動(dòng),課題組與國際上著名學(xué)者建立密切的學(xué)術(shù)聯(lián)系和交流,并且開始進(jìn)行了初步的國際合作研究。具體國際學(xué)術(shù)交流和合作如下:
1)2017年10月30日至11月1日,第二語言閱讀研究領(lǐng)域的國際著名學(xué)者、美國卡內(nèi)基梅隆大學(xué)Keiko Koda教授應(yīng)邀到北語對外漢語研究中心舉辦三場學(xué)術(shù)講座。講座由江新教授主持,先后參加講座的師生近200人次。Koda教授的三場講座分別以二語測評、二語詞匯以及二語閱讀發(fā)展為主題展開,第一場題為“外語教學(xué)與測評的綜合方法”,第二場題為“提高外語詞匯學(xué)習(xí)能力”,第三場題為“一語對二語閱讀發(fā)展的促進(jìn)作用”。Koda教授的三場講座精彩紛呈。她不但將二語測評、詞匯與閱讀發(fā)展的理論研究與實(shí)踐應(yīng)用緊密結(jié)合,而且將研究問題與研究方法緊密結(jié)合,在每場講座中她都以問題的形式啟發(fā)、引導(dǎo)大家思考和討論,在提問與回答之中將講座推向高潮。每場講座大家都用英語積極參與討論,氣氛熱烈。子課題負(fù)責(zé)人柴省三教授等課題組成員參加了講座,并與Koda教授進(jìn)行了學(xué)術(shù)交流。除三場學(xué)術(shù)講座外,Koda教授還應(yīng)邀出席了兩場座談會,討論與課題研究密切相關(guān)的閱讀研究,并介紹了國際上可讀性研究的著名學(xué)者和日語文本的可讀性研究,為課題組成員和研究生進(jìn)行相關(guān)研究提出了很多建議和幫助,并討論了將來可以開展的合作研究。
2)2017年12月17日至12月22日,第二語言習(xí)得研究專家、美國馬里蘭大學(xué)蔣楠教授應(yīng)張博教授的邀請來北語舉辦為期6天的“第二語言習(xí)得研究方法及期刊論文寫作工作坊”,并做了題為“第二語言加工研究:目的、方法、內(nèi)容”“漢外語義結(jié)構(gòu)對比和對外漢語教學(xué)”兩場學(xué)術(shù)報(bào)告。工作坊的報(bào)告和兩場講座均由江新教授主持。在工作坊中,蔣楠教授從論文選題、宏觀設(shè)計(jì)、微觀設(shè)計(jì)、結(jié)果—結(jié)論—論文等四個(gè)方面進(jìn)行了精彩的講解。蔣楠教授通過深入淺出的解釋、精心挑選的文獻(xiàn)、豐富生動(dòng)的案例,系統(tǒng)清晰地闡述了如何確定研究的問題、閱讀文獻(xiàn)、設(shè)計(jì)實(shí)驗(yàn)、解釋研究結(jié)果和撰寫論文;通過不斷拓展的提問、形式多樣的互動(dòng)、幽默風(fēng)趣的語言,步步深入地引導(dǎo)大家思考研究選題、設(shè)計(jì)和結(jié)果解釋中的問題。在蔣楠教授來訪期間,課題組利用這個(gè)難得的機(jī)會,就課題研究工作的開展與蔣楠教授進(jìn)行了深度的交流和討論。工作坊結(jié)束之后,課題組與蔣楠教授保持了密切的交流,并開始了兩項(xiàng)合作研究,第一項(xiàng)研究的成果已經(jīng)撰寫成文,給國際英文期刊投稿。
3)2018年10月30日至11月1日,國際知名的心理語言學(xué)家、美國賓夕法尼亞州立大學(xué)李平教授應(yīng)邀在北語舉辦系列學(xué)術(shù)講座。李平教授為美國賓夕法尼亞州立大學(xué)心理學(xué)、語言學(xué)、信息科學(xué)與技術(shù)等專業(yè)終身教授,腦、行為、認(rèn)知中心聯(lián)合主任,腦、語言與計(jì)算實(shí)驗(yàn)室主任,計(jì)算科學(xué)研究院副主任,神經(jīng)科學(xué)研究生專業(yè)負(fù)責(zé)人;Journal of Neurolinguistics主編, Frontiers in Psychology: Language Sciences副主編;美國自然科學(xué)基金(NSF)評審專家,美國白宮腦計(jì)劃、美國科學(xué)基金會科研課題首席科學(xué)家。在心理語言學(xué)、語言習(xí)得、計(jì)算機(jī)模型及雙語的認(rèn)知神經(jīng)機(jī)制等領(lǐng)域出版了大量的研究專著及學(xué)術(shù)論文。李平教授兩場講座分別以第二語言學(xué)習(xí)的腦機(jī)制、科技論文閱讀的認(rèn)知加工為主題展開,兩場講座的題目分別為“Understanding the Second Language Learning Brain: Neurocognitive and Computational Approaches”“How Students Understand STEM Concepts: An fMRI study of Conceptual Representation through Expository Text Comprehension”。講座由江新教授主持,子課題負(fù)責(zé)人郝美玲教授等課題組成員與李平教授進(jìn)行了深入的交流。李平教授還與課題組進(jìn)行了兩場座談,就可讀性和閱讀能力研究中的問題提出了自己的意見和進(jìn)一步研究的建議。
4)2018年11月27日愛爾蘭利默里克大學(xué)? Ceallaigh博士應(yīng)邀到北語進(jìn)行學(xué)術(shù)訪問,并做了題為“基于內(nèi)容的語言加工(Processing language through content)”的學(xué)術(shù)講座。T. J. ? Ceallaigh博士在愛爾蘭科克(Cork)大學(xué)教育學(xué)博士,現(xiàn)任教于愛爾蘭利默里克大學(xué)瑪麗伊瑪克特學(xué)院(Mary Immacurate College, University of Limerick)語言與讀寫教育系。這是? Ceallaigh博士級2017年1月訪問北語之后的第二次來訪。這次來訪,達(dá)成了愛爾蘭方資助課題組兩名博士研究生赴愛爾蘭利默里克大學(xué)研修半年的合作意向,兩名博士生即將于2019年9月啟程赴愛爾蘭研修。項(xiàng)目首席專家江新教授、子課題負(fù)責(zé)人郝美玲教授已先后獲愛爾蘭方資助赴愛爾蘭進(jìn)行為期10天的學(xué)術(shù)交流和課題合作研討。
三、成果宣傳推介情況
1 項(xiàng)目開題報(bào)告已通過學(xué)校科研處報(bào)送國家社科基金規(guī)劃辦;
2 課題組通過參加學(xué)術(shù)會議、講座、召開座談會等形式宣傳課題的研究成果;
3 通過網(wǎng)站、微信公眾號等途徑發(fā)布課題的有關(guān)信息。
四、研究中存在的主要問題、改進(jìn)措施,研究心得、意見建議
1 主要問題和改進(jìn)措施
(1)大規(guī)模文本的難度標(biāo)注問題。建立有難度等級標(biāo)簽的大規(guī)模文本訓(xùn)練集(黃金語料庫)需要花費(fèi)大量的人力,而且需要取得評定者的合作,保證評定者在主觀上和客觀上都能夠認(rèn)真完成評定,這有較大難度。課題組通過選擇多名評定者進(jìn)入實(shí)驗(yàn)室,進(jìn)行分階段多次評定的方法,在一定程度上解決了這個(gè)問題。
(2)通過近兩年的研究,子課題四(漢語閱讀能力測試課題組)發(fā)現(xiàn)如下問題:1)針對漢語能力測評體系的測量對象尚缺乏明確的界定。2)聘任兼具漢語閱讀能力測試命題經(jīng)驗(yàn)和專業(yè)素養(yǎng)的教師具有一定的難度。3)測量方式究竟采用紙筆測試方式還是機(jī)考方式,在成本、可行性方面尚未取得重要突破。4)研究人員在具體的測試開發(fā)中,對于漢語文本難度的把握存在一定的主觀性。
針對上述存在的主要問題,課題組經(jīng)過交流、討論和權(quán)衡后準(zhǔn)備采取如下改進(jìn)措施,進(jìn)一步推動(dòng)項(xiàng)目的進(jìn)展速度。一是再設(shè)計(jì)一份問卷,對于漢語作為第二語言閱讀能力測試的對象進(jìn)行需求分析(need analysis),對測量對象進(jìn)行詳細(xì)的分類界定,從而針對不同水平、不同需求的測試對象進(jìn)行測試分級體系設(shè)計(jì);二是加大國內(nèi)外漢語閱讀命題人員的培訓(xùn)力度,招聘更多地漢語閱讀命題人員,滿足項(xiàng)目推進(jìn)的客觀需要;三是對紙筆測試和機(jī)考測試的成本進(jìn)行核算,最終確定測試方式;四是充分與子課題一和子課題二的研究人員進(jìn)行溝通,借鑒子課題一和子課題二的研究成果,對命題人員初選的閱讀文本進(jìn)行量化統(tǒng)計(jì)分析,基于量化指標(biāo)對文本進(jìn)行選擇,然后參考專家的意見制定文本選擇的統(tǒng)一標(biāo)準(zhǔn)。
(3)在可讀性模型建立時(shí),遇到以下幾個(gè)問題:1)在數(shù)據(jù)標(biāo)注方法上,可讀性研究中文本可讀性的確定主要是請有經(jīng)驗(yàn)的專家或教師為文本可讀性打分,但是專家標(biāo)注數(shù)據(jù)代價(jià)高,獲取難度大。2)在數(shù)據(jù)規(guī)模上,本課題組目前構(gòu)建了規(guī)模較大的《漢語句子難度標(biāo)注語料庫》和《中小學(xué)語文教材文本語料庫》,但兩個(gè)語料庫的規(guī)模無法滿足構(gòu)建深度學(xué)習(xí)模型的需要。3)在建模方法上,本課題組使用特征工程方法構(gòu)建了機(jī)器學(xué)習(xí)模型,但基于特征工程的方法學(xué)習(xí)能力有限,無法捕捉到文本語義層信息,且專家知識代價(jià)較高。
針對這些問題,課題組提出以下改進(jìn)措施:1)在數(shù)據(jù)標(biāo)注方法上,使用眾包標(biāo)注的方法收集文本難度的標(biāo)注數(shù)據(jù)。與專家標(biāo)注不同,眾包標(biāo)注面向大規(guī)模的人群,通過眾包模式完成數(shù)據(jù)標(biāo)注工作,適用于大規(guī)模標(biāo)注工作。2)在數(shù)據(jù)規(guī)模上,未來的研究會考慮擴(kuò)大《漢語句子難度標(biāo)注語料庫》的標(biāo)注規(guī)模。在篇章級語料庫上,考慮收集教輔材料中的文本數(shù)據(jù),擴(kuò)大篇章級語料庫的規(guī)模。3)在文本表示方法上,除了基于專家知識的語言特征表征方法,本課題組擬使用眼動(dòng)追蹤技術(shù)的方法,通過記錄讀者在閱讀時(shí)的在線加工表現(xiàn),作為新的文本表征方法。4)在建模方法上,使用深度學(xué)習(xí)模型提高模型的學(xué)習(xí)能力,構(gòu)建性能更好,準(zhǔn)確率更高的模型。
(4)課題組研究時(shí)間和精力的問題。由于個(gè)別子課題負(fù)責(zé)人和成員同時(shí)承擔(dān)了其他課題的研究工作,有時(shí)候時(shí)間和精力不能集中本課題的研究上。有的課題組成員教學(xué)工作量大,或手頭有其他項(xiàng)目,因而投入本項(xiàng)目研究的精力有限。不同子課題的研究進(jìn)展不太一致。今后要進(jìn)一步加強(qiáng)課題組內(nèi)部的交流,建立督促機(jī)制,推進(jìn)課題研究;還應(yīng)加強(qiáng)課題組研究團(tuán)隊(duì)的建設(shè)、加強(qiáng)子課題之間的協(xié)調(diào)溝通與合作;結(jié)合研究生的培養(yǎng)和學(xué)位論文的指導(dǎo),支持和鼓勵(lì)課題組的研究生更積極地參與項(xiàng)目的研究。
(5)研究經(jīng)費(fèi)的缺口問題。通過申請滾動(dòng)資助解決。
2 研究心得、意見建議
(1)隨著研究的深入,課題組越來越深刻地認(rèn)識到,該課題的研究意義重大,甚至超過立項(xiàng)時(shí)的預(yù)想程度。隨著網(wǎng)絡(luò)文本的大量涌現(xiàn),文本分析日益成為熱點(diǎn),文本可讀性分析是文本分析的重要內(nèi)容。而且,本課題的研究是一個(gè)大工程,需要分階段逐步完成研究目標(biāo)。
(2)從可讀性公式的研制,到可讀性自動(dòng)分析工具和模型的建立,自然語言處理技術(shù)的進(jìn)步為可讀性的自動(dòng)分析提供了多種思路和方法。
(3)機(jī)器學(xué)習(xí)模型可以有效預(yù)測漢語句子的難度級別,加入語言特征可以提升模型的預(yù)測準(zhǔn)確率。句子是語言學(xué)習(xí)中常用的語言單位,也是多項(xiàng)自然語言處理任務(wù)的基本處理單元。句子級的可讀性研究受到越來越多的關(guān)注。
(4)漢語閱讀能力測驗(yàn)的研究,不僅具有理論價(jià)值,而且對于高校來華留學(xué)生漢語閱讀能力的教學(xué)與培養(yǎng)具有較高的推動(dòng)作用,同時(shí)間接提高留學(xué)生的培養(yǎng)質(zhì)量,對于回應(yīng)目前國內(nèi)針對來華留學(xué)生招生、培養(yǎng)質(zhì)量的社會質(zhì)疑也具有一定的社會價(jià)值;谠摽紤],我們建議相關(guān)教育職能部門與課題立項(xiàng)的主管部門聯(lián)動(dòng),共同推進(jìn)針對來華留學(xué)生漢語閱讀能力測評體系的研發(fā)、構(gòu)建和推廣力度,科學(xué)、全面地評價(jià)來華留學(xué)生的漢語閱讀能力,維護(hù)我國高等教育的國際形象。
二、研究成果情況
主要內(nèi)容:
一、代表性成果簡介
1 專著:柴省三(2018)《第二語言測試問題研究》,對外經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2018年9月
該著作對漢語作為第二語言測試的效度問題、信度問題、閱讀測試的公平性問題、測評體系的長度問題、測試的信息化問題進(jìn)行了系統(tǒng)的研究。該專著的主要觀點(diǎn)是:語言測試體系的研發(fā)必須充分重視信度和效度問題,要充分考慮到不同考生的文化背景,避免測試文本在內(nèi)容方面涉及到敏感問題(比如宗教、戰(zhàn)爭、領(lǐng)土爭端、性別歧視等);該專著對于漢語作為第二語言閱讀能力測評體系的研發(fā)在測量構(gòu)想(construct)、測量內(nèi)容、文本選擇、測量方法等方面具有一定的學(xué)術(shù)價(jià)值,同時(shí)在高校漢語國際教育、語言測試專業(yè)研究生培養(yǎng)中也具有一定的社會影響。
2 編著:Xiaohong Wen and Xin Jiang(江新)(Eds.) Studies on Learning and Teaching Chinese as a Second Language. Routledge, 2019/1.
Studies on Learning and Teaching Chinese as a Second Language represents the current advances in the field. It showcases theoretically motivated empirical studies and diverse methods used for better understanding how Chinese language is acquired as a second or foreign language. This contributes to L2 acquisition research in general and L2 Chinese specifically. Furthermore, this research is useful for teachers seeking to understand their students’ learning processes and adjust their pedagogical approach for more effective instruction. The book bridges the gap between research and instruction by providing pedagogical implications rooted in empirical findings.
3 論文:Lou, Y., Cai, H., Liu, X., & Li, X(李興珊). (2019). Effects of self-enhancement on eye movements during reading. Frontiers in psychology, 10.
基本內(nèi)容:已有的研究表明讀者的眼動(dòng)受到文本屬性和讀者個(gè)人的認(rèn)知特征的影響。本研究進(jìn)一步表明,讀者閱讀漢語文本時(shí)的眼動(dòng)特征受到自我增強(qiáng)的社會動(dòng)機(jī)的影響。實(shí)驗(yàn)要求讀者默讀句子,這些句子用積極或消極特質(zhì)描述自我或他人,同時(shí)記錄他們的眼動(dòng)軌跡。結(jié)果發(fā)現(xiàn),當(dāng)積極詞匯被用來描述自我而不是描述他人時(shí),首次注視時(shí)間和凝視時(shí)間更長,但是對于消極詞匯沒有發(fā)現(xiàn)該效應(yīng)。這些結(jié)果提示,除了文本的視覺特征和認(rèn)知因素,閱讀過程的眼動(dòng)行為還受到自我增強(qiáng)動(dòng)機(jī)的影響。主要觀點(diǎn):人類動(dòng)機(jī)尤其是自我增強(qiáng)動(dòng)機(jī),能夠影響閱讀中的眼動(dòng)行為。為了增強(qiáng)或保持積極的自我,人們通常會選擇性地記住他們的優(yōu)勢而非弱勢,所以會更多地關(guān)注描述自我的積極詞匯。學(xué)術(shù)價(jià)值:拓寬了我們對漢語文本閱讀過程中眼動(dòng)控制機(jī)制的多種影響因素的理解;提示眼動(dòng)跟蹤技術(shù)可以用來研究漢語文本閱讀理解過程中讀者的動(dòng)機(jī)。
4 論文:吳思遠(yuǎn)、蔡建永、于東、江新(2018)文本可讀性的自動(dòng)分析研究綜述,《中文信息學(xué)報(bào)》第12期
文本可讀性問題最初由教育學(xué)家提出,初衷是輔助教師為語言學(xué)習(xí)者推薦適合其閱讀水平的文本。隨著計(jì)算機(jī)技術(shù)的發(fā)展及網(wǎng)頁文本的涌現(xiàn),對文本進(jìn)行可讀性分析有了更加豐富的技術(shù)手段和應(yīng)用場景。該文對可讀性自動(dòng)分析的相關(guān)研究進(jìn)行了梳理,將可讀性自動(dòng)分析的方法總結(jié)為公式法、分類法和排序法三類;然后進(jìn)一步介紹了可讀性自動(dòng)分析中的兩項(xiàng)重要內(nèi)容:文本特征的選擇和數(shù)據(jù)集的使用;最后對可讀性研究的發(fā)展方向進(jìn)行展望。
5吳思遠(yuǎn)、于東、江新(2019)漢語文本可讀性特征體系構(gòu)建及其效度驗(yàn)證,《世界漢語教學(xué)》(投稿,在審)
本文主要研究如何利用漢語文本的語言特征對漢語文本的可讀性進(jìn)行分析。目前,漢語可讀性研究多使用字詞層面的表層特征,較少涉及句法和篇章層面的特征,也缺乏對特征效度的對比分析。本研究首先從漢字、詞匯、句法和篇章四個(gè)層面出發(fā),構(gòu)建了一個(gè)預(yù)測漢語文本可讀性的多層面、多維度特征體系,然后以12個(gè)年級的《中小學(xué)語文教材文本語料庫》為基礎(chǔ),通過建立機(jī)器學(xué)習(xí)模型考察了不同層面語言特征的預(yù)測能力。實(shí)驗(yàn)結(jié)果顯示:基于漢字層面特征的模型、基于詞匯層面特征的模型預(yù)測準(zhǔn)確率最高,基于篇章層面特征的模型準(zhǔn)確率次之,基于句法層面特征的模型準(zhǔn)確率最低;雖然基于單一層面特征的模型可以有效預(yù)測漢語文本可讀性,但多層面特征組合的模型預(yù)測力更強(qiáng)。我們還發(fā)現(xiàn),不同層面語言特征的預(yù)測能力受文本的可讀性級別影響。
6 論文:孟凱(2019)現(xiàn)代漢語詞法中虛義動(dòng)詞性成分的功能分工與語義作用,《世界漢語教學(xué)》第1期。
現(xiàn)代漢語中由虛義動(dòng)詞性成分(V虛)“打、為、行、作、做”構(gòu)成的“V虛+V”是古漢語遺存。這5個(gè)V虛的構(gòu)詞力不同,“打”屬強(qiáng)勢構(gòu)詞,其他幾個(gè)屬零星構(gòu)詞。產(chǎn)生構(gòu)詞力差異的原因主要在于這幾個(gè)V虛各有功能分工:“打”主要在詞法上構(gòu)造“打虛+V ”,可組配的V語義類型豐富;構(gòu)詞力一般的“行”與“作”,可組配的V語義類型的互補(bǔ)性較明顯,前者傾向于與強(qiáng)動(dòng)作性或動(dòng)作凸顯的V組配,后者傾向于與弱動(dòng)作性或動(dòng)作不凸顯的V組配;“為”和“做”的構(gòu)詞力都較弱,“做”主要在句法上充當(dāng)實(shí)義動(dòng)詞前的形式動(dòng)詞。V虛在詞法中的語義作用主要是:1)使“V虛+V”比V語義抽象,表現(xiàn)在使“V虛+V”與V的語義傾向不同和將V的[+動(dòng)作]轉(zhuǎn)變?yōu)椤埃痔摚帧钡模郏顒?dòng)];2)使“V虛+V”與V的語體附屬義不同;3)使“V虛+V”與V多義關(guān)系的表現(xiàn)不同。輕動(dòng)詞性V虛在漢、英詞法中都呈現(xiàn)出與其句法表現(xiàn)不同的功能分工與語義作用,這種詞法、句法差異具有一定的類型學(xué)意義。
7 論文:李潤生(2019)漢字教學(xué)中正確運(yùn)用“聯(lián)想識字法”應(yīng)遵循的原則,《漢語學(xué)習(xí)》(錄用,將刊)。
聯(lián)想識字法是漢字教學(xué)領(lǐng)域運(yùn)用廣泛而又充滿爭議的識字法。實(shí)踐證明,恰當(dāng)?shù)剡\(yùn)用聯(lián)想識字法,有利于提高漢字學(xué)習(xí)效率,但如果運(yùn)用不當(dāng),就會給漢字教學(xué)造成混亂。正確運(yùn)用聯(lián)想識字法,需遵循以下四個(gè)原則:(1)對漢字形義關(guān)系的聯(lián)想不能誤解成漢字的造字理據(jù);(2)聯(lián)想識字法僅適用于部分漢字,特別是難學(xué)易錯(cuò)的漢字,避免錯(cuò)誤類推;(3)聯(lián)想具有多樣性和個(gè)體性,個(gè)人聯(lián)想的內(nèi)容不宜隨意推廣;(4)形義聯(lián)想的內(nèi)容不能沖擊漢字符號系統(tǒng),以免引起學(xué)習(xí)者文字觀念的混亂。
8 論文:田然(2018)基于語篇的“你好嗎”“你好”對比研究,《國際漢語教學(xué)研究》第4期。
本文從話語分析視角對“你好嗎”“你好”這兩個(gè)問候語進(jìn)行了對比分析。從使用頻率與適用廣度上看,“你好”具有顯著高頻特征,適用于從陌生到熟識的各種話語角色;而“你好嗎”則具有顯著低頻特征,只適用于高熟識度的親人、老友及情侶間。從情感功能方面看,“你好”情感量值顯著低于“你好嗎”。從歷史方面看,“你好”在清朝時(shí)出現(xiàn),清朝中期“你好”根據(jù)語境應(yīng)為疑問語氣,后人以問號標(biāo)識,清朝末期用法與今日相同,今日用法與英語中問候語 hello 類似; “你好嗎”最早見于元朝,明朝、清朝均有用例,用法基本與今日相同,不能認(rèn)為其來自英語,用法也與how are you不同。這兩個(gè)小句難度等級不同,“你好嗎”有更高的習(xí)得坡度,所以不適合在教材開篇時(shí)便教授給初級水平的漢語學(xué)習(xí)者。
9 論文:郝美玲(2018)高級漢語水平留學(xué)生漢字認(rèn)讀影響因素研究,《語言教學(xué)與研究》第5期。
漢字的學(xué)習(xí)和掌握是留學(xué)生漢語學(xué)習(xí)的核心和難點(diǎn),本研究旨在探討影響漢字認(rèn)讀的客體因素,以期為留學(xué)生漢字教學(xué)提供參考。采用相關(guān)和回歸分析方法,本研究考察了35名高級漢語水平留學(xué)生對1200個(gè)常用漢字的即時(shí)認(rèn)讀情況及其主要影響因素。結(jié)果表明,漢字使用頻率是留學(xué)生漢字認(rèn)讀任務(wù)最重要的影響因素,語義具體性、讀音規(guī)則性和構(gòu)詞能力,也對漢字認(rèn)讀有顯著預(yù)測作用,但漢字基本視覺屬性,包括筆畫數(shù)和部件數(shù)未能表現(xiàn)出顯著影響。文章還比較了留學(xué)生與漢語母語者在漢字認(rèn)讀影響因素上的異同。最后簡單討論了留學(xué)生漢字教學(xué)中需關(guān)注的幾個(gè)方面。
10 論文:郝美玲、周思濃(2019)漢語初學(xué)者漢字閱讀準(zhǔn)確性與流暢性影響因素研究,《世界漢語教學(xué)》(錄用,將刊)。
元語言意識與認(rèn)知技能在兒童字詞習(xí)得中扮演著重要角色,但是它們在漢語第二語言字詞習(xí)得中作用如何卻鮮有研究。本研究以初學(xué)漢語三個(gè)月左右的學(xué)習(xí)者為被試,考察了影響他們漢字閱讀準(zhǔn)確性與流暢性的元語言意識和認(rèn)知技能;貧w分析發(fā)現(xiàn),聲調(diào)意識和正字法意識可以顯著預(yù)測學(xué)習(xí)者漢字閱讀的準(zhǔn)確性,而視覺加工技能、語音意識和快速命名卻可以顯著預(yù)測學(xué)習(xí)者漢字閱讀的流暢性。該結(jié)果模式表明,漢字閱讀準(zhǔn)確性與流暢性是閱讀能力不可或缺的成分,二者的發(fā)展需要不同的認(rèn)知能力;诖,我們建議,在未來的漢字教學(xué)中,除了要幫助學(xué)習(xí)者準(zhǔn)確認(rèn)讀漢字,還應(yīng)加強(qiáng)流暢性的訓(xùn)練,而元語言意識的培養(yǎng)可以從根本上促進(jìn)漢字閱讀的準(zhǔn)確性與流暢性。
11 論文:房艷霞(2018)提高語塊意識的教學(xué)對漢語第二語言學(xué)習(xí)者口語產(chǎn)出的影響,《世界漢語教學(xué)》第1期。
語塊在語言中大量存在,語塊加工是否存在優(yōu)勢,對此學(xué)界還存在爭議。本研究以包含語塊和相對應(yīng)非語塊的72個(gè)漢語句子作為實(shí)驗(yàn)材料,以62名中級、高級漢語第二語言學(xué)習(xí)者和33名漢語母語者作為被試,考察閱讀過程中語塊與非語塊加工的差異。實(shí)驗(yàn)結(jié)果顯示,在目標(biāo)詞組(指語塊和非語塊)、目標(biāo)詞組末尾字、目標(biāo)詞組后位詞和整句四個(gè)興趣區(qū),漢語母語者和第二語言學(xué)習(xí)者都表現(xiàn)出穩(wěn)定的語塊加工優(yōu)勢。這種加工優(yōu)勢表現(xiàn)為更短的注視時(shí)間和更少的注視次數(shù),且在閱讀的早期階段和后期階段都有所體現(xiàn)。在目標(biāo)詞組興趣區(qū)母語者的語塊加工優(yōu)勢比第二語言學(xué)習(xí)者更大。
12 論文:徐晶晶、江新、張習(xí)文(2018)拼音文字背景的外國學(xué)生漢字書寫表征單位的初步研究,《漢語國際教育(中英文)》第3期。
本研究采用基于數(shù)字墨水技術(shù)的實(shí)驗(yàn)方法,探討拼音文字背景的外國學(xué)生在漢字書寫中的表征單位,并考察書寫表征單位是否與學(xué)生漢語水平和漢字結(jié)構(gòu)有關(guān)。實(shí)驗(yàn)以36名學(xué)習(xí)漢語的拼音文字背景留學(xué)生為被試,要求被試用Anoto數(shù)碼紙筆抄寫24對形近字(例如“窄”與“容”),考察關(guān)鍵筆畫間隔的停頓時(shí)間。結(jié)果發(fā)現(xiàn):(1)關(guān)鍵筆畫間隔在部件之內(nèi)的停頓時(shí)間顯著短于在部件之間,這種間隔位置效應(yīng)與漢語水平無關(guān),表明第二語言學(xué)習(xí)者與母語者一樣,將部件作為其書寫表征單位;(2)書寫上下結(jié)構(gòu)和左右結(jié)構(gòu)漢字時(shí),關(guān)鍵筆畫間隔在部件之內(nèi)的停頓時(shí)間都要比部件之間短,這表明部件作為書寫表征單位不受漢字結(jié)構(gòu)的影響。本研究結(jié)果提示我們在漢字書寫教學(xué)中應(yīng)重視部件的作用。
13論文:華麗婭、江新(2018)摩爾多瓦人漢字抄寫和字形知覺的實(shí)驗(yàn)研究,《漢語國際教育(中英文)》第3期。
漢字對母語為字母語言的人來說是一種復(fù)雜的圖畫,對以羅馬尼亞語或俄語為母語的摩爾多瓦人來說也是如此。對沒有學(xué)過漢字的摩爾多瓦人來說,面對這樣一幅幅既繁雜又沒有意義的圖畫時(shí),他們對漢字字形的感知有什么特點(diǎn)?本文通過抄寫實(shí)驗(yàn)考察了22名摩爾多瓦人對不同結(jié)構(gòu)類型漢字的字形知覺,使用數(shù)碼筆記錄漢字書寫的動(dòng)態(tài)過程,以分析被試抄寫漢字時(shí)筆畫、部件書寫的先后順序。結(jié)果發(fā)現(xiàn):(1)漢字書寫存在優(yōu)勢筆畫;(2)被試的漢字書寫受母語負(fù)遷移的影響;(3)被試書寫筆畫數(shù)多的漢字容易出現(xiàn)缺少筆畫的現(xiàn)象;(4)多部件的漢字書寫可能受漢字結(jié)構(gòu)的影響。
三、下一步研究計(jì)劃
1 各個(gè)子課題在已有工作基礎(chǔ)上繼續(xù)按計(jì)劃推進(jìn)。
2 擴(kuò)大漢語文本收集范圍。1)計(jì)劃收集中小學(xué)教材中的文言文和課外讀物中的文言文,將可讀性的研究范圍從現(xiàn)代漢語擴(kuò)展到古代漢語,嘗試研究文言文閱讀理解的難度因素并建立文言文可讀性分析模型。2)計(jì)劃收集海外主流的漢語教材課文,將漢語二語教材課文的收集范圍從國內(nèi)擴(kuò)展到海外。雖然自建的漢語二語教材語料庫已經(jīng)包括了一套美國出版的教材,但是還應(yīng)增加海外教材的數(shù)量。3)繼續(xù)收集和補(bǔ)充漢語水平考試的閱讀測試文本。除了收集真題語料,還可以收集模擬題語料,為考試文本語料的難度/可讀性分析奠定基礎(chǔ)。
3 擴(kuò)大研究對象。除了以中小學(xué)生、來華漢語學(xué)習(xí)者為研究對象進(jìn)行實(shí)驗(yàn)和調(diào)查,還計(jì)劃擴(kuò)大研究對象的范圍:1)以新疆等少數(shù)民族地區(qū)漢語/國語學(xué)習(xí)者為研究對象進(jìn)行實(shí)驗(yàn)和調(diào)查,研究新疆少數(shù)民族漢語/國語學(xué)習(xí)者文本閱讀的難度和影響因素,比較他們與內(nèi)地中小學(xué)生漢語文本理解難度影響因素的異同,研究適應(yīng)新疆少數(shù)民族漢語/國語學(xué)習(xí)者的文本可讀性分析系統(tǒng)。2)以海外漢語學(xué)習(xí)者(包括成人和兒童青少年)為研究對象進(jìn)行調(diào)查,考察他們理解漢語文本的普遍性和特殊性,研究適應(yīng)海外漢語學(xué)習(xí)者的文本可讀性分析系統(tǒng)。3)對來華留學(xué)生的研究從普通的漢語教學(xué)階段擴(kuò)展到入系學(xué)習(xí)專業(yè)的學(xué)術(shù)漢語教學(xué)階段。
4 課題總體研究進(jìn)度計(jì)劃和工作方案。
(1)第一階段(2019年8月至2020年7月)
1)擴(kuò)大文本語料庫的規(guī)模,完善和補(bǔ)充現(xiàn)有自建語料庫(子課題一、三、四、五);
2)繼續(xù)進(jìn)行文本難度的人工評定數(shù)據(jù)的收集,完善黃金語料庫的建設(shè),為可讀性計(jì)算建模準(zhǔn)備好大規(guī)模的數(shù)據(jù)集(子課題三、五);
3)繼續(xù)開展不同難度等級文本的語言特征分析、不同類型學(xué)習(xí)者閱讀理解的心理語言學(xué)實(shí)驗(yàn)研究,在前期對不同難度文本進(jìn)行字、詞層面特征分析和實(shí)驗(yàn)研究的基礎(chǔ)上,重點(diǎn)聚焦句子、語篇層面的分析、描寫、實(shí)驗(yàn)和特征量化。同時(shí)分析不同層面、不同語言特征對于文本難度的影響力大小,以及影響不同類型文本可讀性、不同類型學(xué)習(xí)者閱讀的重要因素,找出重要特征并進(jìn)行量化。
4)在以上工作的基礎(chǔ)上,對重要特征進(jìn)行量化并實(shí)現(xiàn)自動(dòng)化提取,利用機(jī)器學(xué)習(xí)算法建立針對母語者的漢語文本可讀性模型(子課題一、二、三、五)。
5)基于Lexile閱讀能力構(gòu)念和題型編制漢語閱讀能力測驗(yàn)題目,并進(jìn)行預(yù)測(子課題四)。
(2)第二階段(2020年8月至2021年7月)
1)對漢語母語者的可讀性分析模型進(jìn)行內(nèi)外部效度檢驗(yàn),對模型進(jìn)行修正、完善,最終獲得一個(gè)可以應(yīng)用的可讀性自動(dòng)化分析系統(tǒng)(子課題一、二、三、五);
2)借助文本難度預(yù)測系統(tǒng),對文本進(jìn)行難度計(jì)量和統(tǒng)計(jì)分析,獲得文本的難度指標(biāo),組織命題員進(jìn)行較大范圍內(nèi)的命題,選擇目標(biāo)被試,進(jìn)行預(yù)測試,以估計(jì)不同難度文本的各種參數(shù),建立適當(dāng)規(guī)模的閱讀能力測試題庫(子課題四);
3)進(jìn)行文本可讀性自動(dòng)分析系統(tǒng)的開發(fā)(子課題五)。
(3)第三階段(2021年8月至2022年7月)
1)使用眼動(dòng)追蹤技術(shù)的方法,通過記錄讀者在閱讀時(shí)的在線加工表現(xiàn),作為新的文本表征方法(子課題二、三、五)。
2)使用深度學(xué)習(xí)模型提高模型的學(xué)習(xí)能力,構(gòu)建性能更好,準(zhǔn)確率更高的可讀性預(yù)測模型(子課題五)。
3)針對漢語二語學(xué)習(xí)者的特點(diǎn),完成二語者可讀性預(yù)測模型的建立、效度驗(yàn)證和模型修正(子課題二、三、五)。
4)建立可讀性測評網(wǎng)絡(luò)子系統(tǒng)(子課題三、五)。
5)設(shè)計(jì)和開發(fā)計(jì)算機(jī)多階段(MST)半自適應(yīng)性測試,完成漢語閱讀能力系統(tǒng)的建設(shè)(子課題四、五)。
(4)第四階段(2022年8月至2022年12月)
1)將數(shù)據(jù)庫、文本可讀性測評、閱讀能力測評有機(jī)整合和集成,以統(tǒng)一形式呈現(xiàn),作為課題最終示范應(yīng)用平臺(子課題五)。
2)基于漢語可讀性和閱讀能力測評的分級閱讀網(wǎng)絡(luò)服務(wù)平臺試運(yùn)行(子課題五)。
3)準(zhǔn)備結(jié)題工作(所有子課題)。
課題組供稿