外国语言文化学院邀请李文中教授做学术讲座:R语言语料处理及数据分析

撰稿人:徐伟玲  审稿人:武泉莹

2019年12月17日下午,浙江工商大学外语学院博士生和硕士生导师李文中教授应邀到文科楼824学术厅开展了题为《语料库与R统计应用之数据准备与类型数据分析》的工作坊。此次工作坊由外国语言文化学院徐曼菲副教授主持,除本院老师和研究生参加外,广东省高校“英语教育与评价”教学团队也在其中,此次工作坊也是他们的第六次研修活动。此次工作坊历时3小时,干货满满。

image.png

李文中教授

工作坊中,李文中教授以ETS托福写作语料库为数据来源、以R为数据处理和统计平台,围绕以下四个方面进行了详细的讲解和示范:1)语料库定性数据的提取和处理步骤;2)R的数据结构的讲解及数据准备流程;3)定性数据的基本分析手段、可视化方法和解读技巧;4)变量分析的方法和CA对应分析的操作示范。

李文中教授首先以R自带的泰坦尼克号生还情况为本,讲解了R的基本数据类型,数据结构和常用的表达方式,以及如何进行将定量数据转换成定性数据并进行可视化处理,深入浅出地讲解了一遍R处理数据流程。接着,以ETS托福写作语料库为例,从提取词表、清洁语料到生成数据表,从数据表的导入、加工到在R中的具体分析,快速讲解了从语料到R的数据准备、数据分析的全过程。

image.png

在场观众仔细聆听

在工作坊的尾声,李文中教授重点提及了CA对应分析的优势,可以清楚看到个定性变量之间的关系距离和强弱,并能解释大部分的数据,弥补多变量分析仅能解释部分数据的不足。此外,李文中教授还分享了许多语料处理的软件、R统计需要用到的数据包、以及R相关的各类书籍。本次讲座让在场观众都获益颇丰,受益匪,不仅对R语言的数据准备和分析方法有所了解,也对语料库定性数据的分析路径和解读有所启迪。