3月27日下午,刘剑院长在外语楼北603教室为外国语学院语料库创建及应用培训班30余名教师带来了第二讲——语料库建库步骤、主流建库及检索软件的使用及实际操作。
此次培训,刘教授以部分语料作为实例,给老师们介绍并演示了OCR识别、文本整理、汉语分词、英汉语POS标注、Antconc及Wordsmith检索并统计单语语料、双语语料对齐及检索等技术。重点介绍了PDF文档解密并转Word、Abbyfinereader软件进行OCR操作、使用EmEditor整理文本、ICTCLAS软件对汉语分词及标注、Paraconc在双语对齐及检索中的应用等。刘教授强调文本整理的重要性,因为细小的错误会导致语料统计数据的不准确。在演示的同时,鼓励在座的各位老师在电脑上跟着操作,熟悉并掌握相关软件的使用。讲座过程中,刘院长细致耐心地解答了部分老师在实际操作中遇到的困难,并鼓励研究方向相近的老师组建研究团队,整合各种资源,共同制作可用于教学及学术研究的各类语料库。
讲座持续了近三个小时。讲座结束时,大家对刘院长的无私奉献精神致以热烈的掌声。老师们纷纷表示,虽然信息量有点大,但是受益匪浅,对语料库相关研究也产生了浓厚的兴趣,并表示课后将举一反三,熟练掌握各种工具的使用。
图文/外国语学院
一审/尹静
二审/何文娟
终审/刘剑