近日,国家自然科学基金委公布了2011年度国家自然科学基金资助项目名单,今年我校共申报10项,获得4项,均为面上项目。其中包括我院王治敏副教授的《隐喻识别与理解的理论与方法研究》。
项目简介:
王治敏副教授《隐喻识别与理解的理论与方法研究》
隐喻的识别与理解是计算语言学更上一层楼的新的开拓性研究课题,隐喻大量地存在于我们的日常生活中,一项针对电视和新闻评论节目的调查表明做这些节目的人平均25个词就要使用一个独特的隐喻 。另一项针对中文经济报道标题的调查也显示,在6万多标题中概念隐喻的数量已经占到总数的四分之一以上。这不仅对自然语言处理提出了严峻挑战,而且也将直接关系到机器翻译、信息检索、问答系统等诸多语言处理应用系统的质量和成败。如果隐喻的识别和理解不能很好解决,将成为自然语言处理技术发展的瓶颈。
本项目以高质量机器翻译和自然语言理解为目标,探索汉语隐喻识别与理解的理论、方法及实现技术。主要内容有:⑴在对汉语隐喻类型全面考察和计量分析的基础上,总结和发现隐喻的映射规律,建立以源域为核心的隐喻知识架构体系。⑵利用已有的《现代汉语语法信息词典》和《中文概念词典》等基础资源,采用主动学习方法从大规模语料中获取隐喻资源,建造面向机器理解和对外汉语教学的汉语隐喻知识库和标注语料库。⑶优化基于机器学习方法的隐喻识别模型,提高识别效率。(4)开展相似度推理的隐喻理解研究,实现大规模文本的源域、目标域、喻底的自动获取。本项研究将有助于解决隐喻对中文信息处理诸多环节的困扰,为相关应用提供支持。