特邀报告

主题报告:

题目:表示概率的主观副词

报告人:香港理工大学  石定栩 教授

摘要:

在汉语中,“有时”、“往往”和“总”通常都认为是时间副词或其中的小类频率副词,意义及功能与“偶尔”、“常常”和“一直”相近,都属于同一个类别。通过对大规模语料的分析,我们得出的结论则非常不同,只有后者才是表示频率的副词,而前者却是表示概率的副词。尽管都和事件的次数相关,但概率和频率的计算方式不同,对计算条件的要求也不同。

比如,例句“奶奶常常打麻将”使用的是频率副词“常常”,是说单位时间里“打麻将”的次数较多,无论是每小时、每天还是每月多次,都不影响句子的可接受程度。如果使用了概率副词“往往”,变成“奶奶往往打麻将”,是说“打麻将”次数的集合和另一个事件的集合相比得到的比值较大。这里没有说明这另一个事件集合是什么,无法计算概率,因而不可接受。而如果变为“奶奶往往下午打麻将”,其中“下午”形成另一个集合,可与“打麻将”合在一起计算概率,所以是可以接受的。

更重要的是,“往往”、“有时”和“总”表示说话人对于概率的评估,即对于客观规律做出的主观判断,或者说对于命题真实性所做的评价。“奶奶往往下午打麻将”的意思是说话人认为“奶奶下午打麻将”并不永远为真,但也不永远为假,为真的概率在0.5上下。做出判断的出发点是说话人心目中的标准,或者说比较的基线。

再如,例句“老人有时候特别宠孙子”的基线可能是统计结果,即“老人”中间“宠孙子”的不少,但这个基线也可能是说话人的主观猜测,并没有什么事实基础。例句“他总踩着铃声上班”中“总”的基本义是概率很大,基线接近1了。这句话说的是一个人上班的情况,很可能符合统计结果;而“你怎么总不接我的电话?”是一个女孩子的撒娇,男朋友“不接电话”可能只发生过一、两次,但她却主观认为基线应该是零,所以用“总”来抱怨。

按频率的高低排序,应该是“一直>常常>偶尔”;按概率的大小排序,应该是“总>往往>有时”。不过,“总”、“往往”或“有时”的主观性却似乎与这种客观排序没有直接关系。从基线的角度说,“总”可以用客观规律作为基线,也可以用主观认定作为基线;“有时”的基线比较模糊,所以也容忍主观认定;而“往往”的基线大多是客观统计的结果。

报告人简介:

石定栩是匹兹堡大学应用语言学硕士,南加州大学语言学硕士、博士。现为香港理工大学中文及双语学系的汉语语言学讲座教授,研究领域为句法理论、句法和语义的互动、语言接触及语言变化以及汉语教学语法。在剑桥大学出版社、北京大学出版社等出版多部专著,在Language, Natural Language and Linguistic Theory, Journal of Chinese Linguistics, 《中国语文》,《外语教学与研究》及《当代语言学》等杂志上发表一百多篇论文。

主题报告:

题目:Continuous Space Models and the Mathematics of Semantics

报告人:新加坡资讯通信研究院 Rafael E. Banchs 博士

摘要:

In this talk, we present and discuss the most recent advances on the use of continuous space models in natural language processing applications. More specifically, some of the fundamental concepts of distributional semantics and vector space models are presented, followed by a brief discussion on linear and non-linear dimensionality reduction techniques and their implications to the parallel distributed approach to semantic cognition. Finally, some interesting examples about the use of continuous space models in both monolingual and cross-language natural language processing applications are presented.

报告人简介:

Rafael E. Banchs is a Research Scientist at the Institute for Infocomm Research, in Singapore, where he leads the Dialogue Technology Lab of the Human Language Technology Department. He obtained a PhD degree in Electrical Engineering from The University of Texas at Austin in 1998. Since then he has worked on a variety of problems ranging from signal processing, electromagnetic modelling and parameter estimation to natural language processing, across different industries and applications. In 2004, he was awarded a five-year “Ramon Y Cajal” fellowship from the Spanish Ministry of Science and Technology to work on natural language processing related problem. He published over 30 journal papers. He held positions and taught in a number of universities and gave lectures and talks at many international conferences and workshops. His current area of research is focused on the construction and use of semantic representations to support different natural language processing applications, including machine translation, information retrieval, natural language understanding and chat-oriented dialogue.  

特邀报告:

题目:语法中弱特征[+处所]的激活过程与激活成分

报告人:澳门大学 徐杰教授

摘要:

多数指人和指物的名词性成分都有一个表示处所的弱特征“[+L]”,该项弱特征需要得到适当的激活才能顺利参与语法活动,发挥其潜在的语法效能。这一特征在不同的语言中有不同的激活机制。本文讨论了弱特征激活机制的跨语言系统性差异及其理论意义。在此理论框架下,我们将现代汉语中“桌子旁”和“老王这儿“等广受关注的“名词性成分 + 处所成分”这类汉语特有而英语类语言所没有的现象进行了重新解释,认为这一现象正是弱特征“[+L]”在汉语中的激活机制发挥作用所带来的部分衍生现象。

报告人简介:

徐杰,1993年获得美国马里兰大学语言学博士学位。先后任教于新加坡国立大学、华中师范大学。现为澳门大学人文学院中国语言文学系教授。本学年度徐杰借其学术休假重返星洲,在南洋理工大学进行学术合作与学术访问。其主要研究领域为句法学,语义学,汉英比较,语言习得、语言教育、语言规划和语言特区理论。已在国内外多种学术刊物上发表论文五十余篇。出版有《汉语描写语法十论》,《普遍语法原则与汉语语法现象》、Sentence Head and Sentence Structure ,《语言规划与语言教育》等学术专著。

特邀报告:

题目:Manifestation of Certainty in Semantics: The Case of Yídìng, Kěndìng and Dǔdìng in Mandarin Chinese

报告人:台灣國立中正大學 吳俊雄教授

摘要:

This talk examines three modal adverbi-als in Mandarin Chinese: yídìng, kěndìng and dǔdìng. These three lexical entries can all express epistemic necessity or intensification. However, denoting intensification, kěndìng and dǔdìng have additional semantic requirements. First, they both require that there be at least one alternative to the proposition they present. Second, the speaker uses kěndìng to ascertain the truth of a proposition it takes, although all the alternatives are potentially true. Third, dǔdìng is used to assert the certainty that only the proposition it takes is true. Concerning certainty, two cases are demonstrated here. For yídìng, certainty is used implicitly, because certainty manifests itself through the speaker's attitude. However, for kěndìng and dǔdìng, certainty is revealed explicitly, since (part of) the semantics of these two lexical items is certainty.

报告人简介:

吳俊雄博士現任台灣國立中正大學語言學研究所教授。其於2003年5月自美國德州大學奧斯汀分校取得語言學博士學位。研究興趣包括:形式語意學、形式語用學、計算語意學、篇章分析、句法與語意界面等。近年來,專注於時、體、時序關係、篇章結構、代名詞指涉及情態詞等研究。吳博士已於下列知名期刊發表十數篇期刊論文,如,東亞語言學期刊(Springer出版)、漢語語言學期刊、語言暨語言學、語言學期刊—東亞(於法國出版)、台灣語學期刊、亞洲語言處理國際期刊、華語教學期刊,等。除期刊論文外,也發表數篇專書論文。另外,吳博士也出版了一本學術專書《漢語中的時序關係 – 台灣語言學專刊第二號》及一本教科書:《給人文領域學生的計算語言學初探》。 在學術服務方面,吳博士於2008年8月至2010年1月擔任國立嘉義大學外國語言學系系主任。於2008年至2014年擔任台灣語言學學會理事,並於2010年至2012年擔任台灣語言學學會理事長。

特邀报告:

题目:Integrating Character Representations into Chinese Word Embedding

报告人:乐山师范学院 金澎教授

摘要:

We propose a novel word representation for Chinese based on a state-of-the-art word embedding approach. Our main contribution is to integrate distributional representations of Chinese characters into the word embedding. Recent related work on European languages has demonstrated that information from inflectional morphology can reduce the problem of sparse data and improve word representations. Chinese has very little inflectional morphology, but there is potential for incorporating character-level information. Chinese characters are drawn from a fixed set – with just under four thousand in common usage – but a major problem with using characters is their ambiguity. In order to address this problem, we disambiguate the characters according to groupings in a semantic hierarchy. Coupling our character embeddings with word embeddings, we observe improved performance on the tasks of finding synonyms and rating word similarity compared to a model using word embeddings alone, especially for low frequency words.

报告人简介:

金澎,乐山师范学院计算机科学学院教授、院长,互联网自然语言智能处理四川省高等学校重点实验室主任。分别于1999、2002和2009年在郑州纺织工学院、南京理工大学和北京大学获计算机学士、硕士和博士学位。2007年11月至2008年4月受国家留学基金委资助到英国萨塞克斯大学计算机系访学;2014年8月至2015年2月再次至该校访学。研究领域是自然语言处理,特别是基于统计的词汇语义和语言资源建设。先后发表30多篇知名学术会议或期刊论文;拥有一项中国国家发明专利。承担两项中国国家自然科学基金和多项与工业界合作的项目。曾担任CIS2013和YSSNLP2014的组委会主席,NLP&CC'13、NLPOE'09-14等多个国际学术会议的程序委员会委员。