搜狗

百度

搜狗

360

搜狗

谷歌

搜狗
查看: 1181|回復: 0

[汉语词典] 浅谈信息处理与现代汉语轻声(2)

[複製鏈接]
顺天道化 發表於 2011-9-26 15:44 | 顯示全部樓層 |閱讀模式
  来源: 北方教育
 1.他这种助人为乐的精神值得我们学习。  
  2.老张年龄那么大了,但显得很有精神。  
  3.这篇文章的大意我明白。  
  4.你太大意了,以后可要小心哪!  
  这两组句子,分别都有两个“精神”和“大意”,但在每一个句子中只有一种读法,前一个读原调,后一个读轻声。联系“精神”和“大意”前后的词语,就可以理解句子意思。  
  但是,像下面的句子:  
  5.到一个新的地方分不清东西。  
  6.这是你的不是?  
  7.他们一直打冷战。  
  8.那两个是小王的兄弟。  
  9.他实在不会说那种话。  
  10.那个人很像大爷。  
  这些句子例5中的“东西”里的“西”读阴平,“东西”表示方位,指东边和西边。当“西”读轻声时,“东西”指的是物品。例6中的“不是”里的“是”读去声时,“是”为动词,“不是”表示否定。当“是”读轻声时,“不是”表示错处、过失。例7中的“冷战”中的“战”读去声时,“冷战”指他们双方之间进行的无声较量。当“战”读轻声时,表示因寒冷或害怕浑身突然发抖。例8中的“兄弟”里的“弟”读去声时,“兄弟”指的是哥哥和弟弟,当“弟”读轻声时,指的是弟弟。例9中的“实在”里的“在”读去声时,“实在”是形容词,表示很老实、本分,当“在”读轻声时,“实在”是副词,表示的确的意思。例10中的“大爷”,当“爷”读阳平时,“大爷”指的是不好好劳动、傲慢任性的男子,当“爷”读轻声时,表示是伯父或尊称年长的男子。  
  这些词语在句子里会有两种读法,两种理解,而且单独就一个句子而言,两种读法、两种理解都成立。我们人工阅读或说话时,要准确地理解其中的意思,只有联系上下文去理解。那么,这种现象在计算机信息处理时,就遇到了困难。在一个句子里,读原调和轻声,所表示的意思都成立,这是由于轻声的缘故构成的歧义句。这种现象给人工阅读带来了麻烦,需要再联系上下文去理解意思,当然,计算机要理解这些句子的意思就更困难了。也正如亢世勇说的“尽管信息处理专家运用了规则排歧、统计概率排歧或者两者结合起来等多种方法进行排歧,但到目前为止,还没有一种方法、一种系统能够彻底解决这个问题。”  
  因为,目前,计算机完成了“字处理”,在“词处理”和“句处理”的过程中,遇到的问题比较多。例如:词的切分问题,词性的标记问题,也就是说让计算机面对真实文本自动进行词的切分和词性标记。其中词的切分这一项,是字处理突破后中文信息处理所必须突破的又一个核心问题,是必须要闯过的第二道难关。从20世纪80年代以来,计算机学界和汉语言学界联手攻克词的切分这一难关,20多年来,都取得了可喜的成果,研制了一些相应的软件。到目前为止,计算机自动分词,正确率可达到90%到95%,剩下的5――10%的词的切分问题,难度也比较大。其中就包括歧义句的词的切分问题,当然也包括由于轻声引起的歧义现象。对于歧义句的理解,我们运用增加、替换词语,或联系上下文理解意思。这又涉及到“句处理”的问题。句处理的主要内容是,怎样使计算机理解自然语言(现代汉语)的句子的意思,又怎样使计算机生成符合自然语言规则的句子。由此可见,“句处理”所需要的语言知识,将是一种涉及到语音、语义、语法、语用等多方面的综合性知识。而且,“句处理”要解决的核心问题是排除歧义的问题。科学家们正在努力攻克这一难关,争取早日突破信息处理中的一大瓶颈问题。  

    
  参考文献:  


  [1]徐世荣:《试论北京语音的“声调音位”》,《中国语文》,1957.7。  
  [2]罗常培、王 均:《普通语音学纲要》,商务印书馆,2002。  
  [3]厉为民:《试论轻声和重音》,《中国语文》,1981.1。  
  [4]林 焘、王理嘉:《语音学教程》,北京大学出版社,1992。  
  [5]林茂灿、颜景助:《普通话轻声与轻重音》,《语言教学与研究》,1990.3。  
  [6]亢世勇:《面向信息处理的现代汉语语法研究》,上海辞书出版社,2004。

小黑屋|举报|桂ICP备2022007496号-1桂公网安备 45010302003000桂公网安备 45010302003000

关于我们|网站地图|华韵国学网|国学经典

扫一扫微信:Chinulture|投稿:admin@chinulture.com

快速回復 返回頂部 返回列表