从当代民谣看从当代民谣看中国民众的话语表达中国民众的话语表达湖北大学文学院 湖北大学文学院 语言学及应用语言学语言学及应用语言学曾祥喜曾祥喜??一、一、现代民谣文本的词语使用频率分析现代民谣文本的词语使用频率分析??二、二、现代民谣的高频词语意义及表达方式现代民谣的高频词语意义及表达方式??三、三、现代民谣文本内的互文性阐释现代民谣文本内的互文性阐释??资料来源说明:笔者通过互联网查阅了相关信息,远方出版社没有出资料来源说明:笔者通过互联网查阅了相关信息,远方出版社没有出版该民谣集,这部民谣集可能是盗号的地下出版物。目前,民谣集基版该民谣集,这部民谣集可能是盗号的地下出版物。目前,民谣集基本上没有官方出版业正式出版发行的版本。流行于民间的非电子版本本上没有官方出版业正式出版发行的版本。流行于民间的非电子版本的民谣也仅限于此集和的民谣也仅限于此集和《《当代民谣当代民谣》》。同时,从该书的校对上看,错、。同时,从该书的校对上看,错、讹、漏等现象相当多。从编排体系上看,也不严谨规范,有的民谣有讹、漏等现象相当多。从编排体系上看,也不严谨规范,有的民谣有标题,有的却没有,因而无法准确统计该民谣集中的民谣数量。但因标题,有的却没有,因而无法准确统计该民谣集中的民谣数量。但因其保留了民间原生态色彩,故本论文仍将此民谣集作为唯一的资料来其保留了民间原生态色彩,故本论文仍将此民谣集作为唯一的资料来源。源。1 1、词频: 、词频: ??本论文所分析的民谣共计汉字本论文所分析的民谣共计汉字 45115 45115 个。笔者采用个。笔者采用了以了以““易五码易五码””技术为基础的搜索分词软件,对文技术为基础的搜索分词软件,对文本进行分词处理并加以人工干预。有关本进行分词处理并加以人工干预。有关““词词””的判的判断以断以《《现代汉语词典现代汉语词典》》(中国社会科学院语言研(中国社会科学院语言研究所,商务印书馆出版, 究所,商务印书馆出版, 2002 2002 。)为标准,另保。)为标准,另保留一定的固定短语和类固定短语。留一定的固定短语和类固定短语。??该文本该文本 45115 45115 个汉字共计词语个汉字共计词语 7271 7271 个,总频次为个,总频次为 24259 24259 ,平均词频为,平均词频为 ,平均词长为,平均词长为 。词。词长与现代汉语一般文本的词长基本一致。长与现代汉语一般文本的词长基本一致。 24259 7271 共计 12643 / 6886 / 1-10 4770 / 331 / 10-49 1572 / 24/ 50-99 5274 / 27/ 100 次以上使用频次/比例词条数目/比例使用次数??我们可以看出, 我们可以看出, % % 的词语分布率为的词语分布率为 % % ,也就是说,约,也就是说,约 95% 95% 的词语使用频的词语使用频率不足率不足 10 10次,词语数量大,但分布却不广。次,词语数量大,但分布却不广。与此相反的是,有与此相反的是,有 % % 的词语使用频率占的词语使用频率占总频次的总频次的 % % ,占总文本的三分之一,高,占总文本的三分之一,高频词集中,且分布较广;另有频词集中,且分布较广;另有 % % 的词语的词语其词频也接近其词频也接近 20% 20% 。本论文将此类高频词作。本论文将此类高频词作为本论文的研究对象。为本论文的研究对象。 2 2、高频词语的使用情况、高频词语的使用情况??为了与现代汉语其他文本进行比较,笔者将教育为了与现代汉语其他文本进行比较,笔者将教育部语言文字应用研究所的国家语委现代汉语语料部语言文字应用研究所的国家语委现代汉语语料库作为一个参照系。库作为一个参照系。通过统计分析可知,这些高通过统计分析可知,这些高频词或次高频词各自平均分布率分别是频词或次高频词各自平均分布率分别是 % % 和和 % % ,现代民谣中的这些高频词与一般性,现代民谣中的这些高频词与一般性文本中的出现机率差别甚小,仅有文本中的出现机率差别甚小,仅有 % % 。但。但两者分布率之比平均却高达两者分布率之比平均却高达 倍之多,这说倍之多,这说明上述词语在现代民谣文本和语料库中的分布率明上述词语在现代民谣文本和语料库中的分布率绝对差异非常大,最高达近绝对差异非常大,最高达近 800 800 倍。另一方面,上倍。另一方面,上述高频词和
从当代民谣看 来自淘豆网m.daumloan.com转载请标明出处.