语言coe长什么样?

应芷琪应芷琪最佳答案最佳答案

谢邀。我是学统计的,所以对语料方面的事情比较陌生,这里就语言学的角度答一下。

首先,我想问楼主,你所谓的“language coefficient”到底是什么意思?这关系到如何定义“语言”和“变量”这两个概念。如果这两者被你定义为某一种方式的语言表达(比如:英文短语“I am fine. Thanks and you?" 中包含的语法、词汇等),那么语言变量的选取应该是你希望研究的语句的集合,而语句又是由词组成的一个个向量。这样每个句子都可以由一个向量来表示,然后这些向量就可以做线性相关性分析之类的。不过我好奇的是,这样定义的“语言”和“变量”是否真的符合日常生活对它们的认知——毕竟我们一般不会先想到要用数学的方式去刻画它们。

如果语言被定义为人类使用符号进行交往的能力(communication ability),那这个变量就很好选了:所有的人类都有语言表达的能力;相反,如果你要研究语言的习得,这时候语言变量就是人类在不同年龄段所表达的语句的总汇。 个人认为后者更好。虽然前者的语句看起来好像更有针对性(研究对象是某种特定情况下的语言),但实际情况可能更复杂:研究此类语言问题可能需要考虑历史背景、文化、社会等诸多因素,这些因素可能会影响你对语言的定义,进而影响你所选的语言变量。

以上仅仅是我对语言学和统计学的一点理解,不保证正确。

我来回答
请发表正能量的言论,文明评论!