数据科学这个专业好吗?
数据科学专业是一个交叉性很强的学科,由诸多领域融合而成。 因此学习这个专业的同学也需要具备一些其他领域的知识。 以我们学校开设的数据科学专业所设置的课程为例 有来自数学系的数理基础课程,有来自计算机系的人工智能、数据结构与算法、数据库课程等等。
当然还有我们自己的特色课程,比如计算金融、大数据采集与处理等相关课程。 在这样多元化的课程环境下,同学们可以比较自由的选择自己感兴趣的领域深入学习,也可以跟随着导师的步伐做一些项目实战练习。 在我看来这样的课程设置是有益的,能够让大家对数据科学这一领域有一个宏观了解的同时,也能让同学们在实验课上能更好的学以致用。 那么既然学了这么多知识,到底能不能解决实际问题呢? 就以我在UW做研究期间所做的项目来说吧。 当时我们所使用的数据是全美社区大学的毕业生的统计信息。
这些学生的个人信息包括性别、种族、GPA等104个特征,所申请的大学及专业名单、学生毕业的时间以及最后是否成功找到工作等信息。 我们所提出的问题是如何根据学生的背景信息以及所申请的专业,预测该学生是否能够顺利找到工作。(数据科学一个常用的研究方向就是数据分析与预测)
经过多次尝试,我们发现了一个重要的影响因素,也就是当大家向目标院校递交申请材料时,尽量把重点放在个人特色的描写上而不是千篇一律的空话。
因为每个人的特点都是不一样的,或许你的优点正是别人欠缺的。 所以抓住亮点,合理突出自身优势也是我们在数据挖掘过程中需要关注的问题之一。 我们的研究也发现有些特征虽然看上去与结果无关,但在特定的模型中却是很重要的的影响指标。
因此不能忽视每一个特征背后可能蕴涵的信息。 这也就引出了我对数据科学专业学习另一个看法,那就是千万不要为了学习而学 习,而是要把学到的知识与实际生活联系起来,这样才能真正学到东西。否则学完之后你会发现,原来这些东西其实用处不大。那岂不是很亏?!