中国高校数据科学教育新趋势为什么传统教学方式不管用了?

2019-12-13 22:13

  数据科学已成为21世纪最重要的工作 工具之一,世界正在被数据转化,数据驱动的分析正在迅速成为科学和社会不可分割的一部分。 自2013年12月以来对“数据科学”一词的热度(来源:Google趋势)为此,国家

  数据科学已成为21世纪最重要的工作/工具之一,世界正在被数据转化,数据驱动的分析正在迅速成为科学和社会不可分割的一部分。

  自2013年12月以来对“数据科学”一词的热度(来源:Google趋势)

  为此,国家 / 高校为了培养更多的数据科学人才 / 复合型人才付出了巨大的努力,可短缺仍然存在。对于这个新的职业领域,需求远远超过供给。数据科学教育是一个不断增长的领域,有非常多的在职人士 / 在校大学生(非数据科学方向)通过在线课程获得了对数据科学的理解,也有一些高校生踏上了传统的大学学习道路,主修数据科学(或复合专业)学士学位,截至2019年4月,获批该专业的高校已经达到488所。可如何让数据科学教育行之有效呢?建设什么样的专业以及如何建设该专业仍为各高校面临的难点问题,其实这个问题的答案很简单,数据学科是一门实践性极强的学科,其研究和应用都不能脱离现实中的领域,又必须涉及到该领域未来的发展战略、基础设施、业务流程、政策法律与人文环境等诸多因素……那就是不仅需要优质的教学课程,也少不了实践和实战的经验。

  接下来,我们将探讨是什么让数据科学教育变得困难?数据科学新工具和新技术的兴起给高校教育带来的机遇和挑战,并了解数据科学所需的综合基础工具。

  数据科学这么火?那数据科学到底是什么呢?综合了多方面的概念和注释,数据科学或许可以这样来理解,数据科学是关于信息的提取,准备,分析,可视化和维护。这是一个跨学科的领域,它使用科学的方法和过程从数据中获取见解

  可如今,国内大部分高校都普及了数据科学教育,但在数据科学教育上存在着各方面的挑战。其中最为重要的是它仍然缺乏综合基础性的平台工具,就像是有了伞的形状,可缺少了骨架。其中也有少部分高校已经采购了综合基础性的平台工具,如,和鲸科技旗下的K-Lab教育版。其次是数据大量涌现,但缺乏专业数据科学方法和技能能够以正确的方式处理数据。这是困扰数据科学领域的主要困难所造成的学习障碍。

  因此,在开启数据科学教育之前,高校必须首先了解学习数据科学教育的确切目的,数据科学的学习者所真实面临的一些问题,才能更清楚是什么让数据科学教育变得困难。

  数据科学需要解决难题。这些问题主要集中在开发解决一些最难的真实业务问题的模型上,这需要敏锐的解决问题思路、较好的数学能力和丰富的经验。我们需要在数据中找到模式,并通过从数据中得出的结论来产生洞察力。

  对于那些没有经验的学生来说,数据科学是一个新颖、复杂的领域。由于数据科学教育的特殊性,找到经验丰富的授课老师是大多数高校面临的最棘手的问题之一。此外,大规模数据科学海洋中存在的问题有许多不可预见的变化,这进一步使数据科学成为许多行业的难题。因此,为了保证数据科学方案的有效性,必须彻底了解问题并运用分析方法来解决问题。

  数据可以说得上是数据科学的生命线。可与之相悖的是,当今世界存在着大量数据,这些数据正在以指数速率增长扩展,并且经常成为数据科学研究的负担。为了从数据中获取有意义的信息,我们需要分析给定的数据信息并进行份额西和产生见解。然而,管理如此庞杂的数据对于高校的数据科学教育是一个很大的挑战和负担。

  随着算法变得越来越复杂,并且可以随时获得更多数据(现在每个小工具都可以生成数据)。因为时间紧缺、GPU性能不足、笔记本电脑的发展速度不足以跟上所需的计算能力等问题,越来越少的人会使用笔记本电脑来进行数据科学工作,我们将更多地使用基于云的解决方案,即使是最简单的项目(例如,Google Colab)。

  据悉,白宫已经花费了近2亿美元用于不同的数据科学项目和数据挖掘,可见数据科学教育的成本是非常高的。

  2012年3月29日,美国白宫科技政策办公室发布《大数据研究和发展计划》,成立“大数据高级指导小组”。该计划旨在通过对海量和复杂的数字资料进行收集、整理,以增强联邦政府收集海量数据、分析萃取信息的能力,提升对社会经济发展的预测能力。美国国家科学基金会、国家卫生研究院、国防部、能源部、国防部高级研究局、地质勘探局等6个联邦部门和机构宣布将进行2亿美元的投资,提高从大量数据中访问、组织、收集发现信息的工具和技术水平。同时,奥巴马政府还计划与工业界、大学研究界、非营利性机构与管理者一起利用大数据所创造的机会。这是美国政府在政策层面上将“大数据”上升到国家意志的重要举措,其影响极为深远。

  显然,数据科学正在解决问题。数据无处不在,而我们利用它的用途不断得增加,并且对社会的影响越来越大。我们不需要专注于流行语,而要关注底层技术可以实际解决的问题。

  此外,现有的数据并不总是有组织的,也就是说,数据不是以行和列的形式构造的。这给学习数据科学带来了额外的挑战。为了处理这类的数据,我们还需要掌握Hadoop 和 Spark等大数据工具的知识。这无疑增加了数据科学的学习成本,而高校开设数据科学教育的本质是分析数据。因此,数据科学教育需要专注于多种技能已然成为一项挑战

  数据科学源于多个学科。数学、统计学、编程等领域是构成数据科学的一些关键学科。然后,数据科学学习者也需要掌握这些学科中的几个子组成部分。

  虽然在个别领域拥有专业知识相对容易,但掌握所有这三个学科往往变得困难。此外,个人成为单一领域的专家需要数年时间。例如,为了精通编程,程序员往往花费数年时间来掌握他的领域。为了成为数据科学的精通大师,他将不得不花费大量的精力来掌握统计知识。

  这是为什么大多数熟练的数据科学专业人员在金融,自然科学和统计学等专业领域拥有博士学位的主要原因之一。在这些行业里,编程已经成为每个专业人士都需要学习的辅助技能。例如,追求生物统计学博士学位的人需要掌握像R这样的编程语言的命令,以实现用于生成发现的统计模型。因此,可以得出结论,为了掌握数据科学,您必须首先学习掌握数据科学的基础学科。

  虽然数据技能对于构建基础知识是必要的,但是数据科学最终还是要赋能到不同专业中去。

  只有通过解决实际项目,参加基础课程学习和从各种在线资源中获取知识,才能较熟练地掌握数据科学。但是绝大多数高校在数据科学教育上不仅师资匮乏,而且实操资源也几乎没有,这也使得高校为了建设数据科学教育需要借助外界的力量,K-Lab 教育版聚合了课程内容共建和专业导师支持、创新的数据科学教学形式的管理系统和大量数据资源的支撑。K-Lab 教育版给予了高校在数据科学教育上强有力的支撑和帮助,目前清华大学、北京大学、中国人民大学、上海交通大学、同济大学等知名院校已采用基于 K-Lab 教育版的数据科学及人工智能教学与实训平台。

  专业知识对于工程和 IT 专业人员而言,可能会很困难。比如过渡到处理客户销售预测的数据科学角色;这是因为数据科学需要专业知识来识别有用的变量,并在业务问题的背景下开发模型以及微调模型来解决实际问题,这只能通过掌握专业知识来识别业务问题中的偏差。

  在《教育部 2019 年工作要点》中,“推动教育信息化转段升级,提升师生信息素养,逐步推广编程教育。推动大数据、虚拟现实、人工智能等新技术在教育教学中的深入应用。”可以看出国家鼓励高校在原有基础上拓宽专业教育内容,形成复合专业培养新模式。各专业需要充分利用数据科学。比如:人文,自然,教育,公共政策,金融,医药,市场,制造等方向。

  对于正准备开设或已经开设数据科学教育的高校来说,知识的海洋往往是令人生畏的,需要有的放矢,数据科学在数学方面很重要,许多学生都认为想要掌握数据科学就必须掌握它的核心,既数学。但是,这种方法并不正确。

  一两年前,企业只是以“数据科学家”的身份发布职位招聘。如今,它开始变得完整。所以,如果你只是刚开始涉足“数据科学”领域,那么成为一名传统意义上的数据科学家可能会有些不知所措。在你基本掌握了某一技能之后,最好专注于特定方向。以Netflix为例,它有9个“数据科学”职位:

  数据科学是一个实用的学科。这意味着如果你只掌握理论知识而不实践的话,知识和技能就很容易被遗忘。因此,数据科学在实践中很重要,需要用正确的方法在大量的真实业务场景下来解决问题。目前一些头部高校在使用的K-Lab教育版中无缝接入丰富行业的真实数据集和大量企业的实践项目,这样才能进一步锤炼学生解决数据科学问题的能力,提前掌握业界最佳实践。

  最后,我们可以得出结论,数据科学教育是一个困难的领域,具有陡峭的学习曲线。这是缺乏平台性质的综合基础工具的主要原因之一。有许多高校的复合型专业已经开始借助数据科学领域中优质的综合基础的平台工具向学生来传授结构化的知识和实操真实项目来解决这个问题。

  11月20日,中金上海长三角科创发展大基金(南京站)签约仪式暨中金国信长三角(扬子江城市群)科创发展...

  自从电脑诞生的那天开始,“人脑是否会被电脑替代”这个问题,就一直被人类不断的探索着。5G时代...

  近日,全球领先的轮胎制造企业住友橡胶宣布,已成功研发出一项基于人工智能的新型技术“Tyre ...

  伴随着汽车产业的快速发展,汽车已经在逐步步入“智能时代”。刷脸坐车、无人驾驶、家居互联...

  自从RX 5700系列于7月份推出后,DIY硬件圈经常有“AMD YES”的口号响起,可以看出玩家们对该系列产品...

  10月18日,海尔家庭医疗战略暨新品发布会于青岛举办,众多行业大咖、渠道客户、明星用户及国内主流媒体...

  作为下半年最大的购物盛典,电商界的年度终极活动11 11已经悄然拉开帷幕,不管是线万+

  爆汁裂变案例 母婴行业如何玩转私域流量,年销售额近千万2019-12-13 18:01产经

  九号机器人这份邀请函,竟遭直男同事哄抢2019-12-13 17:57产经

  珍视用户每一滴饮用水,德国阔盛做健康饮水最后一道把关人2019-12-13 17:28产经

  百度Apollo连获两项中国设计红星奖 百度自动驾驶、车联网优势凸显2019-12-13 17:21产经

分享到:
相关阅读
文章评论 · 所有评论
评论请遵守当地法律法规
点击加载更多
© 2016-2018 12小时新闻网 http://www.12hnews.com/ 中国互联网举报中心
违法和不良信息举报:lobtom@163.com