内容简介
《数据科学导论》共六章内容,具体安排如下。 第1章,描述了数据科学的基础概念和发展历程,对数据科学的定义、方法、工具、语言和框架做了的总体介绍。此外,第1章从教育、医疗、交通、农业、营销、用户行为特征等方面展开说明数据科学对现实生活的影响,以及从海量数据的有效性与数据共享问题揭示数据科学目前面临的机遇与挑战。 第2章,阐述了数据科学的基础知识,首先介绍了数据科学知识体系的构成,然后分别从数据获取、数据存储、数据处理这三个角度对数据科学技术架构的演化进行了探索,最后对数据科学技术的七个领域分别做出简单的介绍。 第3章,介绍了数据科学技术方法。该章首先介绍了数据科学技术方法概论和数据统计分析方法。然后详细介绍了分类技术,包括基于最近邻的分类、贝叶斯分类、神经网络分类、组合分类方法、多分类问题和分类技术应用案例。最后介绍了聚类技术,包括聚类分析、相似性度量方法、常见聚类分析方法、聚类评估和聚类技术应用。 第4章,对数据科学的一些常见应用场景进行了介绍,包括数据科学在个性化推荐、智慧医疗、电子商务和专利分析领域的应用。针对不同的应用场景,《数据科学导论》以案例为线索,对应用场景的相关概念、发展现状、面临的挑战和具体方法进行了介绍。 第5章,主要介绍了数据智能驱动的创新与创业。首先介绍了数据所蕴含的商业价值以及在数据挖掘过程中的难点及应对,然后阐述了数据驱动下的创新创业的内涵、现状与机会,并对应用案例进行讨论,最后归纳了数据驱动下的技术创新模式与管理要素。 第6章,主要介绍了数据安全与伦理问题,通过列举一些典型案例引发读者的思考,讨论了数据安全与隐私保护的对策建议和数据伦理问题的治理方案。