作品简介

这是一本系统、全面、理论与实践相结合的Embedding技术指南,由资深的AI技术专家和高级数据科学家撰写,得到了黄铁军、韦青、张峥、周明等中国人工智能领域的领军人物的一致好评和推荐。

在内容方面,本书理论与实操兼顾,一方面系统讲解了Embedding的基础、技术、原理、方法和性能优化,一方面详细列举和分析了Embedding在机器学习性能提升、中英文翻译、推荐系统等6个重要场景的应用实践;在写作方式上,秉承复杂问题简单化的原则,尽量避免复杂的数学公式,尽量采用可视化的表达方式,旨在降低本书的学习门槛,让读者能看得完、学得会。

吴茂贵,资深大数据和人工智能技术专家,在BI、数据挖掘与分析、数据仓库、机器学习等领域工作超过20年。在基于Spark、TensorFlow、PyTorch、Keras等的机器学习和深度学习方面有大量的工程实践实践,对Embedding有深入研究。著有《深度实践Spark机器学习》《Python深度学习:基于TensorFlow》《Python深度学习:基于Pytorch》等多部著作,广受读者好评。

王红星,不错数据科学家,任职于博世(中国)投资有限公司苏州分公司,负责BOSCH数据湖,数据分析与人工智能相关的产品与服务的设计和开发。在大数据、机器学习、人工智能方面有丰富的实践经验。

作品目录

  • 前言
  • 第一部分 Embedding基础知识
  • 第1章 万物皆可嵌入
  • 第2章 获取Embedding的方法
  • 第3章 计算机视觉处理
  • 第4章 文本及序列处理
  • 第5章 注意力机制
  • 第6章 从Word Embedding到ELMo
  • 第7章 从ELMo到BERT和GPT
  • 第8章 BERT的优化方法
  • 第9章 推荐系统
  • 第二部分 Embedding应用实例
  • 第10章 用Embedding表现分类特征
  • 第11章 用Embedding提升机器学习性能
  • 第12章 用Transformer实现英译中
  • 第13章 Embedding技术在推荐系统中的应用
  • 第14章 用BERT实现中文语句分类
  • 第15章 用GPT-2生成文本
  • 第16章 Embedding技术总结
  • 附录A 基于GPU的TensorFlow 2+、PyTorch 1+升级安装
  • 附录B 语言模型
展开全部