作品简介

本书从逻辑上看分为三大部分。第一部分(第1~2章)介绍语言理解的基础概念与环境搭建。其中,第1章介绍人机交互的演变历史及技术变革。第2章介绍前置技术,重点涵盖PyTorch、TorchText、Jieba等自然语言处理学习库的使用方法。第二部分(第3~8章)介绍自然语言处理和人机交互相关的核心技术。本书强调理论与实战并行,在介绍相关核心技术的同时,每章针对相应核心算法展开实战,在真实中文数据集下验证算法性能,让读者从更深层面了解相关算法。第3章主要介绍中文分词技术,包含分词概念、分类体系、常见分词算法,并针对HMM算法进行实战。第4章主要介绍数据预处理相关内容,重点关注TorchText针对数据预处理与构建数据集的使用。词向量(第5章)、序列标注(第6章)、文本分类(第7章)、文本生成(第8章)作为4种核心技术将分别单独介绍。第三部分(第9~12章)通过讲解人机交互中4个不同类型的高阶技术,帮助读者了解人机交互中的深层技术。其中包括对话生成(第9章)、知识图谱问答(第10章)、自然语言推理(第11章)和实体语义理解(第12章)。

杜振东,涂铭编著

作品目录

  • 前言
  • 第1章 人机交互导论
  • 1.1 图灵测试
  • 1.2 专家系统
  • 1.3 人机交互
  • 1.4 机器人形态
  • 1.5 本章小结
  • 第2章 人机对话前置技术
  • 2.1 深度学习框架
  • 2.2 搭建NLP开发环境
  • 2.3 TorchText的安装与介绍
  • 2.4 本章小结
  • 第3章 中文分词技术
  • 3.1 分词的概念和分类
  • 3.2 规则分词
  • 3.3 统计分词
  • 3.4 混合分词
  • 3.5 Jieba分词
  • 3.6 准确率评测
  • 3.7 本章小结
  • 第4章 数据预处理
  • 4.1 数据集介绍
  • 4.2 数据预处理
  • 4.3 TorchText预处理
  • 4.4 本章小结
  • 第5章 词向量实战
  • 5.1 词向量的由来
  • 5.2 word2vec
  • 5.3 glove
  • 5.4 word2vec实战
  • 5.5 glove实战
  • 5.6 本章小结
  • 第6章 序列标注与中文NER实战
  • 6.1 序列标注任务
  • 6.2 序列标注的技术方案
  • 6.3 序列标注实战
  • 6.4 BiLSTM
  • 6.5 BiLSTM-CRF
  • 6.6 本章小结
  • 第7章 文本分类技术
  • 7.1 TFIDF与朴素贝叶斯
  • 7.2 TextCNN
  • 7.3 FastText
  • 7.4 后台运行
  • 7.5 本章小结
  • 第8章 循环神经网络
  • 8.1 RNN
  • 8.2 LSTM
  • 8.3 GRU
  • 8.4 TextRNN
  • 8.5 TextRCNN
  • 8.6 实战案例之诗歌生成
  • 8.7 本章小结
  • 第9章 语言模型与对话生成
  • 9.1 自然语言生成介绍
  • 9.2 序列生成模型
  • 9.3 经典的seq2seq框架
  • 9.4 Attention机制
  • 9.5 Bert——自然语言处理的新范式
  • 9.6 聊天机器人实战
  • 9.7 本章小结
  • 第10章 知识图谱问答
  • 10.1 知识图谱概述
  • 10.2 关系抽取
  • 10.3 人物间关系识别
  • 10.4 图谱构建
  • 10.5 基于深度学习的知识图谱问答模块
  • 10.6 本章小结
  • 第11章 自然语言推理
  • 11.1 自然语言推理介绍
  • 11.2 自然语言推理常见模型
  • 11.3 多轮对话中的答案导向问题
  • 11.4 答案导向问题的实战
  • 11.5 本章小结
  • 第12章 实体语义理解
  • 12.1 实体语义理解简介
  • 12.2 现有语义理解系统分析
  • 12.3 实体语义理解的技术方案
  • 12.4 实体语义理解实战
  • 12.5 数值解析实战
  • 12.6 时间解析实战
  • 12.7 本章小结
展开全部