内容简介
《Python文本分析》遵循结构化和综合性的方法,介绍了文本和语言语法、结构和语义的基础概念和高级概念。从自然语言和Python的基础开始,进而学习先进的分析理念和机器学习概念。全面提供了自然语言处理(NLP)和文本分析的主要概念和技术。包含了丰富的真实案例实现技术,例如构建分类新闻文章的文本分类系统,使用主题建模和文本摘要分析app或游戏评论,进行热门电影概要的聚类分析和电影评论的情感分析。介绍了基于Python和流行NLP开源库和文本分析实用工具,如自然语言工具包(nltk)、gensim、scikit-learn、spaCy和Pattern。
迪潘简·撒卡尔(Dipanjan Sarkar)Intel 数据科学家。他的主要研究领域是数据分析、商业智能、应用开发以及大型智能系统构建。他专注于数据分析实践领域已经有四年多了,通过约翰霍普金斯大学的网络公开课程获得了数据科学专业认证,并且还出版了几本关于R语言和机器学习的书。
豆瓣评论