python做一个对话文本的主题模型分析

weixin_44810214 2019-04-02 11:25:10
有大佬能帮忙做一下吗?有偿。文本不到2M,相关资料准备好了。
...全文
174 回复 打赏 收藏 转发到动态 举报
写回复
用AI写文章
回复
切换为时间正序
请发表友善的回复…
发表回复
从新闻和演讲到社交媒体上的非正式聊天,自然语言是最丰富,最未充分利用的数据来源之一。它不仅源于不断变化,而且始终在变化和适应环境; 它还包含传统数据源未传达的信息。解锁自然语言的关键是通过文本分析的创造性应用。这本实用的书介绍了数据科学家使用应用机器学习构建语言感知产品的方法。 您将学习使用Python进行文本分析的强大,可重复和可扩展的技术,包括上下文和语言特征工程,矢量化,分类,主题建模,实体解析,图形分析和可视化控制。在本书的最后,您将配备实用的方法来解决任何复杂的现实问题。 将文本预处理和矢量化为高维特征表示 执行文档分类和主题建模 通过可视化诊断引导模型选择过程 提取关键短语,命名实体和图形结构以推理文本中的数据 构建一个对话框架,以启用聊天机器人和语言驱动的交互 使用Spark来扩展处理能力和神经网络以扩展模型复杂性 From news and speeches to informal chatter on social media, natural language is one of the richest and most underutilized sources of data. Not only does it come in a constant stream, always changing and adapting in context; it also contains information that is not conveyed by traditional data sources. The key to unlocking natural language is through the creative application of text analytics. This practical book presents a data scientist’s approach to building language-aware products with applied machine learning. You’ll learn robust, repeatable, and scalable techniques for text analysis with Python, including contextual and linguistic feature engineering, vectorization, classification, topic modeling, entity resolution, graph analysis, and visual steering. By the end of the book, you’ll be equipped with practical methods to solve any number of complex real-world problems. Preprocess and vectorize text into high-dimensional feature representations Perform document classification and topic modeling Steer the model selection process with visual diagnostics Extract key phrases, named entities, and graph structures to reason about data in text Build a dialog framework to enable chatbots and language-driven interaction Use Spark to scale processing power and neural networks to scale model complexity

37,722

社区成员

发帖
与我相关
我的任务
社区描述
JavaScript,VBScript,AngleScript,ActionScript,Shell,Perl,Ruby,Lua,Tcl,Scala,MaxScript 等脚本语言交流。
社区管理员
  • 脚本语言(Perl/Python)社区
  • IT.BOB
加入社区
  • 近7日
  • 近30日
  • 至今

试试用AI创作助手写篇文章吧