思维导图备注

Python数据挖掘:概念、方法与实践
首页 下载 收藏书籍 阅读记录
  • 书签 我的书签
  • 添加书签 添加书签 移除书签 移除书签

第6章 文本中的命名实体识别

浏览 4 扫码
  • 小字体
  • 中字体
  • 大字体
2023-09-04 22:03:47
请 登录 再阅读
上一篇:
下一篇:
  • 书签
  • 添加书签 移除书签
  • 译者序
  • 关于审稿人
  • 前言
  • 第1章 扩展你的数据挖掘工具箱
    • 1.1 什么是数据挖掘
    • 1.2 如何进行数据挖掘
      • 1.2.1 Fayyad等人的KDD过程
      • 1.2.2 韩家炜等人的KDD过程
      • 1.2.3 CRISP-DM过程
      • 1.2.4 六步过程
      • 1.2.5 哪一种数据挖掘方法最好
    • 1.3 在数据挖掘中使用哪些技术
    • 1.4 如何建立数据挖掘工作环境
    • 1.5 小结
  • 第2章 关联规则挖掘
    • 2.1 什么是频繁项集
      • 2.1.1 都市传奇“尿布与啤酒”
      • 2.1.2 频繁项集挖掘基础知识
    • 2.2 迈向关联规则
      • 2.2.1 支持度
      • 2.2.2 置信度
      • 2.2.3 关联规则
      • 2.2.4 包含数据的示例
      • 2.2.5 附加值——修复计划中的漏洞
      • 2.2.6 寻找频繁项集的方法
    • 2.3 项目——发现软件项目标签中的关联规则
    • 2.4 小结
  • 第3章 实体匹配
    • 3.1 什么是实体匹配
      • 3.1.1 数据合并
      • 3.1.2 匹配技术
      • 3.1.3 基于属性的相似度匹配
      • 3.1.4 属性匹配方法
      • 3.1.5 利用不相交数据集
      • 3.1.6 基于上下文的相似度匹配
      • 3.1.7 基于机器学习的实体匹配
      • 3.1.8 实体匹配技术的评估
    • 3.2 实体匹配项目
      • 3.2.1 软件项目匹配的难度
      • 3.2.2 两个例子
      • 3.2.3 根据项目名称匹配
      • 3.2.4 根据人名匹配
      • 3.2.5 根据URL匹配
      • 3.2.6 按照主题和描述关键词匹配
      • 3.2.7 数据集
      • 3.2.8 代码
      • 3.2.9 结果
    • 3.3 小结
  • 第4章 网络分析
    • 4.1 什么是网络
    • 4.2 网络计量
      • 4.2.1 网络的度数
      • 4.2.2 网络直径
      • 4.2.3 网络中的通路、路径和迹
      • 4.2.4 网络的成分
      • 4.2.5 图的中心性
    • 4.3 图数据的表示
      • 4.3.1 邻接矩阵
      • 4.3.2 边表和邻接表
      • 4.3.3 图数据结构之间的差别
      • 4.3.4 将数据导入图结构中
    • 4.4 真实项目
      • 4.4.1 探索数据
      • 4.4.2 生成网络文件
      • 4.4.3 以网络的形式理解数据
    • 4.5 小结
  • 第5章 文本情绪分析
    • 5.1 什么是情绪分析
    • 5.2 情绪分析基础知识
      • 5.2.1 观点的结构
      • 5.2.2 文档级和句子级分析
      • 5.2.3 观点的重要特征
    • 5.3 情绪分析算法
    • 5.4 情绪挖掘应用
      • 5.4.1 项目动机
      • 5.4.2 数据准备
      • 5.4.3 聊天消息的数据分析
      • 5.4.4 电子邮件消息的数据分析
    • 5.5 小结
  • 第6章 文本中的命名实体识别
    • 6.1 为什么寻找命名实体?
    • 6.2 命名实体识别技术
    • 6.3 NER系统的构建与评估
      • 6.3.1 NER和部分匹配
      • 6.3.2 处理部分匹配
    • 6.4 命名实体识别项目
    • 6.5 小结
  • 第7章 自动化文本摘要
    • 7.1 什么是自动化文本摘要
    • 7.2 文本摘要工具
      • 7.2.1 使用NTLK的简单文本摘要
      • 7.2.2 使用Gensim的文本摘要
      • 7.2.3 使用Sumy的文本摘要
    • 7.3 小结
  • 第8章 文本中的主题建模
    • 8.1 什么是主题建模
    • 8.2 潜在狄利克雷分配
    • 8.3 Gensim主题建模
      • 8.3.1 理解Gensim LDA主题
      • 8.3.2 理解Gensim LDA的遍数
      • 8.3.3 对新文档应用Gensim LDA模型
      • 8.3.4 序列化Gensim LDA对象
    • 8.4 用于更大项目的Gensim LDA
    • 8.5 小结
  • 第9章 挖掘数据异常
    • 9.1 什么是数据异常
      • 9.1.1 缺失数据
      • 9.1.2 修复缺失数据
      • 9.1.3 数据错误
      • 9.1.4 离群值
    • 9.2 小结
暂无相关搜索结果!
    展开/收起文章目录

    二维码

    手机扫一扫,轻松掌上学

    《Python数据挖掘:概念、方法与实践》电子书下载

    请下载您需要的格式的电子书,随时随地,享受学习的乐趣!
    EPUB 电子书

    书签列表

      阅读记录

      阅读进度: 0.00% ( 0/0 ) 重置阅读进度