分类 : 8个相关结果 172次浏览

数据挖掘三:相关分析

前言 哲学告诉我们世界是一个普遍联系的有机整体,现象之间客观上存在着某种有机联系。一种现象的发展变化,必然受与之相关联的其他现象发展变化的制约与影响,在统计学中这种依存关系可以分成相关关系回归函数关系两大类。 研究意义 相关系数(corre …

数据挖掘二:自动摘要

摘要 是全面准确的反映了某一文献中心内容的简单连贯的短文 自动摘要 是利用计算机自动的从原始文献中提取摘要 原理 余弦相似度 算法步骤 获取到需要摘要的文章 对该文章进行词频统计 对该文章进行分句:根据中文的标点符号进行分句 计算分句与文章 …

数据挖掘二:相似文章推荐

相似文章推荐 在用户阅读谋篇文章的时候,为用户推荐更多与在读文章内容相似的文章 概念 推荐 指介绍好的人或事物,希望被任用或接受。数据挖掘领域,推荐包括相似推荐以及协同过滤推荐 相似推荐 指当用户表现出对某人或者某物的兴趣时,为它推荐与之相 …

数据挖掘二:文本分析

1. 语料库 语料库是我们要分析的所有文档的集合 import os import os.path import codecs import pandas # 递归得到所有文件路径 file_paths = [] # 递归得到所有文件内容 …

数据挖掘一:概况

概况 定义: 从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程 作用: 解决四类问题:分类、聚类、关联、预测 方法: 决策树、神经网络、关联规则、聚类分析等 结果: 输出模型或规则 常见的商业问 …

Python 图片居中裁剪函数

import math from PIL import Image import os # 打开图片 pil_img = Image.open(‘./test.jpg’) # 创建文件夹 if os.path.exists(‘./img/’ …

Pycharm配置Qt平台

安装Qt5 pip install PyQt5 pip install PyQt5-tools 配置pycharm 打开 File -> Setting -> Tools -> External Tools 并添加 Nam …