思维驿站

思考的停滞才是真正的懒惰


  • 首页

  • 归档

  • 标签

Pandas缺失处理

发表于 2021-01-02 | 分类于 技术文章 , 数据科学 , Pandas
实际分析的数据常常存在缺失,要使用统计方法或机器学习的算法,必须先处理好缺失的数据。1import pandas as pd 查看缺失缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,如果想要查看某一列缺失或者非缺失的行,可以利用 Series 上的 isn ...
阅读全文 »

Pandas索引访问

发表于 2020-12-21 | 分类于 技术文章 , 数据科学 , Pandas
索引操作可以方便地获取 Pandas 基础数据结构中的指定元素。1import pandas as pd 索引器 DataFrame 的索引形式是列索引,即通过 [列名] 的形式可以从 DataFrame 中取出相应的列。如果是单个列名,则返回一个 Series 对象;如果是多个列名组成的列表,则返 ...
阅读全文 »

Pandas基础知识

发表于 2020-11-17 | 分类于 技术文章 , 数据科学 , Pandas
从文件中读取数据,并使用 Pandas 的基本数据结构(Series 和 DataFrame)进行数据简单分析和处理,最后将新的数据结果保存到文件里,这就是基本的 Pandas 操作。1import pandas as pd 读取数据最常见的文件主要是csv、excel 和 txt,所以我们重点介绍 ...
阅读全文 »

Python快速自然语言处理

发表于 2020-10-07 | 分类于 技术文章 , 数据科学 , 数据处理
数据分析中往往会遇到很多文本数据,我们需要借助一些开源的工具,快速地对这些文本数据进行简单的处理与分析。本文整理了一些基于 sklearn、nltk 等工具包进行快速 NLP 处理的常用实例,不涉及 NLP 理论知识,模型与方法的选型也不是最优的,只求快速。 字符编码Python3 开始字符在 py ...
阅读全文 »

BeautifulSoup详解

发表于 2020-10-03 | 分类于 技术文章 , 编程语言 , Python
我们解析网页最大的难点就在于其 HTML 源码是一长串复杂的字符串,而 BeautifulSoup 恰好提供了将其解析为特定的数据结构的能力,这样我们就可以通过 “访问属性” 和 “调用方法” 的方式快速获取网页中的指定内容。 解析器BeautifulSoup 支持 Python 标准库中的 HTM ...
阅读全文 »

用Python处理Excel

发表于 2020-10-01 | 分类于 技术文章 , 编程语言 , Python
Excel 是 Windows 环境下强大的电子表格程序,Python 提供了许多处理 Excel 文件的工具包,我们在本文中总结了 openpyxl(处理 xlsx 文件)、xlrd 和 xlwt(处理 xls 文件) 这三个工具包的基本应用方法。下文中使用的两个数据集 example.xlsx ...
阅读全文 »

Tensorflow的基本开发步骤

发表于 2020-09-16 | 分类于 技术文章 , 深度学习 , Tensorflow
本节通过一个简单的逻辑回归实例来熟悉Tensorflow的开发流程,整个流程可以总结为五个步骤:准备数据、搭建模型、迭代训练、评价分析、使用模型。 准备数据一般地,根据具体的任务,我们会得到一定的标注数据,我们通常会把数据拆分为训练集、验证集和测试集,训练集用来训练模型,验证集用来调参,测试集用来评 ...
阅读全文 »

Tensorflow的基本操作

发表于 2020-08-22 | 分类于 技术文章 , 深度学习 , Tensorflow
这一篇博文我们集中梳理了Tensorflow常用的基础操作与对应的函数,熟练掌握这些操作可以为后续使用Tensorflow构建深度神经网络扫清障碍。 数据操作算术运算 函数 描述 tf.assign(x, y, name=None) 令x=y tf.add(x, y, name=N ...
阅读全文 »

预测房价的回归问题

发表于 2020-08-15 | 分类于 技术文章 , 深度学习 , Keras
回归问题是通过一系列的已知数据预测未来的值,这个待预测的值是一个连续值。我们使用20世纪70年代中期波士顿郊区房价的数据来进行回归问题的讨论。 数据准备同样的,我们可以使用Keras的内嵌函数加载这批数据,如果网络不支持自动下载,你可以选择事先下载好的数据。 123456from keras.dat ...
阅读全文 »

电影评论的情感极性分析

发表于 2020-08-13 | 分类于 技术文章 , 深度学习 , Keras
这一节我们将使用Keras构建一个用于分析情感极性的神经网络模型,我们使用的是IMDB数据集,其中包含了50000条严重两极分化的评论。我们将从数据的准备开始,一步一步地讨论深度学习的实践方法论。 数据准备Keras内置了下载IMDB数据的接口,但由于网络权限的原因,我们采用浏览器事先从网络上下载I ...
阅读全文 »
<1234>
rouseway

rouseway

在这里留下一些思考的痕迹

33 日志
18 分类
19 标签
© 2022 rouseway
由 Hexo 强力驱动
主题 - NexT.Pisces