ValueError Image size of xxx pixels is too large问题解决方法

    有同学使用matplotlib绘图的时候,会出现以下错误:        ValueError: Image size of -2025283020x23231338 pixels is too large. It must be less ...... >>查看全文

2017-12-12 11:25:19


ValueError Expected 2D array, got 1D array instead 问题的解决方法

        有学员在学习《Python数据挖掘实战》(http://study.163.com/course/introduction/1002827011.htm)的时候,执行课时6.1的代码的时候,会出现以下异常:Traceback (most recent call last):  File "<ipython-input-24-e...... >>查看全文

2017-12-11 17:17:36


十八大与十九大报告全文分词绘制词云图

一、素材准备    在网上找到十八大报告全文与十九大报告全文,链接如下所示:            1、胡锦涛在中国共产党第十八次全国代表大会上的报告(http://cpc.people.com.cn/n/2012/1118/c64094-19612151-1.html)     &nbs...... >>查看全文

2017-10-25 15:54:57


使用Maven搭建Spark学习环境

    《Spark数据分析实战》课程,自2016年01月13日推出到现在,已经有了一年半的时间,一年半相对于开源社区而言,基本上属于一个朝代的更换了。Spark也从当时的1.6升级到了目前的2.2,飞跃式的更新,稍不留神,课程中的环境,对编程基础薄弱的同学来说,搭建起来可能有些难度了。因此,本文作为课程的一个补充,让大家使用一种更加简单的方式来搭建本课程的学习环境。    新建Maven项目1、File ...... >>查看全文

2017-08-28 17:39:05


使用社会网络分析,探索新浪微博热点事件的背后

一、数据收集:        根据关键字“男友力挺女友辞职后反悔”,对新浪微博的热门话题进行搜索,得到热门微博后,再根据热门微博获取所有的回复和转发。    代码片段 根据关键字搜集热门微博代码片段 根据热门微博,获取对应的评论代码片段 根据热门微博,获取对应的转发    经过这三步的处理后,得到以下数据:&...... >>查看全文

2017-08-20 20:25:46


pandas指定列的数据类型进行数据的导入

    今天有学员问到,使用pandas.read_csv,可以使用dtype进行列数据类型的指定,但是如果使用read_excel的话,就不行,会有如下的错误提示:    后来通过谷歌搜索,可以得到,在使用read_excel方法的时候,正确的指定列的数据类型的导入方法如下:        data = pandas...... >>查看全文

2017-07-21 14:30:09


matplotlib绘图设置坐标原点

    有学员在学习逻辑回归的时候,问到如何绘画出Sigmoid函数,如下图所示:    要画出这个函数还是挺简单的,如下图所示:        这时候,问题就来了,如何让坐标轴的原点坐落在(0,0)点呢?        下面就是在matplotlib中,把坐...... >>查看全文

2017-07-21 09:16:54


关于R安装github包出现问题的解决方案

    这今天,想学习一下百度的地图绘图包,但是之前从github使用源码进行安装,总是安装不成功,问题如下:> library(devtools)> install_github('badbye/baidumap')Installation failed: Problem with the SSL CA cert (path? acc...... >>查看全文

2017-07-19 10:47:37


在最新版本MAC(版本:10.12)以上安装graphviz的方法

    要安装graphviz,首先需要下载对应的版本,官网的版本选择如下所示:    我的机器上的MAC版本为10.12.5,但是里面缺没有这个版本,因此,我第一次选择了 graphviz-2.40.1.pkg 进行下载,可以安装后,出错了,无法使用。        出错信息如下:   ...... >>查看全文

2017-07-19 10:10:10

每页 10 条 1 2 3 4 共 96 篇文章