感知机学习算法

本文是读李航博士《统计学习方法》第二章的笔记总结。
感知机是用于二类分类的线性分类器,如果数据线性不可分,我觉得可以采用提升数据维度的方法来使得数据在更高的维度上线性可分。如果要用于多类别分类,可以循环使用感知机,每次分出一个类。
本文主要探讨两个问题,1.感知机是如何用于数据线性分类的? 2.[……]

→Continue→

通过Poi解析Excel文档

这是昨天在做文本处理时候遇到的问题。接着上一篇的爬虫神器,我把数据搞下来以后,发现了如下的状况:POJ1

同样的数据,每条数据的内容都是url+标题+正文,一共2w条左右。三种数据格式都是神器爬取完导出的,html格式的 11MB左右,txt格式 380MB左右 ,xlsx 23MB左右。

用J[……]

→Continue→