动态规划实现编辑距离的计算

编辑距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
由于这个概念是俄罗斯科学家Vladimir Levenshtein在1965年提出的,因此编辑距离又称为Levenshtein Distance。这个是典[……]

→Continue→

感知机学习算法

本文是读李航博士《统计学习方法》第二章的笔记总结。
感知机是用于二类分类的线性分类器,如果数据线性不可分,我觉得可以采用提升数据维度的方法来使得数据在更高的维度上线性可分。如果要用于多类别分类,可以循环使用感知机,每次分出一个类。
本文主要探讨两个问题,1.感知机是如何用于数据线性分类的? 2.[……]

→Continue→

python小脚本爆破登录密码

说明,纯属练手,不许做坏事,出事后果自负。

这个月忙的不行,所有的事情堆在一起了。毕业设计论文、答辩、创新项目结题、实验室项目……在这个月的最后一天还是写一点东西纪念下这个忙碌的五月吧。有那么半个月一直在思考人为什么要活着以及人应该怎么样活着的问题,整个人状态都有点抽风。废话不多说,心[……]

→Continue→

通过Poi解析Excel文档

这是昨天在做文本处理时候遇到的问题。接着上一篇的爬虫神器,我把数据搞下来以后,发现了如下的状况:POJ1

同样的数据,每条数据的内容都是url+标题+正文,一共2w条左右。三种数据格式都是神器爬取完导出的,html格式的 11MB左右,txt格式 380MB左右 ,xlsx 23MB左右。

用J[……]

→Continue→

JavaScript闭包

        说到闭包,首先就要说到变量的作用域,而JavaScript的变量作用域无非两种:全局变量和局部变量。

一.局部变量与全局变量

在JavaScript中,函数外部无法读取函数内部的变量,函数内部可以读取全局函数的变量(也就是其父类的所有变量)。但是 ,如果函数内部,不用va[……]

→Continue→

Python读取文件的几种方式

参数说明:

r 只读方式 r+ 读写方式

w 写入方式,若原文件存在,先删除原文件内容 再重新写入新的内容。

w+ 读写方式,若原文件存在,先删除原文件内容 再重新写入新的内容。

a 写入方式,若原文件存在,在追加内容。

a+ 读写方式,若原文件存在,在追加内容。[……]

→Continue→