0%

PCA 算法, 也就是主成分分析法 (Principal Component Analysis), 是一种数据降维算法, 能够在尽可能保留数据特征的同时压缩数据, 降低数据复杂度, 便于数据分析的进行.

本文简要介绍 PCA 算法的基本思想与数学推导, 并在文末提供对应的 python 实现.

阅读全文 »

终于写完了最后一篇! (撒花~), 点我查看全系列内容.

虽然这个系列就此完结, 但是只是因为我觉得再写下去已经不算速通的内容了, 我只写了最基本的必需内容.

我相信如果真的好好看完了的话, 应付一下平常的作业应该绰绰有余了. 但是如果真的想要学有所获, 这个系列里的东西真的太浅了, 每一篇都只是入个门而已, 你得花上看这个系列的十倍以上的时间去学习, 去尝试.

这个系列也算是对本科四年一些知识点的总结吧, 都是蜻蜓点水般的带过, 希望日后自己再看到时, 还能够想起来都学了些啥.

就这样了, 网安本科速通, 完成!

zzz.gif

这是网安本科速通系列的最后一篇了, 主题还是 pytorch, 但是问题换成了 NLP, 并且还是以经典的文本分类作为示例, 数据集使用与前面经典问题之文本分类相同的一份小数据集, 方便进行比较.

阅读本篇前需要先看前两篇, 经典问题之文本分类基于 PyTorch 的手写数字分类. 本篇的项目代码和数据集是以前两篇作为基础的, 并且也会精简正文内容.

阅读全文 »

成为一个熟练的调包侠是速通的关键要素之一, 在无数的课程大作业和小任务中, 使用机器学习来解决一些问题算是经典中的经典典中典, 比如通过文本分类来实现垃圾邮件过滤. 因此本篇将基于 python 中最常用的机器学习库 scikit-learn, 用朴素贝叶斯模型来完成一次文本分类任务.

阅读全文 »

git 你可能用不到但是 github 肯定用得到, 因为面对一大堆代码任务, 谁都想去借鉴一下他人优秀的代码.

因此本篇将向萌新们介绍一下版本管理工具 git 与全世界最大的代码托管平台 github 的基本使用方法.

阅读全文 »

Github 时断时连? git clone 老是失败? 谷歌学术无法使用? ......

没有关系! 看了本篇以后, 从此不在担忧, 让你在互联网的世界里畅通无阻.

本篇为一篇小白入门, 旨在简单介绍解决上述问题的基本方案, 让你扫清上网时的 "最后 1 KB".

阅读全文 »