日常学习记录——目前学习记录总结
1 已了解或已实践内容
1. 机器学习算法相关
常用的两个算法库:sklearn、imbalanced-learn。
- 决策树算法——基于信息熵、基于信息增益、基于Gini指数
- 模糊决策树算法——决策树算法的改进版本
- 随机森林算法——基于Gini指数的CART决策树的集成学习算法
- 平衡随机森林——面向不平衡数据集的随即森林算法的改进版本
- KNN K邻近算法——分类算法
- KMeans K均值算法——求聚类中心常用算法
- 支持向量机——线性Linear-SVM分类算法、非线性SVC分类算法
- AdaBoost集成提升树算法——有基于支持向量机的,也有基于决策树的集成学习分类器
- AdaCost代价敏感算法——面向不平衡数据的集成学习分类算法
- SMOTEBoost——重采样集成分类算法
- RUSTBoost——欠采样聚类集成分类算法
2、神经网络相关:
- tensorfow框架的神经网络和卷积神经网络——因为我数据集的数据量不够,使用神经网络进行训练时,效果很差,后续没有再深入了解。
3、wireshark 自定义报文解析插件:
- Lua语言 —— 如果想在wireshark上显示中文最好使用UltraEdit进行编辑。
- 新手友好的参考文献:Lua编写Wireshark插件实战。
4、已过书单:
- 《软技能:代码之外的生存指南》
- 《软技能2:软件开发者职业生涯指南》
- 《程序员修炼之道:从小工到专家》
- 《我编程,我快乐:程序员职业规划之道》
2 未来想要深入了解的内容
1、想要过一遍的书单
- 《代码整洁之道》
- 《代码大全》
- 《修改代码的艺术》
- 《重构:改善既有代码的设计》
2、实践内容
- 《笨方法学python》——重点是学习测试用例相关的知识,想要了解更多测试驱动开发的内容。
- 算法的了解和实践。
3 内容输出
1、重要日期
- 实践内容——重要且紧急——年前完成
2、学习产出
- 《笨方法学习python》的重点知识与收获整理博客;
- 算法实践阶段性的总结博客。