异常值可能是在数据采集、数据记录、数据提取等步骤中产生的,异常值的出现会对模型学习进行干扰,所以需要进行特殊处理。而在实际的生产环境中的异常值更是五花八门。
根据原数据构建了67个特征,尝试了多种算法和多次参数调优最终得分0.6925,记录过程分享一下。感觉数据指标还可以再优化,调参也还有进步空间,可以进一步优化提升。
数据分析可视化一直是短板,完全是因为不怎么用的缘故。把常用的方法整理一遍,以便用时查询。Seaborn基于 matplotlib 进一步封装。
在选择算法进行建模的时候,每种类型的算法中都有如此多可以用,我们如何选择一个最契合当前数据的模型?模型训练完之后,我们如何知道这个模型的效果?本文整理了机器学习中一些常用的评估方法
PyTorch Geometric is a library for deep learning on irregular input data such as graphs, point clouds, and manifolds. skorch. skorch is a high-level library for ...
NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。本篇主要整理了一些numpy中常用的一些方法,仅供学习记录和快速查询,还在持续更新中。
本篇笔记收集整理了一些sklearn常用方法(不包含算法的调用,算法调用详见上一篇)的调用、参数详解和调用案例,仅供学习记录和快速查询,还在持续更新中。