天猫复购预测-挑战赛——Top 0.5%

根据原数据构建了67个特征,尝试了多种算法和多次参数调优最终得分0.6925,记录过程分享一下。感觉数据指标还可以再优化,调参也还有进步空间,可以进一步优化提升。

天猫复购预测-挑战赛——Top 0.5%
朴素贝叶斯 | Naive Bayesian Model

朴素贝叶斯方法是在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立。

朴素贝叶斯 | Naive Bayesian Model
K近邻 | K-Nearest Neighbors

K近邻算法 ,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分类到这个类中。

K近邻 | K-Nearest Neighbors
支持向量机 | Support Vector Machine

SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。

支持向量机 | Support Vector Machine
逻辑回归 | Logistic Regression

逻辑回归是一种广义的线性回归分析模型,其推导过程与计算方式类似于回归的过程,但实际上主要是用来解决二分类问题(也能处理多分类问题)

逻辑回归 | Logistic Regression