Skip to content

Latest commit

 

History

History
122 lines (68 loc) · 5 KB

awesome.md

File metadata and controls

122 lines (68 loc) · 5 KB

awesome-machine-learning

机器学习、Python和数学学习资料汇总

Medium上6900个赞的AI学习路线图,让你快速上手机器学习

100-Days-Of-ML-Code

介绍

数据挖掘通用场景:

数据挖掘普通流程

实例详解机器学习如何解决问题

PMML介绍

Engineering statistics handbook

python-machine-learning-book-2nd-edition

商业理解

遇到了什么问题,需要什么数据来解决这个问题

特征工程

有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。包括采样数据、探索数据,了解数据的特征(NA、分布、均值),数据清洗、数据预处理,特征选择,降维等。

自动化特征工具featuretools介绍---适合离线批数据预测,比如超市商品的销售额预测。

数据探索

A Comprehensive Guide to Data Exploration

特征提取

特征提取与 特征选择(Feature selection)有很大的不同: 前者意义在于把复杂的数据,如文本和图像,转化为数字特征,从而在机器学习中使用。后者是一个机器学习中应用这些特征的方法 sklearn feature extraction

数据预处理

数据预处理

数据预处理

利用 Scikit Learn的Python数据预处理实战指南

特征选择

特征选择

使用sklearn做单机特征工程

模型建立

各种机器学习算法分类总结

如何为你的机器学习问题选择合适的算法

模型评估

ROC和AUC介绍以及如何计算AUC

如何评估模型好坏

可视化

facets--Visualizations for machine learning datasets

A/B Test

推荐系统

推荐系统中基于深度学习的混合协同过滤模型

饿了么推荐系统:从0到1

旅游推荐系统的演进

深度学习在推荐领域的应用

Youtube 短视频推荐系统变迁:从机器学习到深度学习

从算法到案例:推荐系统必读的10篇精选技术文章

推荐系统中的比较流行的算法

广告引擎

小米品牌广告引擎与算法实践

Ad-papers---Papers on Computational Advertising

预测

从数理统计到机器学习——滴滴出行大数据预测体系分享与交流

机器学习系统

第四范式先知平台的整体架构和实现细节

Weiflow——微博机器学习框架

深度解密京东登月平台基础架构

DL实战

DL好玩的东西

AutoML

Algorithm

Data Robot

Auto-sklearn--auto-sklearn is an automated machine learning toolkit and a drop-in replacement for a scikit-learn estimator.

BigML

automaticstatistician

DataSet

OpenML--OpenML aims to create a novel ecosystem for machine learning experimentation. The current generation of machine learning and data mining platforms offers a wide variety of algorithms to process and model all kinds of data.

chalearn automl challenge

kaggle

python module