聚合器-awesome-ml

机器学习的工具/教程、博客文章、资讯大汇集。“一些有趣的AI应用举例”是非专业人士也能看懂的,其它的内容则是为专业人士准备的。

机器学习的崛起:从材料设计到生物医学、量子计算......再到工业应用

面向计算机架构的机器学习

人工智能十大流行算法,通俗易懂讲明白
线性回归、 逻辑回归、 决策树、朴素贝叶斯、支持向量机(SVM)、……人工神经网络(ANN)

有了这个机器学习画图神器,论文、博客都可以事半功倍了!

画图太丑拿不出手?有人做了套机器学习专用画图模板,还有暗黑模式

“我没有机器学习的学位,却拿到了 DeepMind 研究工程师的 Offer!”

吴恩达给AI领域学生的发展建议

一些前沿研究

Jeff Dean又掀超级智能旋风!谷歌公布下一代AI框架Pathways,全知全能还省电

人工智能是否存在「大统一理论」?
各路大神发表意见。

主动学习(Active Learning)概述及最新研究

TensorFlow 决策森林来啦!

从深度学习到深度森林方法(Python)

谷歌提出最新时序框架--Deep Transformer

综合LSTM、transformer优势,DeepMind强化学习智能体提高数据效率

CVPR 2021 | 不需要标注了?看自监督学习框架如何助力自动驾驶

强化学习vs遗传算法-人工智能在模拟领域的应用

开启生成式视频压缩:谷歌基于GAN来实现,性能与HEVC相当

Jeff Dean长文展望:2021年之后,机器学习领域的五大潜力趋势

2022 年新兴深度学习趋势

【47页综述】牛津大学联合7家单位发布AutoRL综述,还在手动调参吗?你已经落后了

2202年了,“小样本”还值得卷吗?

大型课程

图灵奖得主LeCun亲授,深度学习课程在线发布|资源

是时候学习机器学习系统设计了!斯坦福CS 329S开课,课件、笔记同步更新

Jupyter笔记本实现,慕尼黑工大220页免费书籍介绍基于物理的深度学习

CMU邢波出任校长的全球首个AI大学,已招收101位学生,你心动了吗?

在家上名校——哈佛MIT等全套CS本科课程,为你备齐了!

TensorFlow 的视频学习资源哪里找,来这里看个够

针对中学生开发的初学者免费AI / ML课程入门

深度学习“四大名著”发布!Python、TensorFlow、机器学习、深度学习四件套(附免费下载)

机器学习入门指南(2021版)
----_20220109212203

《深度学习500问》正式出版!GitHub星标数超4.2万的火爆之作 | 赠书
集百家所长,凝聚了众多一线科研人员及工程师的经验,可以培养读者发现问题、解决问题、扩展问题等方面的能力,真真正正地称得上一本书入门深度学习!

周志华、李航、邱锡鹏、李沐、Aston Zhang 5位专家指导,机器之心发布ML术语中英对照词表

零散的知识点

小小几张图,把深度学习讲透彻

训练神经网络的技巧总结

深度学习探秘-了解神经网络的分步教程

神经网络的6种基本结构

炼丹侠必知的11大神经网络结构​汇总!
Perceptron、Feed-Forward Network(FNN)、Residual Networks (ResNet)、Recurrent Neural Network (RNN)、Long Short Term Memory Network (LSTM)、Echo State Networks(ESN)、Convolutional Neural Network (CNN)、Deconvolutional Neural Network (DNN)、 Generative Adversarial Network (GAN)、Auto Encoder (AE)、Variational Auto Encoder (VAE)

收藏 | 超生动图解LSTM和GPU

Transformer 架构逐层功能介绍和详细解释

TabTransformer:用于表格数据的Transformer

有史以来最好的图神经网络科普

迁移学习简介

【深度玄学】为何Bert三个Embedding可以相加

机器学习中缺失值处理方法大全(附代码)

为什么独热编码会引起维度诅咒以及避免他的几个办法

类别型特征编码大汇总!

十大重要的时间组合特征!

我们为什么要构建组合特征?

使用神经网络的自动化特征工程

优化器怎么选?一文教你选择适合不同ML项目的优化器

模型泛化不必随机训练,全批量GD媲美SGD,网友:计算成本负担不起

速度堪比Adam,准确率媲美SGD,还能稳定训练GAN:全新优化器成为NeurIPS爆款

8个深度学习中常用的激活函数
Sigmoid、tanH、Softmax、 RELU 线性整流单元、Leaky ReLU、ELU、SELU、Swish、
640-5

激活函数其实并不简单:最新的激活函数如何选择?
----_20220109220842

深度学习各种 Normalization 方法小结

模型融合方法大总结!

    1. 投票法、
    1. 平均法、
    1. 排序法
    1. Stacking
    1. Blending

CatBoost, XGBoost, AdaBoost, LightBoost,各种Boost的介绍和对比

神经网络上分的十大学习率衰减策略汇总!
分段常数衰减、指数衰减、自然指数衰减、多项式衰减、倒数衰减、余弦衰减、循环学习率衰减、线性余弦衰减、噪声线性余弦衰减、自定义学习率

如何防止我的模型过拟合?这篇文章给出了6大必备方法

  • K-折验证
  • 更多数据(包括数据增强)
  • 移除特征
  • 早停
  • 正则化(L1 惩罚的目的是优化权重绝对值的总和,L2 惩罚权重值的平方和)
  • Dropout

机器学习算法常用指标总结

评价指标为何如此必要?有哪些设计之道?

数据竞赛之训练集测试集分布检测大法!

竞赛思考:如何用多任务学习提升单任务学习的指标?

【资源推荐】深度学习模型大合集

使用Scikit-Learn pipeline 减少ML项目的代码量并提高可读性

机器学习核心知识点整理分享
----_20220109205642

强烈推荐!斯坦福讲师出版《机器学习面试》书稿,涵盖200+考点!

数学

微积分、线性代数、概率论,这里有份超详细的ML数学路线图

机器学习中的线性代数入门教程

如何入门线性代数?这里有一份Python线性代数讲义

Meta Learning / Auto ML / Auto DL / FastAI/ No-Code AI

推出 Model Search:寻找最佳 ML 模型的开源平台

推荐这三个超参优化库(附python代码)

Optuna:席卷Kaggle的调参神器,NN和树模型通吃!

【资源推荐】深度学习自动化(神经架构搜索和超参数自动优化)相关资源大列表

AutoML,攻克机器学习中超参调优难题

AutoML大提速,谷歌开源自动化寻找最优ML模型新平台Model Search

使用Fastai中的学习率查找器和渐进式调整大小提高训练效率

案例分享 | No-Code AI:用 ElasticDL 和社区 Keras 模型库实现大量小众预估场景

苹果华人研究员实现无代码深度学习!全自动AI训练平台,只需上传数据集

Auto-Sklearn:通过自动化加速模型开发周期
AutoML是对机器学习管道中的数据预处理、特征预处理、超参数优化、模型选择和评估等任务进行自动化的过程。Auto-Sklearn使用流行的Scikit-Learn机器学习框架自动完成上述任务。下面的图片展示了自动学习的工作原理。

Auto-Sklearn:使用 AutoML 加速你的机器学习模型

----_20220109221754
Auto-Sklearn使用贝叶斯优化和热启动(元学习)来找到最优的模型管道,并在最后从单个模型管道构建一个集成。让我们检查Auto-Sklearn框架中的不同组件。

可视化/可解释AI

TensorBoard的最全使用教程:看这篇就够了

TensorBoard 的主要功能包括:

  • 可视化模型的网络架构
  • 跟踪模型指标,如损失和准确性等
  • 检查机器学习工作流程中权重、偏差和其他组件的直方图
  • 显示非表格数据,包括图像、文本和音频
  • 将高维嵌入投影到低维空间

深度学习训练过程可视化(附 Github 源码)

时序可视化新绝技PyCatFlow!

TruEra 开源“TruLens”,一个用于深度学习可解释性的跨框架 Python 库

工程 / 环境 / MLOps

一文全览机器学习建模流程(Python代码)

不可错过!台湾清华大学吴尚鸿教授最新《大规模机器学习》2020教程,附教程地址

吴恩达那场十万人观看的讲座,如今有了专项课程

一文看完吴恩达最新演讲精髓,人工智能部署的三大挑战及解决方案

【视频】吴恩达演讲直指AI落地三大挑战,并提出解决方案
640-7

8大理由,让你选择MLflow管理机器学习模型

「炼丹」师的福音!支持AMD GPU,PyTorch 1.8来了!

训练大模型也不怕,轻量级TorchShard库减少GPU内存消耗,API与PyTorch相同

【模型压缩】深度卷积网络的剪枝和加速(含完整代码)

使用torch.package将pytorch模型进行独立打包

分布式机器学习中的拜占庭问题

机器学习模型部署都有哪些坑?剑桥研究者梳理了99篇相关研究

ML Metadata:ML 的版本控制
在编写代码时,您需要追踪代码进行追踪版本控制。那么 ML 的版本控制是什么?如果您正在构建生产 ML 系统,您需要能够回答如下问题:

  • 模型是基于哪个数据集进行训练的?
  • 使用了哪些超参数?
  • 创建此模型时,使用了哪个流水线?
  • 创建此模型时,使用了哪个版本的 TensorFlow(和其他库)?
  • 是什么导致了此模型失败?
  • 上次部署的模型版本是什么?

5分钟搭建强大又好用的深度学习环境

一行命令装下所有「炼丹」工具及依赖项,就靠这个免费软件源了|教程

按领域的hardcore

计算机视觉

YOLO-v4目标检测、换脸、视频上色全部实时手机端实现,美国东北大学等提出全自动实时移动端AI框架

多动图预警!AI还原古代遗迹,疫情期间带你穿越时空

PIFuHD简介:使用AI从2D图像生成人的3D高分辨率重建

可以提高你的图像识别模型准确率的7个技巧

Python让你成为AI 绘画大师,简直太惊艳了!(附代码))

搜图、裁剪一步到位,有人用YOLOv5和CLIP做了一个找图神器,在线可试用

AI靠什么超越人类修图师?万字长文看懂「美图云修」AI修图解决方案

无需卷积,完全基于Transformer的首个视频理解架构TimeSformer出炉

Gan

41 Creative Tools to Generate AI Art
AI生成图像、视频、人声、文本段落等

时序

量化 | 时间序列分析初学者指南

时间序列预测的五种策略

关于时间竞赛,不得不知的十大模型。

时域卷积网络TCN详解:使用卷积进行序列建模和预测

时间序列竞赛必知的几大神经网络模型

使用TensorFlow和深度混合学习进行时间序列预测

如何在时间序列预测中检测随机游走和白噪声

时序可视化新绝技PyCatFlow!

LSTM 和 TCN 能记住多长时间的依赖关系?

Transformer在时间序列预测中的应用

金融/量化交易

2020年度Top10文章 | 机器学习篇

机器学习应用资产管理系列一:强化学习策略​(附代码)

Two Sigma:通过机器学习识别市场状态

Optiver股票大赛Top2开源!

一文读懂:强化模型如何运用交易?

股票市场交易中的强化学习

DL炒股算法!

异常检测

用深度学习实现异常检测/缺陷检测

10分钟掌握异常检测

图神经网络应用于时间序列异常检测

推荐系统和大数据杀熟

从零开始了解推荐系统全貌

元宇宙

社区说|对话机器人技术在元宇宙之虚拟社交/虚拟替身场景下的应用

Kaggle

2020 Kaggle 10大竞赛方案汇总

Kaggle Top1% 是如何炼成的!

Kaggle 大神Dan Becker与你分享他的数据科学之旅!

我,14岁初中生,从零开始拿到了Kaggle竞赛冠军

1. kaggle竞赛宝典-竞赛框架篇!

2.1 赛题理解,分析,规划之赛题理解与分析!

2.2 kaggle竞赛宝典-回归相关指标优化!

2.3 kaggle竞赛宝典-二分类相关指标优化

2.4 kaggle竞赛宝典-多分类相关指标优化!

2.5 数据竞赛规划!

3.1 数据探索分析-全局数据探索分析!

3.2 数据探索分析-单变量数据分析!

3.3 数据探索分析-交叉变量分析篇!

3.4 训练集测试集分布不一致性探索!

4.1 kaggle竞赛宝典-样本筛选篇!

4.2 kaggle竞赛宝典-样本组织篇!

5. 验证策略设计!

6.1. 模型理解、选择--GBDT!

6.2.模型理解、选择--XGBoost!

6.3.模型理解、选择--LightGBM!

6.4.模型理解、选择--CatBoost!

7.1 特征工程--为什么要做特征工程

7.2 特征工程-无序单无序类别特征特征工程!

7.3 特征工程-有序类别变量&单数值变量特征工程!

7.4 特征工程-单时间变量特征工程!

7.5 特征工程-文本特征工程上篇!

7.6 特征工程-文本特征工程下篇!

7.7 特征工程-图像特征工程上篇!

7.8 特征工程-图像特征工程中篇!

7.9 特征工程-图像特征工程下篇!

7.10 特征工程-我们为什么要构建组合特征?

7.11 特征工程-无序类别特征+无序类别特征!

7.12 特征工程-无序类别特征+有序类别特征!

7.13 特征工程-无序类别特征+数值类别特征!

一些有趣的AI应用举例

总览

Google X的机器人开始打工!进咖啡馆擦桌子:擦的很慢,但我们一直在做

机器人咖啡师来了,口感不输咖啡大师,效率一个顶三

机器人钢管舞

人工智能评估大学申请人

【移民新闻】 好消息‼️ 加拿大签证审批时效将加快🧐使用AI系统审理签证👏🏼AI在签证审理过程中究竟扮演什么样的角色呢?

人工智能合成的音乐

一部手机,万物皆可复制粘贴,这位兼职写代码的设计师将AR玩出了新高度

10秒搞定建筑日夜景转换,还自带中秋月光

DeOldify可以使用完整的真实感渲染为您的黑白照片着色

Chimera Painter:使用 GAN 构建大量风格奇幻的卡牌游戏图像

AI Picture Restorer(AI老照片修复)

有码变高清!连头发都能还原的AI马赛克修复神器出现了

设计师你们还坐的住吗?2021 PS 进入人工智能 P 图时代

一键生成方案,AI能否干翻建筑师?

成为GPT-3的甲方,让它来帮你设计网站

蓝湖「设计图转代码」前端代码一键生成,UI 还原度高达 98%!

程序员失业第一步?斯坦福研究员用AI从编译器反馈中学习改Bug

AlphaCode:AI编程,程序员集体失业?

告别手敲 SQL ?GPT-3 自动帮你写

自动写代码指日可待!Facebook迁移学习新突破,代码补全准确率超50%!

手残党的福利:AI 自动绘画黑科技

This X Does Not Exist: AI 生成的仿真项目,比如不存在的人、车、动物等等不存在的一切

用AI「复活」逝者:「深度怀旧」项目火遍推特,我们也用民国老照片试了下

DALL·E: Creating Images from Text

OpenAI祭出120亿参数魔法模型!从文本合成图像栩栩如生,仿佛拥有人类的语言想象力
例如下面是“鳄梨形状的扶手椅”:
----_20220110212417

太赞了!英伟达又一突破,输入关键词就可以生成直逼摄影师的大片
640

没时间看电影追剧?AI 一键让影视变漫画

搜图、裁剪一步到位,有人用YOLOv5和CLIP做了一个找图神器,在线可试用

这个开源项目有点吓人:视频对象移除

MockingBird
只要几秒的原始讲话录音就能克隆该声音的中文语音克隆库

只需 3kbps 就能清晰通话,Google 又一音频神器开源!

微软 TTS(微软最新的机器语音库)

41 Creative Tools to Generate AI Art
更多AI生成图像、视频、人声、文本段落等

事故

AI 事故数据库


点此加入AI研究人员slack群,和大牛们一同交流进步。

长按下方二维码可在浏览器中阅读:

----_20220111193553