深度学习需要掌握的 13 个概率分布(附代码)


知乎作者:Sophia转载自:深度学习自然语言处理
本文仅用于学术分享,著作权归作者所有。如有侵权,请联系后台作删文处理。
在逛Github时发现了一个不错的总结,对深度学习的概率分布进行了总结。
作者的Github开源地址:https://github.com/graykode/distribution-is-all-you-needgithub.com

1. 均匀分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py
均匀分布在 [a,b] 上具有相同的概率值,是简单概率分布。

2. 伯努利分布(离散)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py
先验概率 p(x)不考虑伯努利分布。因此,如果我们对最大似然进行优化,那么我们很容易被过度拟合。
利用二元交叉熵对二项分类进行分类。它的形式与伯努利分布的负对数相同。

3. 二项分布(离散)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py
参数为 n 和 p 的二项分布是一系列 n 个独立实验中成功次数的离散概率分布。二项式分布是指通过指定要提前挑选的数量而考虑先验概率的分布。

4. 多伯努利分布/分类分布(离散)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py
多伯努利称为分类分布。交叉熵和采取负对数的多伯努利分布具有相同的形式。

5. 多项式分布(离散)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py
多项式分布与分类分布的关系与伯努尔分布与二项分布的关系相同。

6. β分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py
β分布与二项分布和伯努利分布共轭。
利用共轭,利用已知的先验分布可以更容易地得到后验分布。
当β分布满足特殊情况(α=1,β=1)时,均匀分布是相同的。

7. Dirichlet 分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py
dirichlet 分布与多项式分布是共轭的。
如果 k=2,则为β分布。

8.伽马分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py
如果 gamma(a,1)/gamma(a,1)+gamma(b,1)与 beta(a,b)相同,则 gamma 分布为β分布。
指数分布和卡方分布是伽马分布的特例。

9. 指数分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py
指数分布是 α 为 1 时 γ 分布的特例。

10. 高斯分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py
高斯分布是一种非常常见的连续概率分布。

11. 正态分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py
正态分布为标准高斯分布,平均值为0,标准差为1。

12. 卡方分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py
k 自由度的卡方分布是 k 个独立标准正态随机变量的平方和的分布。卡方分布是 β 分布的特例。

13. t 分布(连续)代码:
https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py
t分布是对称的钟形分布,与正态分布类似,但尾部较重,这意味着它更容易产生远低于平均值的值。

相关推荐

  • 太实用了!大语言模型(LLM)主流应用技术解析
  • 阿里云发生大面积故障
  • 8个流行的Python可视化工具包
  • 建议收藏!早期人类驯服『图神经网络』的珍贵资料
  • 手握六篇顶会一作?!神仙打架我偷师!
  • 36个重要数据分析方法与模型
  • 阿里云严重故障,阿里云、钉钉、闲鱼、淘宝、语雀等都崩了...
  • 火爆 CV 顶会:今年这个方向火得不行!
  • Ai Pin被曝宣传片两处事实错误;微软Copilot已与PDF集成;中科大利用AI合成催化剂丨AIGC大事日报
  • 比英伟达H100快90%!最强大模型AI芯片来了,首搭141GB HBM3e
  • 网络故障不再烦恼:一文读懂以太网接口物理DOWN故障及解决方案!
  • 干货 | 携程后台低代码平台的探究与实践
  • 刚刚!奥特曼终于透露了GPT-5的最新消息!
  • 史上最强AI芯片!英伟达H200震撼来袭!141 GB 超大显存,Llama2推理性能翻倍,老黄赢麻了!
  • ES5到ES2022,看 JavaScript 如何一跃成为前端之王
  • 难住了,微服务之间的几种调用方式哪种最佳?
  • 面了一个字节出来的大佬,见识到了基础天花板!
  • 答读者问:关于隐式 id 重复的问题
  • Java手写分布式锁的实现(非常牛逼)
  • 单机幂等性的 6 种实现方案