自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

deephub

关注同名微信公众号,获取更多AI干货

原创 发家致富靠AI:使用keras预测NBA比赛赚钱,回报率136%
原力计划

投注者和博彩者没有太多共同点——人们可以把他们的关系描述为一场竞争、决斗、战争。但在梦中,他们却为同样的幻想而垂涎三尺:一个完美的预测模型,使用它能够精确地预测出未来游戏的结果。通过深入学习,这或许是可能的——或者至少比以前的数据科学技术更容易。 基本假设是NBA市场效率低下(价格或投注线...

2020-04-30 13:18:57 4394 0

原创 Pytorch贝叶斯深度学习库BLiTZ实现LSTM模型预测时序数据并绘制置信区间
原力计划

本文将主要讲述如何使用BLiTZ(PyTorch贝叶斯深度学习库)来建立贝叶斯LSTM模型,以及如何在其上使用序列数据进行训练与推理。 在本文中,我们将解释贝叶斯长期短期记忆模型(LSTM)是如何工作的,然后通过一个Kaggle数据集进行股票置信区间的预测。 贝叶斯LSTM层 众所周知,LSTM...

2020-04-29 13:02:08 9017 8

原创 TensorFlow还是PyTorch?哪一个才更适合编写深度神经网络?
原力计划

编程实现神经网络的最佳框架是什么?TensorFlow还是PyTorch?我的回答是:别担心,你从哪一个入门,你选择哪一个并不重要,重要的是自己动手实践!下面我们开始吧! 这两种框架都提供了编程神经网络常用的机器学习步骤: 导入所需的库 加载并预处理数据 定义模型 定义优化器和损失函数 ...

2020-04-28 14:42:41 4748 0

原创 Python可视化分析和预测大型流行病和COVID19如何影响金融市场
原力计划

通过过去流行病的信息,并定量分析对金融市场的影响。 使用Python可视化并分析数据 我们正处于一个不确定的环境中,这也反映在金融市场上。 您会遇到很多问题,例如COVID19将如何影响金融市场,股市将下跌多少,何时结束以及如何结束。 在本文中,我们将分析并借鉴过去的流行病信息来回答...

2020-04-27 12:39:55 4945 0

原创 在Python中进行探索式数据分析(EDA)
原力计划

介绍 探索性数据分析(Exploratory Data Analysis ,EDA)是对数据进行分析并得出规律的一种数据分析方法。它是一个故事,一个数据试图讲述的故事。EDA是一种利用各种工具和图形技术(如柱状图、直方图等)分析数据的方法。 根据Tukey的说法(1961年的资料分析) “分...

2020-04-26 13:49:45 4298 0

原创 ML 模型不等于“黑盒”:explainable AI 可解释的人工智能
原力计划

可解释的人工智能(explainable AI) 是机器学习领域热门话题之一。 机器学习模型通常被认为是“黑盒”,具有内部不可知的特性。因此这些模型在应用时,往往需要首先获取人们的信任、明确其误差的具体含义、明确其预测的可靠性。 本文中,我们将探讨 explainable AI 的内涵及其重要性,...

2020-04-25 13:09:52 4503 0

原创 为数据科学家解释概率统计中最重要的概念:马尔可夫链
原力计划

每个数据科学家一旦开始研究统计模型,就会遇到马尔可夫链和马尔可夫过程这两个术语。本文将以一种易于理解的方式解释马尔可夫过程的基本概念。 马尔可夫链广泛应用于金融、汽车、食品、博彩业,在日常生活中几乎无处不在。因此,这是所有统计学家必须知道的话题。 天气、赌博、股价、人类行为等都是马尔可夫过程。...

2020-04-24 13:21:06 4164 0

原创 5分钟了解神经网络的激活函数:有效的改善模型学习模式的能力
原力计划

机器学习是一个使用统计学和计算机科学原理来创建统计模型的研究领域,用于执行诸如预测和推理之类的主要任务。 这些模型是给定系统的输入和输出之间的数学关系集。 学习过程是估计模型参数的过程,以便模型可以执行指定的任务。 学习过程会尝试使机器具有学习能力,而无需进行显式编程。 这是ANN的作用。 什么是...

2020-04-23 13:12:07 4748 0

原创 新换脸模型FaceShifter的论文简单而完整解释
原力计划

如今,深度学习可以在图像合成和处理领域产生惊人的效果。我们已经看到了这样一些例子:使想象中的人产生幻觉的网站,展示名人说从未说过的话的视频,以及使人们跳舞的工具。这些例子都足够的真实可以愚弄我们大多数人。其中一个新颖的壮举是FaceShifter[1],这是一个深度学习模型,它可以在优于最新技术的...

2020-04-22 13:13:52 4408 2

原创 NLP中的预处理:使用Python进行文本归一化
原力计划

我们在有关词干的文章中讨论了文本归一化。 但是,词干并不是文本归一化中最重要(甚至使用)的任务。 我们还进行了其他一些归一化技术的研究,例如Tokenization,Sentencizing和Lemmatization。 但是,还有其他一些用于执行此重要预处理步骤的小方法,将在本文中进行讨论。 ​...

2020-04-21 13:18:53 4903 0

原创 人工智能算命 在Python中通过 自然语言处理 预测人格类型:写一篇文章,能认出你是谁
原力计划

你在网上发布了多少关于你自己的信息?好吧,在当今时代可能有很多。我们不断地联系在一起,与很多人分享生活中的瞬间,无论这些人是否认识我们。这很好,只要你决定你想展示什么。但是,如果我告诉你,通过写文章,你所展示出的隐私超过你所意识到的内容呢? 我们可以想象,一个人的写作风格可能与他或她的个性有...

2020-04-20 13:07:03 4518 0

原创 KaggleM5 Forecasting:传统预测方法与机器学习预测方法对比
原力计划

本文的出发点在于比较传统预测方法和机器学习预测方法。 本文使用的数据集来自 kaggle:M5 Forecasting — Accuracy。 该数据集包含有 California、Texas、Wisconsin 三个州的产品类别、部门、仓储信息等。基于这些数据,需要预测接下来 28 天的每日销售...

2020-04-19 09:42:36 7029 5

原创 在Python中使用qiskit 包进行量子计算机编程
原力计划

一个普遍的误解是,量子计算机尚未准备好进行市场应用,并且该技术还需要很多年才能使用。在本文中,我们将介绍对量子计算机进行编程的一些基本原理, 并消除这种误解。我们将研究免费的开源软件:IBM研发的QISKit ,以及量子机器学习软件 PennyLane 。我们还将介绍如何在IBM的云端量子计算机上...

2020-04-18 09:00:45 5469 0

原创 OpenAI 开源新的深层神经网络神经元可视化Python库 Microscope和 Lucid
原力计划

可解释性是深度学习中最具挑战性的方面之一。理解一个神经网络,它有成千上万的神经元分布在数千个隐藏层中。大多数深层神经网络的互联性和复杂性使其不适合于传统的调试工具。 因此,数据科学家通常依赖可视化技术来帮助他们理解神经网络是如何做出决定的,这成为一个持续的挑战。为了推进这一领域的发展,OpenAI...

2020-04-17 13:01:18 3919 0

原创 推荐系统中的相似度度量
原力计划

您是否曾经想过Netflix是如何向您推荐您感兴趣的电影?或者亚马逊如何向您推荐难以抵制购买的产品? 显然,这些网站已经弄清了您喜欢看或买的东西。他们在后台运行一段代码,该代码可以在线收集有关用户行为的数据,并预测该用户对特定内容或产品的喜好。这种系统称为“推荐系统。 广义上讲,有两种开发推荐...

2020-04-16 13:01:49 2849 0

原创 Mask R-CNN上手指南:通过对象检测和分割实现对无人机的检测
原力计划

目标检测是一种计算机视觉技术,用于识别和定位图像中的目标。有很多检测算法存在,这里有一个很好的总结。 Mask R-CNN是目标检测的扩展,它为图像中检测到的每个目标生成边界框和分割掩模。这篇文章是关于使用Mask R-CNN训练自定义数据集的指南,希望它能帮助你们中的一些人简化这个过程。 ht...

2020-04-15 12:46:25 3697 0

原创 使用Python和GloVe词嵌入模型提取新闻和文章的文本摘要
原力计划

文章摘要是一个简短的段落,其中包含要点,并以文章本身使用的词语来表达。通常,我们仅提取那些我们认为最重要的要素/句子,这些要素/句子通常传达主要思想或必要的支撑点。 摘要不是文章的分析,摘要和分析是不同的东西。摘要在很多情况下很有用,例如,获得一篇篇幅较大的文章的要点,用通俗单词介绍一个复杂的想法...

2020-04-14 13:17:57 3564 0

原创  如何用Python计算特征重要性?
原力计划

特征重要性评分是一种为输入特征评分的手段,其依据是输入特征在预测目标变量过程中的有用程度。 特征重要性有许多类型和来源,尽管有许多比较常见,比如说统计相关性得分,线性模型的部分系数,基于决策树的特征重要性和经过随机排序得到重要性得分。 特征重要性在预测建模项目中起着重要作用,包括提供对数据、模...

2020-04-13 13:41:54 4751 0

原创 在python中使用SageMaker Debugger进行机器学习模型的开发调试
原力计划

在python中使用SageMaker Debugger进行机器学习模型的开发调试 如果你从事软件开发,你就会知道 Bug 是生活的一部分。当你开始你的项目时,Bug 就可能存在,当你把你的产品交付给客户时,Bug 也可能存在。在过去的几十年中,软件开发社区已经开发了许多的技术工具、IDE、代码...

2020-04-12 10:31:31 3345 1

原创 不需要锚框:一种全卷积 One-Stage 目标检测算法(FCOS)
原力计划

本文来源于 ICCV'19 上发表的一种新的目标检测技术 FCOS :全卷积 One-Stage 目标检测算法。该算法提出了一种非常直观和简单的方法来解决目标检测问题,本篇文章是对该算法的总结。 本文内容框架 基于锚框的检测器(Anchor-Based Detectors) 全...

2020-04-11 09:45:35 3323 0

原创 通过 Python 代码实现时间序列数据的统计学预测模型
原力计划

通过 Python 代码实现时间序列数据的统计学预测模型 在本篇中,我们将展式使用 Python 统计学模型进行时间序列数据分析。 *** 问题描述 *** 目标:根据两年以上的每日广告支出历史数据,提前预测两个月的广告支出金额。 原始数据:2017-01-01 到 2019-09-23 期间的每...

2020-04-10 13:16:40 3548 2

原创 在Python中使用K-Means聚类和PCA主成分分析进行图像压缩
原力计划

在Python中使用K-Means聚类和PCA主成分分析进行图像压缩 各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的...

2020-04-09 13:30:16 5786 4

原创 假新闻无处不在:我创建了一个通过深度学习的方法标记假新闻的开源项目
原力计划

​ 虚假新闻的兴起迫使拥有社交媒体帐户的每个人都成为一名侦探,负责在发布前确定帖子是否真实。但是,虚假新闻仍然会越过我们的防线,在网络上迅速扩散,由于用户的无知和粗心而加剧。正如NBC新闻报道所显示的那样,假新闻不仅会散布恐惧和虚假信息,而且还可能对公司和个人的声誉造成损害。为了减少错误信息的直...

2020-04-08 13:38:31 4275 0

原创 使用PyTorch Lightning构建轻量化强化学习DQN
原力计划

本文旨在探究将PyTorch Lightning应用于激动人心的强化学习(RL)领域。在这里,我们将使用经典的倒立摆gym环境来构建一个标准的深度Q网络(DQN)模型,以说明如何开始使用Lightning来构建RL模型。 在本文中,我们将讨论: 什么是lighting以及为什么要将它应用于RL ...

2020-04-07 13:30:53 4371 0

原创 使用GAN绘制像素画,用机器学习的方式协助绘画者更快地完成作品
原力计划

Sprite生产的几个阶段。 即草图,线条图,底纹,区域上色和索引。 上面的图片来自Trajes Fatais:Feats of Fate游戏,我作为首席开发者从事该游戏的制作。 长话短说,每个精灵要绘制大约一小时,每个角色平均要绘制五百个精灵。 在“游戏的机器学习辅助资料生成:像素绘画Spri...

2020-04-06 11:12:14 3142 0

原创 利用数据可视化和相关历史背景分析在COVID-19影响下美国股市暴跌
原力计划

如果你不知道过去两个月美国股市的下跌,那么你要么是个象牙塔里的大学生,要么是个既没有任何投资又没有要还一辈子的助学贷款的低级工人。不管怎样,不管你是否有没有在股票市场投入了大量家底,你都应该知道过去几周发生了什么。无论你在这场危机中是幸运还是不幸,你都目睹了一场黑天鹅事件。 小贴士:Invest...

2020-04-05 21:12:45 5822 2

原创 机器学习的统计方法 贝叶斯决策理论入门
原力计划

引言 无论你是在建立机器学习模型还是在日常生活中做决定,我们总是选择风险最小的方案。作为人类,我们天生就采取任何有助于我们生存的行动;然而,机器学习模型最初并不是基于这种理解而建立的。这些算法需要经过训练和优化,以选择风险最小的最优方案。此外,很重要的一点在于,我们必须明白,如果某些高风险的决定做...

2020-04-04 20:36:44 3326 0

原创 Python实现固定效应回归模型实现因果关系推断
原力计划

​ 众所周知,“相关并不意味着因果关系”。 我要告诉你,相关可以表示因果关系,但需要一定条件。 这些条件已在计量经济学文献中被广泛讨论。 在本文中,我将以一种易于理解的方式对其进行总结。 我将解释如果不满足这些条件为什么标准的普通最小二乘(OLS)无法确定因果关系。 然后,我将介绍可以提供有效解...

2020-04-03 14:02:25 30663 6

原创 神奇的Batch Normalization 如果一个模型仅训练BN层会是什么样的
原力计划

您可能会感到惊讶,但这是有效的。 ​ 最近,我阅读了arXiv平台上的Jonathan Frankle,David J. Schwab和Ari S. Morcos撰写的论文“Training BatchNorm and Only BatchNorm: On the Expressiv...

2020-04-03 12:47:01 24608 0

原创 解决过拟合:如何在PyTorch中使用标签平滑正则化
原力计划

什么是标签平滑?在PyTorch中如何去使用它? 在训练深度学习模型的过程中,过拟合和概率校准(probability calibration)是两个常见的问题。一方面,正则化技术可以解决过拟合问题,其中较为常见的方法有将权重调小,迭代提前停止以及丢弃一些权重等。另一方面,Platt标度法和iso...

2020-04-02 13:13:07 6016 0

原创 机器学习项目模板:ML项目应遵循的6个基本步骤
原力计划

每个机器学习项目都有自己独特的形式。 对于每个项目,都可以遵循一组预定义的步骤。 尽管没有严格的流程,但是可以提出一个通用模板。 1.准备问题 不仅是机器学习,任何项目的第一步都是简单地定义当前的问题。 您首先需要了解背景和需要解决的问题。 然后设计机器学习算法来有效地解决这一问题。 一旦清楚地...

2020-04-02 13:10:23 1559 0

原创 精度是远远不够的:如何最好地评估一个分类器?
原力计划

分类模型(分类器)是一种有监督的机器学习模型,其中目标变量是离散的(即类别)。评估一个机器学习模型和建立模型一样重要。我们建立模型的目的是对全新的未见过的数据进行处理,因此,要建立一个鲁棒的模型,就需要对模型进行全面而又深入的评估。当涉及到分类模型时,评估过程变得有些棘手。 在这篇文章中,我会做详...

2020-04-01 13:43:45 5217 0

提示
确定要删除当前文章?
取消 删除