强化学习(动态规划)
本文介绍了强化学习的动态规划法(Dynamic Programming,DP),采用动态规划的思想,分别介绍策略迭代和价值迭代方法。 1. 强化学习问题的求解 2. 动态规划 2.1. 策略迭代 2.1.1. 策略评估 2.1.2. 策略改进 2.1.3. 策略迭代 ...
本文介绍了强化学习的动态规划法(Dynamic Programming,DP),采用动态规划的思想,分别介绍策略迭代和价值迭代方法。 1. 强化学习问题的求解 2. 动态规划 2.1. 策略迭代 2.1.1. 策略评估 2.1.2. 策略改进 2.1.3. 策略迭代 ...
本文介绍了强化学习的基本概念和模型,主要包括马尔可夫过程、马尔可夫奖励过程和马尔可夫决策过程。 1. 强化学习 1.1. 状态和观测 1.2. 动作空间 1.3. 策略 2. 马尔可夫过程(MP) 3. 马尔可夫奖励过程(MRP) 3.1. 奖励(Reward) 3.2. ...
本文介绍了在Windows环境下使用MinGW-w64编译模型加载库assimp的方法和坑。 1. 基本知识 1.1. MinGW-w64 1.2. assimp 2. 部署方式 2.1. CMake 2.2. make 3. 参考文献 1. 基本知识 1.1. ...
本文介绍了天文学中基本的座标系统。 1. 背景 1.1. 国际地球自转和参考框架服务 1.2. 国际天文学联合会 2. 坐标系 2.1. 参考系统与参考框架 2.2. 坐标系的分类 2.3. 国际天球参考系统和参考框架(ICRS/ICRF) ...
本文介绍了CDDIS网站下 GNSS 相关的数据产品下载、命名方式解读、文件格式说明和文件下载地址。 1. 数据(data目录) 2. 广播星历(Broadcast ephemeris data) 2.1. Daily GPS Broadcast Ephemeris Files 2.2. Hourly GPS Broadcast Ephe...
本文介绍了模糊惩罚稀疏编码在扩散张量磁共振图像分割中的应用。Fuzziness Penalized Sparse Coding for Diffusion Tensor Magnetic Resonance Image Segmentation 1. 参数定义 2. 模糊惩罚稀疏编码 3. 优化 3.1. 参数更新 ...
本文介绍了计算机视觉中单阶段目标检测问题的一个最新实现,即 YOLO V5。 1. 网络结构 1.1. parameters 1.2. backnone 1.2.1. Focus 1.2.2. Conv 1.2.3. BottleneckCSP ...
本文介绍了计算机视觉中单阶段目标检测问题的解决方法,即 Yolo 系列。 1. 前言 2. YOLO V1 2.1. 网络结构 2.2. 输入 2.3. 输出 2.4. 构造训练样本 2.5. 损失函数 2.6. 训练 2.7. 测试预测 2.8. 结论 ...
本文介绍了计算机视觉中目标检测问题的基础研究和历史。 1. 前言 1.1. AlexNet 1.2. VGG16 2. R-CNN 3. Fast R-CNN 4. Faster R-CNN 5. 参考文献 1. 前言 图片分类任务我们已经熟悉了,就是算法对其中的对象进行分类。而今天我们要了解构建神经网络...
本文介绍了深度学习中卷积神经网络的(CNN)的基础知识。 1. 基础知识 1.1. 图像 1.2. 卷积 1.2.1. 单通道卷积 1.2.2. 多通道卷积 1.2.3. 权重 1.2.4. 偏置 1.2.5. 激活 ...