logo
Hans's notebook
强化学习
Initializing search
    • Home
    • C++
    • ROS
    • Linux
    • Python
    • 其他笔记
    • 工作日志
    • 强化学习、深度学习
    • 数学
    • 机器学习
    • 硬件学习
    • 自动驾驶
    • 英语
    • 路径规划
    • Home
      • ACM常用函数
      • C++noexcept关键字以及volatile关键字
      • C++一些名词的概念
      • C++中Struct和Union的区别
      • C++中const声明不同位置的不同含义
      • C++中sstream
      • C++中static、extern、include、inline、constexpr
      • C++中嵌套类型声明的读法
      • C++中构造函数为什么不能是虚函数
      • C++中的tuple、get、tie
      • C++中的一些坑
      • C++中的对象模型
      • C++中的模板元编程
      • C++中的类型定义
      • C++中的继承
      • C++中运算符的优先级
      • C++使用spdlog和matplotlib cpp
      • C++使用using
      • C++内存分配
      • C++初始化
      • C++反射的实现
      • C++完美转发=万能引用+引用折叠+std forward
      • C++形参包与可变参数模板
      • C++数组传参
      • C++智能指针
      • C++模板编程
      • C++自定义字面量
      • Casadi配置各种求解器(ipopt、osqp、qpoases)
      • STL6大组件
      • VSCODEC++配置环境
      • Backward cpp的使用
      • c++编译器gcc clang MSVC
      • Cmake中private和public的区别
      • Cmake中target source
      • Const和constexpr的区别
      • C++11 New Features and Libraries
      • C++14 New Features and Libraries
      • C++17 New Features and Libraries
      • Effective C++
      • Effective Modern C++
      • Hpipm安装
      • Linux和windows中静态库和动态库的后缀
      • Osqp eigen安装
      • Priority queue的自定义比较方式
      • Typedef的用法(数组)
      • 使用gdb调试
      • 函数对象(仿函数)
      • 利用protobuf实现C++反射
      • 单例模式
      • 多态
      • 对于namespace的理解
      • 并发与并行的概念
      • 广度优先搜索:使用队列实现(先入先出),不断向队尾加入
      • 数组指针和指针数组、函数指针和函数声明
      • 汇编的相关知识
      • 返回值、引用、指针
      • 返回值优化
      • 迭代器失效
        • Stack
        • Queue
        • Linked List
        • K-d Tree
        • Tree
        • Hash Table
        • Array
        • LRU(Latest Recently Used) Cache
        • LFU
        • String
        • Trie
        • Union-Find
        • Fenwick Tree
        • Segment Tree
        • Algorithm Pattern
        • Sliding Window
        • Two Pointers
        • Binary Search
        • Sort
        • Backtracking
        • Searching
        • Dynamic Programming
        • Bitwise
        • Greedy
        • Math
        • Geometry(2D)
        • Graph
        • Algorithm Analysis
        • Design Patterns
        • The 10 Object-Oriented-Principles(OOP)
      • ROS neotic中使用conda环境的方法
      • ROS1教程
      • ROS2与ROS1的区别
      • ROS2教程
      • ROS中的action通信
      • ROS中的spin()和spinonce()
      • ROS中的一些坑
      • ROS中的命名空间和节点名称
      • ROS中的插件管理
      • ROS中的时间概念
      • ROS中的构建工具
      • ROS建图
      • ROS的launch文件
      • ROS的参数服务器
      • Ros中显示自定义物体形状
      • Kill命令
      • Linux apt安装时包的后缀libxxx dev
      • Linux systemctl命令合集
      • Linux下读写串口
      • Linux中动态库
      • Linux中的通信
      • Linux修改语言
      • Linux安装显卡驱动
      • Linux开机自启动的方法
      • Linux无法获得锁
      • Linux终端连接网络
      • Linux设备树
      • On my zsh主题推荐
      • Source、bash、sh、.的区别
      • Ubuntu setup
      • Ubuntu wsl的一些坑
      • Ubuntu下软件多个版本的统一管理
      • ubuntu安装DWM的一些配置
      • Ubuntu安装ompl的坑
      • Ubuntu安装新字体的方法
      • Ubuntu配置静态ip
      • Vim中的一些小坑
      • X11无法显示的问题
      • 终端快捷键
      • 编码方式
      • 配置v2raya
      • 需要牢记的bug
      • Python中函数的参数
      • Python中常用的优化库
      • Python中常用的装饰器
      • Python中模块的搜索路径
      • Python中的反射
      • Python中的换行
      • Python中的装饰器
      • Python中的迭代器与生成器
      • Python的坑
      • Bayes的一些理解
      • Bevformer
      • HMM的不足和CRF的优势
      • Matlab的开源替代
      • Obsidian配置
      • Openpilot本地部署(carla)
      • Openpilot模型解析
      • Prescan、carsim、simulink联合仿真
      • RL中网络结构对结果的影响
      • RNN vs. Structured Learning
      • T SNE dimension reduction
      • Transformer的理解与实践
      • Apollo预测规划控制
      • Appimage创建图标
      • Carla笔记
      • Cmake使用笔记
      • Git使用
      • Ilqr和ddp的最大区别
      • Intersection 十字路口
      • Julia的包管理
      • kernel PCA
      • Logistic regression的一些见解
      • Mardown进阶
      • Numpy中的乘法(对数组和矩阵)
      • Nuplan数据集的使用
      • Occupancy network
      • openGL DIrectX 和unity unreal这些引擎的关系是什么?
      • Python参数注解
      • Pytorch中的类型
      • Pytorch中的计算图
      • Pytorch使用笔记
      • Pytorch随记
      • self attention 和CNN RNN GNN的比较
      • t SNE
      • Tmux快捷键配置
      • Torch.nn和torch.functional的区别和联系
      • Torch中的乘法
      • Vectornet论文
      • Vscode
      • Windows的快捷键
      • X86、arm、risc v的区别与联系
      • 个人对于前馈+反馈控制的理解:
      • 为什么现在RNN一般采用LSTM而不用最传统的RNN
      • 刘思康(大疆)公开课——防御性规划(树轨迹,前半部分不分叉),预期风险规划(单帧安全 预测时域安全)
      • 刘思康(无人机轨迹规划)
      • 刷题记录
      • 博弈论在自动驾驶中的应用
      • 变分自编码器(VAE)
      • 回溯算法的套路
      • 图灵完备
      • 图神经网络学习
      • 如何理解卷积
      • 如何理解控制中的传递函数H(s)
      • 学会使用pytorch lighting
      • 小车模型使用手册
      • 小鹏在L2辅助驾驶中遇到的五个问题及其解决思路
      • 希腊24字母对照表
      • 强化学习
      • 快捷键大全
      • 数据结构
      • 最优控制中的若干问题
      • 期刊汇总与实验室汇总
      • 正则化(regularization)、归一化输入(normalizing input)、归一化 标
      • 生成模型和判别模型的根本理解
      • 神经网络的剪枝(pruning)与知识蒸馏(distillation) 与参数量化与架构设计
      • 神经网络的种类
      • 自回归模型与自编码模型
      • 进程间通信
      • 面试相关
      • 预测决策规划控制
      • 预瞄控制的理解
        • 刷题记录 image 9 20231201152318
        • 刷题记录 image 9 20231201152402
      • 记录每日工作
      • 小车培训
        • 10.30
        • 5.8
        • 6.20
        • 7.1
        • 8.20
        • Carsim仿真中的速度抖震问题的解决方法
        • 9.2
        • 2023.6.29
        • 会议记录
        • 第一次会议
        • 第二次会议
      • Mechine Learning
      • Neural Network and Deep Learning
      • Improving Deep Neural Networks: Hyperparameter Tuning, Regularition and Optimization
      • Structuring mechine learning projects
      • Convolutional Neural Networks
      • Sequence models
      • GCN
      • PPO算法笔记
      • RNN的一点总结
      • Actor critic
      • Batchnorm与layer norm
      • List切片操作
      • Python中类型提示
      • Python技巧
      • Python类的复习
      • Transformer
      • Word2vec和bert的区别
      • Zip和
      • 一些IDEA
      • 为什么targetnetwork和double DQN可以解决高估问题
      • 从另一个角度看监督学习的强化学习
      • 双重期望值定理
      • 对于Q(s,a)和V(s)的一些个人理解
      • 小记
      • 强化学习训练慢的原因
      • 深度学习中的数据增强
      • 深度学习的一些见解
      • 滑动平均(moving average)
      • 目标检测中各项指标的含义
      • 知名高校和课题组
      • 策略梯度的绝妙证明
      • 自动微分
      • 贝尔曼方程推导
      • 连续动作的DQN
      • 马尔可夫蒙特卡洛采样
      • Lipschitz连续
      • Latex Equations Cheatsheet
      • 代数重数与几何重数的关系
      • 优化问题
      • 其他几何知识
      • 刚体运动学
      • 判断是否相交
      • 协方差矩阵
      • 四元数与欧拉角、旋转矩阵的转换
      • 排列组合
      • 方差与均值的关系
      • 正定矩阵与凸优化
      • 泰勒展开与jacobi矩阵
        • Summary
        • Functions
        • Limits
        • Limit Problems of Polynomials
        • Continuity and Differentiability
        • Differentiation Problems
        • Trig Limits and Derivatives
        • Exponentials and Logarithms
        • Extrema of Functions
        • Optimization and Linearization
        • L'Hopital's Rule and Limits
        • The Fundamental Theorems of Calculus
        • Techniques to Solve Integration Problems
        • Improper Integrals
        • Sequences and Series
        • Tylor Polynomials, Tylor Series and Power Series
        • Summary
          • The Geometry of Linear Equations
          • An Overview of Linear Algebra
          • Elimination with Matrices
          • Multiplication and Inverse Matrices
          • Factorization into A=LU
          • Transpose, permutations, spaces R^n
          • Column Space and Nullspace
          • Soving Ax = 0: pivot variables, special solutions
          • Solving Ax = b: row reduced form R
          • Independence, Basis and Dimension
          • The Four Fundamental Subspaces
          • Matrix spaces, Rand 1 and Small World Graphs
          • Graphs, Networks and Incidence Matrices
          • Orthogonal vectors and subspaces
          • Projections onto Subspaces
          • Projection Matrices and Least Squares
          • Orthogonal Matrices and Gram-Schmidt
          • Properties of Determinants
          • Determinant Formulas and Cofactors
          • Cramer's Rule, Inverse Matrix, and Volume
          • Eigenvalues and Eigenvectors
          • Diagonalization and Powers of A
          • Differential Equations and e^At
          • Markov Matrices and Fourier Series
          • Symmetric Matrices and Positive definiteness
          • Complex Matrices and Fast Fourier Transform
          • Positive Definite Matrices and Minima
          • Similar Matrices and Jordan Form
          • Singular Value Decomposition(SVD)
          • Linear Transformations and their Matrices
          • Change of Basis and Image Compression
          • Left and Right Inverse; Pseudoinverse
        • Summary
        • Sample Space and Probability
      • 数学基础
      • Arduino学习(esp32)
      • Can通信
      • freeRTOS
      • 单片机通信全解
      • 无刷电机和步进电机的区别
      • 电机的种类和用途
      • Anchor Based 方法
      • Apollo openspace中的DL IAPS算法
      • ApolloRouting与PnCMap相关笔记
      • Apollo中TDR OBCA算法
      • Apollo中的PJSO算法
      • Apollo中的抗积分饱和
      • Apollo中的抽象工厂模式
      • Apollo控制
      • Apollo控制模块中match point怎么找?
      • Apollo测试
      • Apollo规划
      • Apollo路径规划公开课
      • Apollo预测
      • CNN原理
      • MPPI规划器
      • POMDP
      • Tranfomer
      • VAD阅读笔记
      • Apollo安装
      • Cuda相关
      • Mmdet3d学习笔记
      • Openspace算法问题总结
      • 交叉熵损失函数
      • 代价函数的设计
      • 依赖注入(DependencyInjector)
      • 决策规划感悟
      • 参考线平滑的曲率约束的推导
      • 各种优化算法的解析与对比
      • 各种控制算法试用场景对比
      • 在线建图
      • 坐标系相关
      • 巴特沃斯低通滤波器
      • 手写transformer
      • 数据挖掘经验
      • 新石器目前的path planning的动静态障碍物的考虑情况
      • 无人机规划和自动驾驶规划的区别
      • 时空规划
      • 求曲率方法
      • 港科大两篇规划文章的解读博客
      • 相关面试题
      • 相机的内外参数
      • 端到端 know how
      • 规划的一些感想
      • 解析百度Apollo之决策规划模块
      • 训练经验
      • 车辆的三种自行车模型
      • 轨迹规划综述
      • 非极大抑制(NMS)
        • Models for car like vehicles
        • Path tracking
        • Autonomous Hdmap Format
        • Summary
        • Search-based Path Finding
        • Sample-based Path Finding
        • Kinodynamic Path Finding
        • Minimum Snap Trajectory Generation
        • Model Prediction Control (MPC)
        • Reference Line
        • Introduce to Apollo(3.5) Prediction Module
        • Compilation Optimization of C++ Project
        • Dig into Apollo(6.0) Prediction
        • Interacting Multiple Models(IMM) for Prediction
        • The Design of A Visualization Tool for Autonomous Vehicle Developers(TODO)
        • A star
      • 数字的表示
      • 曲率计算
      • 蚁群算法
      • 路径规划1(Dijkstra)
      • 路径规划总结

    强化学习

    一个很好的专栏

    https://blog.csdn.net/november_chopin/category_10080614.html

    Made with Material for MkDocs