太空探索技术公司吧 关注:7,778贴子:358,458
  • 0回复贴,共1

大模型价值评估系统和博弈机制的构建

只看楼主收藏回复

给大模型建立类似于alphago的价值策略网络,并且是多个相对独立的价值评估网络,然后经过由自由能机制驱动的博弈网络博弈后决出价值判断选择的方向,像现在在做的引入不确定度或者说置信度就可以作为其中的一个价值评估网络。这里还可以引入蒙特卡洛搜索来搭建验证路径,即由决出的价值判断选择及该选择触发的基座网络的关联路径搭建的解决路径,然后通过概念呈现回溯进行验证。


IP属地:江西来自iPhone客户端1楼2024-09-02 09:07回复