网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
11月05日
漏签
0
天
太空探索技术公司吧
关注:
7,778
贴子:
358,458
看贴
图片
吧主推荐
游戏
0
回复贴,共
1
页
<返回太空探索技...吧
>0< 加载中...
大模型价值评估系统和博弈机制的构建
只看楼主
收藏
回复
最爱打脸酱
建设星堡
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
给大模型建立类似于alphago的价值策略网络,并且是多个相对独立的价值评估网络,然后经过由自由能机制驱动的博弈网络博弈后决出价值判断选择的方向,像现在在做的引入不确定度或者说置信度就可以作为其中的一个价值评估网络。这里还可以引入蒙特卡洛搜索来搭建验证路径,即由决出的价值判断选择及该选择触发的基座网络的关联路径搭建的解决路径,然后通过概念呈现回溯进行验证。
送TA礼物
IP属地:江西
来自
iPhone客户端
1楼
2024-09-02 09:07
回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
LPL首个颗粒无收的年份
2466930
2
BLG多位选手合同将到期
1990850
3
涵艺爆料LPL工资帽
1638840
4
郑钦文战胜莱巴金娜
1181223
5
朱开想去BLG做教练
1166958
6
良品铺子被立案调查
1086500
7
如何评价杨笠登上纽约时报
1045176
8
狼队对战AG
934306
9
《野狗子》媒体评测解禁
793342
10
特朗普承认有败选可能
687666
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示