平时放假最惨是三缺一无脚一齐打牌。现在中国人工智能公司灵初智能科技公司PsiBot展示了一个具备高端推理、远程操作能力的机器人Psi-R1。机器人能在变化快速、环境开放的现实场景中打麻雀,并展现灵活操作和自主决策能力。PsiBot利用自主研发的分层端到端模型Psi-R1,结合类人推理方式与强化学习框架,成功实现CoAT(Chain of Action Thought)思维系统,并在麻雀桌上执行出牌、碰牌与胡牌等策略性决策。

Psi-R1在最新展示中通过传感器进行精细操作,准确抓取和翻动麻雀牌,其动作节奏虽慢,但整体过程与人类玩家极为相似。机器人不单只执行物理动作,更可进行连贯的逻辑推理。每次出牌前,Psi-R1都会经历完整思考流程,包括判断手中牌面组合、计算风险与收益、预测对手出牌,再决定是否执行碰牌、杠牌或胡牌操作。

在PsiBot的视频中,Psi-R1能根据对手出的一筒判断自己拥有两张一筒,具备碰牌资格,因此执行碰牌行动,目标是加快听牌进程。其判断逻辑包括:“从我手牌来看,不应该争取清一色,碰是目前为胡牌作最好准备。”这一思考程序让机器人能如人类般审视局势,自主调整战术。

更特别的是,Psi-R1能在游戏进行中变更策略。例如原定打出六筒,但抽到七筒后,计算条牌牌型已成顺子,自行改变计划并宣布自摸胡牌。这样的决策过程说明机器人不仅拥有记忆和模拟人脑思维能力,更能在实时互动中适应变化,作出合适行动。

PsiBot表示,这项技术展示机器人已达到L3等级的智慧行动能力,可支持复杂多变的场景操作。麻将只是其应用案例之一,未来目标是将该系统应用至工业生产、零售服务、物流配送和家居环境等领域,发挥长时间稳定执行的潜力。

除了单功能力外,Psi-R1也展现人-机、机-机与机-环境三重互动协作的功能。视频中,两部PsiBot机器人能彼此沟通、交换资讯并协作完成打牌任务,提升整体策略智能。其中机器人甚至能模拟情绪表情,增加牌桌互动性。

PsiBot期望通过麻将这项复杂游戏,向大众呈现其机器人在自主学习、长时推理及人类级操作能力上的进展。这一突破令“三缺一”的情况或许再不是问题,未来打麻雀可能有机器人自动上桌应战。

数据源:YouTube