微软 rStar
IT之家 1 月 11 日消息,微软亚洲研究院旗下数学和人工智能研究团队昨日(1 月 10 日)发布博文,针对小语言模型,设计并开发了 rStar-Math 技术,专门用于解决数学问题。
和微软之前推出的 Phi-4 不同,rStar-Math 采用蒙特卡洛树搜索(Monte Carlo Tree Search)进行推理,这种方法模拟了人类逐步解决问题的思维方式,能够将复杂问题分解成更小的部分,逐步求解。
研究人员要求模型输出自然语言描述和 Python 代码形式的“思维链”步骤,并将自然语言作为 Python 代码注释,仅使用 Python 代码输出训练模型。
研究人员训练了一个“策略模型”生成数学推理步骤,并使用“过程偏好模型”(PPM)选择最有希望的解题步骤。这两个模型通过四轮“自我进化”互相改进,不断提升性能。
研究人员使用了 74 万道公开的数学应用题及其解答作为初始数据,并利用上述两个模型生成了新的解题步骤。
测试结果显示,应用 rStar-Math 技术后,Qwen2.5-Math-7B 模型的准确率从 58.8% 跃升至 90.0%,将 Phi3-mini-3.8B 从 41.4% 提升到 86.4%,分别比 OpenAI 的 o1-preview 模型高 4.5% 和 0.9%。
研究团队已在 Hugging Face 上宣布,计划将 rStar-Math 的代码和数据在 GitHub 上公开,方便其他研究者使用和改进。
IT之家附上参考地址
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.
汪涵儿子9岁近照:头染黄毛,发际线超高,看上去有点秃
TVB的四小花
2025-05-08 15:04:40
越南推动十年内实现全民免费医疗
李东海评论
2025-05-07 15:47:33
重大突破!刚刚上海地铁最新通知,大批人身价要涨
科学发掘
2025-05-06 05:19:30
网址:微软 rStar https://mxgxt.com/news/view/1061332
相关内容
未来可期!Rstar派星儿开播一周拿下虎牙声林唱将冠军微软首席数字官亲述微软自己的数字化转型故事
苹果微软亦敌亦友 库克发声合作微软发力企业市场
那些微软出品的明星经理人
张一鸣和微软的四件往事
微软不遗余力推广见效!微软Win11用户越来越多:与Win10只剩个位数差距
刚退役两天就签下Uzi的GNR战队,背后究竟是什么势力?
中国区员工只能用iPhone?微软回应→
AI应用加速渗透 微软(MSFT.US)与ServiceNow(NOW.US)等软件股涨势未休
微博舆情监测软件的️