【2 月 24 日,九坤投资与微软亚洲研究院首次复现 DeepSeek-R1 成果】近日,九坤投资与微软亚洲研究院刊文表示,他们首次复现了 DeepSeek-R1,尤其是在强化学习领域的成果,并且在技术层面给出了创新性的看法。这篇学术文章名为 Logic-RL:Unleashing LLM Reasoning with Rule-Based Reinforcement Learning,由微软亚洲研究院、Ubiquant 以及其他独立研究人员共同撰写。据了解,作为量化巨头的九坤投资,在数据、算法、算力方面具备强大的技术储备与人才储备。近些年来,持续在 AI 前沿技术领域开展系统且深入的研究,不但长期探索通用技术并推动其在场景中的应用,还在多个细分领域进行了多元化的研究拓展,致力于构建更为全面的 AI 技术体系。在行业内,由于 DeepSeek 的模型全部开源,全球掀起了复现 DeepSeek-R1 的热潮,此前包括 HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,并获得了一定的成果。
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论