美高梅游戏官网app
根据行业专家张俊林的观点,o1-preview 之所以能够更强,其方法本质上是思维链(Chain-of-Thought, CoT)的自动化。通过 CoT 把一个复杂问题拆解成若干简单步骤,这有利于大模型解决复杂逻辑问题,但之前这个过程主要靠人工来达成。o1 采用的这种方法,将使得 Prompt 工程逐渐消亡,也就是说所有复杂人工环节的自动化成为了大势所趋。
值得一提的是,在大模型技术前沿,国内比 OpenAI 在开放协作的道路上走的更远,更加“open”。比如 CoE 架构并非只接入了一家企业的模型,而是由 360 牵头,百度、腾讯、阿里巴巴、智谱AI、Minimax、月之暗面等 16 家国内主流大模型厂商合作打造的,目前已经接入了这些企业的 54 款大模型产品,未来预计会全量接入 100 多款大模型产品。
有了上述的多种底层技术创新,基于CoE 架构的混合大模型在翻译、写作等 12 项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分;特别是在“弱智吧”和“诗词赏析”这类比较具有中文特色的问题上,该架构的领先优势更加明显。即使是对于最新发布的 o1-preview,CoE 架构在未经专门优化的情况下也展现出了优势。
一方面,360 通过 CoE 技术架构,构建了大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款大模型,进行多模型协作,以此达成比单个大模型回答问题好得多的效果。
美高梅游戏官网app
据了解,o1和GPT系列模型最大的区别主要在于,该系列模型是在思考之后回答用户问题,输出高质量的内容,而非迅速回应无效答案,即用模仿人类思维过程的“慢思考”代替过去追求快速响应的“快思考”,这与国内一家大模型企业在近两个月前提出的观点不谋而合——早在今年7月底举办的ISC 2024大会上美高梅游戏官网app,360集团创始人周鸿祎就宣布,360将“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力”,并在近期多次强调,将“利用智能体框架,让大模型从快思考转成慢思考模式,把多个大模型组合起来解决业务问题”。
周鸿祎用“快思考”和“慢思考”两项人类具备的能力对思维链强大的原因进行了解读。他指出,快思考的特点是快速直觉、无意识,反应很快但能力不够强。GPT类大模型通过训练大量知识,主要学习的是快思考能力,这也是为什么GPT类大模型脱口而出的答案质量不够稳定,“就像人一样,不假思索出口成章而不出错非常难实现”;慢思考的特点则是缓慢、有意识、有逻辑性,需要分很多步骤,类似写一篇复杂的文章,要先列提纲,根据提纲去搜集数据,收集素材,根据素材进行讨论,再把文章写出来,还要进行润色和修改。“这一次o1拥有了人类慢思考的特质,在回答问题前会反复地思考,拆解、理解、推理,可能会自己问自己1000遍,然后才能给出最终的答案。”
不过,尽管在“慢思考”能力上取得了巨大突破,o1依然难称完美。据媒体报道,目前的o1-preview版本依旧存在幻觉问题、运行速度较慢及成本高昂等诸多局限性,限制了其应用范围。与之相比,更早提出“慢思考”概念的360通过其首创的CoE(Collaboration of Experts,专家协同)技术架构及混合大模型对“慢思考”进行落地实践,该技术架构已落地在360 AI搜索、360 AI浏览器等多款产品中。AI助手通过CoE架构还接入了很多小参数专家模型美高梅游戏官网app,在回答简单问题时调用更精准的“小模型”,在获得高质量回答的同时还能节约推理资源、提升响应速度,实现对“慢思考”过程中速度过慢等问题的改进。
详情