Edge最大的敌人,不是Chrome,而是它自己。
最近AI界的大新闻是GPT-5和谷歌的世界模型Genie3。然而,在无人在意的角落里,微软悄悄把Edge进化成了了AI浏览器。
上一次听到Edge的消息还是IE正式关停的时候,Edge作为IE的继任者难免会被拿出来讨论,通常没有什么好话。
再上一次是Edge加入sidebar功能的时候,罕见地抢了一批Chrome的用户。
时至今日,Edge的风评似乎没有比曾经的IE好到哪里去。
都2025年了,居然还有浏览器的首页充斥着闪烁的MSN资讯、天气卡片、股市小窗口,以及永远关不掉的「热门故事」。与此同时,微软不断地在给Edge加入「无用的新功能」,让系统变得越来越臃肿。
MSN,原来你没死透|图片来源:Edge浏览器截图
但如果你愿意再给Edge一次机会的话,一键开启Copilot模式,Edge就变成了神似Dia的样子:
干净得不像微软出品。
这个首页就正常多了|图片来源:Edge浏览器截图
01微软,再造一遍浏览器
要让Edge变成AI浏览器,除了要更新到最新版本之外,还需要掌握一些小小的「魔法」。然后在设置的「AI创新」一栏,就可以开启Copilot模式。
Copilot模式的形态介于谷歌在Chrome有限Gemini集成,和Manus这样完全的AI浏览器之间。
在Copilot模式下,首页就变成了一个对话框,你可以直接用搜索引擎搜索、询问Copilot或者让它深度思考。这一点和其他主流的AI浏览器差别不大。
Copilot的第二个入口在地址栏左侧,一颗小药丸形状的图标,单击就可以呼出,或者让它固定在右侧。
Copilot的第二个入口在地址栏左侧|图片来源:Edge浏览器截图
官方说它可以「感知所有标签页」。于是我打开了一篇论文、一份财报,以及一个亚马逊相机的搜索页面。随后我告诉Copilot:「帮我总结特斯拉的财报,还有这篇论文的大纲,以及我想选购一款性价比高的相机。」
一分钟后,Copilot分别概括了财报和论文,附上了各个价位的最佳相机,并暗示了我给出的需求并不精准。
这一瞬间,我确实有一种错觉,有另外一颗大脑正在替我工作。
Copilot同时分析财报和论文,并给出选购建议|图片来源:Edge浏览器截图
这种总结能力也能迁移到视频上。当你在Edge中打开YouTube视频时,只要呼出Copilot并指示「总结视频」,它就会给出总结。
美中不足的是,Copilot的这种感知并非全自动的,需要你手动@标签栏,它才能替你工作。
不过,最能让我产生「幻觉」,是CopilotVision。这是一个交互方式上非常新鲜的功能,Copilot可以直接看到你的屏幕,并以此为基础和你用语音交互,就像你和朋友共享屏幕一样。
Vision读取屏幕,并给出建议|图片来源:Edge浏览器截图
例如在一个典型的购物场景,CopilotVission就可以直接看到屏幕上的备选产品,并给出选购建议。打开CopilotVission,一个带着浓郁广普口音的中年女声就会很热情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在PandaExpress或者JadeDragonRestaurant碰到的那种广东阿姨。
不得不说,现在的AI语音已经做得非常自然,已经不太分辨得出AI味。碰到AI验证的时候,它还会主动安慰你:
「是不是挺烦人的」。
这我还是第一次在AI身上感受到了人味,语音交互带来的情感浓度的确要比文字强很多。
但是就功能性来说,Vission还算不上实用。一方面是它的图像识别速度跟不上我的浏览速度。另一方面,它在图像和语音识别的准确率上也有待提升。例如它会把「IPX6」识别成「IPX4」,我用语音纠正了它,它马上道歉,但是听成了「IPX7」。
目前的Vision有一点像家里的女性长辈,不懂科技,聊天信息密度不高,但是非常包容,情绪价值拉满。
以上就是Edge最主要的功能了。还有一些功能微软表示正在开发中,例如Agent能力、智能标签分组或者是动态的AI助手。
实际上,很多功能微软已经开发完毕、处于测试阶段了,出于大公司的保守,它没有集成到Edge中。但是没有关系,进入单独Copilot主页,打开「实验室」,你可以看到,微软确实在开发一些好玩的东西。
Copilot实验室|图片来源:Edge浏览器截图
Copilot3D,可以一键将图像转换为3D模型。上传自己的照片,你就可以轻松得到一个「逼真」的3D头像。
做得很好,下次别做了|图片来源:Edge浏览器截图
Copilot游戏,体验原汁原味的上古FPS大作《雷神之锤2》,并且每一帧都是由AI实时生成的,同时画面非常卡顿。
AI生成游戏的《雷神之锤2》|图片来源:Edge浏览器截图
CopilotActions是微软最接近「Agent」野心的功能。我试着让它预订了一张8月10号从上海飞北京的机票。Copilot大概跑了20分钟,完成了点点鼠标一分钟就能做完的工作。
但奇妙之处在于:它允许我随时「抢方向盘」。
当它差点给我选了个中转航班时,我可以随时接管浏览器权限,把航线拉回直飞。这种「人机共驾」的体验,比那些一路黑箱跑到底的竞品要安心得多。
实际上,这样操作之后,跑任务的效率会大大提升,最终的出品也可控得多。我觉得这才是目前Agent最实用、最可靠的人机协作形态。正如它的名字Copilot一样,这是一种副驾驶员的哲学。
用户可以随时暂停,接管浏览器|图片来源:Edge浏览器截图
02微软的历史包袱
总的来说,Edge浏览器的AI进化给到了不错的体验,基础功能不逊色于主流工具的同时,也有一些自身的亮点,例如标签感知和Vision。
但与此同时,这还不是一款可以成熟到覆盖所有Edge用户的产品。很多宣传的功能并没有完全兑现,各个功能的入口也分散在四处。最明显的就是,地址栏旁Copilot入口支持附件上传和语音交互,而主入口的Copilot反而不支持这些功能。
更大的割裂感在于Edge浏览器本身和Copilot模式上。
单就视觉而言,传统功能区延续了Win11的Fluent圆角玻璃;AI面板则是现代极简的风格,仿佛两代人共用一张办公桌。
两种设计风格同时共存在一个页面
更重要的功能性上,Edge团队背负着沉重的历史包袱:兼容模式、IE模式、企业策略、臃肿的PDF阅读器……而Copilot团队显然想再造一个「AI优先」的物种。两股力量在同一具身体里拉扯,导致入口分散、菜单嵌套、选项重名。
于是,Edge就像是一座仍在施工的跨河大桥:桥这头,是微软多年堆出来的旧公路,坑洼却熟悉;桥那头,是闪着霓虹的AI新大陆,诱人却断续。
用户站在桥中间,有一些迷茫。