微软开发者大会简报:编程进入自然语言时代、“AI员工”闪亮登场

来源 | 财联社  编辑 | 史正丞  

2024年05月22日 08:57  

本文1804字,约3分钟

当地时间周二,美国科技公司微软召开年度Build开发者大会。在CEO纳德拉的带领下,微软各个产品团队再一次展现出惊人的执行力,在发布会上又拿出了接近50个新产品或功能更新。

整场发布会持续了接近两个小时,在这里挑选了一些投资者可能会感兴趣的新功能进行简要介绍。

编程小白也能开发软件?

纳德拉在周二演示了“帮助小白编程”的GitHub Copilot Workspace,这是一款通过聊天实现完成程序编写的软件。这将使任何新手,即使对编程语言几乎没有了解,也能开发自己的软件。

image

纳德拉表示:“任何人都可以在瞬间将想法转变为代码,你能够控制这个过程中的每一个环节...这将使得编程更加快乐和有趣。”

微软计划在未来几个月里进一步打磨这个功能,使其更加可用。

AI员工走上台前

在微软的职场协作软件Teams等一系列应用中,AI将不再是一个工具栏上的按钮,而是打工人们可靠的新同事。

image

这项名为Team Copilot的新功能将使得Copilot成为每个工作团队的新成员。Copilot可以作为会议的主持人,管理议程并实时纪录会议纪要,以及追踪并安排团队成员会议后的行动。

image

Copilot还能成为项目经理,通过创建和分配任务、跟踪截止日期等方式推动团队协作。

在另一项产品更新中,微软也表示将在今年晚些时候推出一款“AI代理”工具——类似于“AI虚拟员工”,可以执行监控电子邮件、帮助新员工入职、输入数据等一系列琐碎的自动化任务。微软小心翼翼地强调,Copilot不会接管人们的工作,只会接手其中一些无聊的部分。

AI实时视频翻译功能

微软的Edge浏览器将在近期推出一款视频实时翻译功能。与目前常见的视频字幕翻译不同,这款产品已经能提供实时语音同传翻译。

image

Edge的AI实时翻译初始将支持彭博、路透等一系列主流视频网站和主流新闻网站,且只支持英语、印地语、德语、俄语、意大利语和西班牙语的双向互译。微软也表示,后续将会支持更多的网站和语言。

一款骁龙迷你电脑

在昨日发布一系列新笔记本电脑后,周二一款搭载高通骁龙X Elite芯片的迷你主机也面向开发者推出。除了高通的芯片外,这款形似Mac Mini的机器还有32GB LPDDR5x内存和512GB的SSD。

image

考虑到这款机器售价达到899.99美元,比起昨天的笔记本电脑(起售价999美元)并没有明显的价格优势。不过这款产品似乎也没准备卖给普通消费者,要获得它的唯一渠道是在高通官网上填写一个面向开发者的表格。

小模型也要多模态

在今年4月更新“小模型”Phi-3后,微软也在周二拿出了Phi-3-vision模型。顾名思义,这个模型可以阅读文本和查看图片,同时这个42亿参数量的模型足够紧凑,能够在移动设备上运行。目前Phi-3-vision已经发布在Azure的模型库中。

image

与DALL-E和Stable Diffusion不同,Phi-3-vision不会生成图像,主要用来理解图像中的内容并为用户进行分析。

与Meta深入合作

微软也在周二宣布将“Windows体积应用程序”(Windows Volumetric Apps)引入Meta的Quest头显设备,使开发人员能够将其应用程序扩展到3D空间。

微软表示,该扩展将允许用户不离开支持他们工作依赖的应用程序,同时增强空间理解的能力。

彩蛋:奥尔特曼现身

整场发布会的压轴环节交给了OpenAI CEO山姆·奥尔特曼,面对全场开发者,奥尔特曼猛灌了一锅“心灵鸡汤”。

image

在与微软CTO凯文·斯科特的对话中,奥尔特曼表示自上周发布GPT-4o以来经历了“疯狂的一周”,因为他“从未见过一种技术以如此有意义的方式被如此迅速地采用” 。

这名创业导师也强调,他最重要的建议是,现在是一个特殊的时期,所以要抓住机会去构建你想要做的事情,不要等待。奥尔特曼认为,就创业而言,眼下是2008年移动互联网爆发、甚至是整个互联网时期“最令人兴奋的时刻”。

但“ChatGPT之父”也补充称,不要指望AI能为你做所有的工作,人工智能是一种新的促进因素,但它并不会自动打破商业规则。