会倾听,能唠嗑,还善于察言观色

新版ChatGPT在这些方面“更像人”了

版次:16 作者:新华社

美国开放人工智能研究中心(OpenAI)13日展示最新版本ChatGPT:与使用者展开语音对话、识别图像并展开讨论、翻译……相比先前版本,它与使用者对话基本无延迟,会倾听,能唠嗑,还善于察言观色,让人惊呼新版本ChatGPT“更像人”了。

新版本ChatGPT取得了哪些突破?能在哪些领域实现应用?它对人工智能领域的影响有多大?记者为您解局——

●有哪些“进化”?

实时聊天是ChatGPT的关键技能。相比先前版本,GPT-4o的不同主要表现在:一是使用者可以随时打断聊天机器人,无需像从前那样等它把话说完;二是它会实时对问题作出回应,不再有2~3秒的时滞;第三,它能感知人的情绪,比如演示者呼吸急促,它会询问对方是否需要稍稍稳定下情绪。另外,GPT-4o可以生成不同风格的声音。

演示中,GPT-4o利用其视觉和语音能力,指导演示者在纸上逐步解出一道方程题,而不是直接给出答案。它还展示了英语与意大利语互译、用自拍照片识别情绪等能力。当一名演示者告诉它,自己正展示它是“多么有用和不可思议”时,它回答道:“哦,快别说了,怪害臊的。”

开放人工智能研究中心首席执行官萨姆·奥尔特曼当天在博客中写道,GPT-4o就像电影中的人工智能技术。“与电脑交谈一直让我感觉不自然,现在自然了。”

●应用潜力如何?

北京邮电大学人机交互与认知工程实验室主任刘伟说,无论是在文本生成、做题、问答系统还是情感分析等任务中,GPT-4o都表现出很好的能力。这种技术的突破,无疑将对国内外的相关企业产生重大影响,它不仅推动了自然语言处理技术的发展,也让人工智能在多个领域的应用变得更加广泛和深入。

他认为,GPT-4o将推动人工智能在金融服务、教育、医疗、无人驾驶汽车等领域的应用,有望引领人工智能技术全面发展。

●需要担忧什么?

在开放人工智能研究中心公布的一段演示视频中,GPT-4o一步步引导一名男孩解答出数学题。一些网友直呼,再也不用辅导孩子写作业了。一些人却担心,教师这一职业会不会被人工智能取代。

一些人工智能专家认为,新版ChatGPT虽然可能比竞争对手水平更高且更易使用,但不太可能很快让一些职业彻底消失,从事教学或翻译工作的人更有可能会使用这些工具,而不是被它们取代。

刘伟说,GPT-4o的语音功能改变了对话式人工智能的游戏规则,但依然没有实现聊天机器人的深度态势感知能力,比如意图理解、动机分析等。此外,GPT-4o的进步在人工智能伦理和安全方面带来了新的挑战,需要我们在数据隐私、信息可信性、潜在偏见、恶意使用、意识和责任等方面开展新的思考。

文图均据新华社