(资料图)
在与新必应(New Bing,集成了大语言模型GPT-4能力的搜索引擎)“深聊”之后,中国科学院计算技术研究所副所长、研究员包云岗发现了一点“规律”:对于一些需要精准答案的场景,GPT-4开始变得不可靠。
“与New Bing讨论一些社会人文话题,它回答得头头是道;让它列一个信息技术发展报告大纲,看起来很有层次;让它望文作图、再赋诗一首,表现也还不错。直到开始讨论一道数学题,它似乎有‘情绪’了——试了两次都没答对,最终它不想再继续对话。”包云岗说道。
他不灰心,继续第三次尝试,但New Bing仍然没有给出正确答案。
“但依然有惊喜——New Bing的三次回答,使用了三种不同的思路,这说明它背后的GPT-4所采用基于人工反馈的强化学习(RLHF)确实在发挥作用。”包云岗说。
标签:
中新网5月24日电 据上海卫健委官方微信消息,2022年5月23日0—24时,上海新增本土新冠肺炎确诊病例58例和无症状感染者422例,其中39例确诊
“云健身”热背后的冷思考 国务院办公厅近日印发《“十四五”国民健康规划》,针对人民群众生命安全和身体健康事业做出诸多重要部署,其中,...
中国天气网讯 北京今天(5月24日)晴转阴,最高气温34℃;傍晚至夜间雷雨大风来袭,阵风7至8级,需注意防范。明天,北京最高气温将降至30℃
“全程网办”进一步畅通残疾人两项补贴申领渠道 实现补贴申领“一次都不跑” 本报记者 蒲晓磊 得益于残疾人两项补贴申请“跨省通办”的运行...