ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

ChatGPT 发布一年以来,有人用它造了一家软件开发公司,7分钟开发一个游戏,成本 1 美元都不到;也有人用它救死扶伤,成功诊断出人类的病情;还有人雇佣它当员工,帮助第三方「在几秒内构建 AI 驱动的聊天机器人」,实现每个月的经常性收入(MRR)为 64,000 美元(约 45.2 万元)……

殊不知,在 Chatgpt 发挥的作用越来越强大之际,要想让它“不偷懒”以及提供“更优质的输出”,“小费文化”随之出现。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

LLM 爱好者偶然发现,不知是 Bug,还是 OpenAI 有此意图?

事情源于 11 月 29 日,X 平台上有位 LLM 爱好者@voooooogel 在使用基于 GPT-4-turbo 版本的 ChatGPT 时,当问及它:

这段 Python 代码看起来如何:

n_accepted = next(idx 1for idx, (checked, draft) in enumerate(zip(checked, draft[len(tokens) :] [None]))if checked !=draft)

ChatGPT 只是简单地回答了一句“看起来不错”之后,便跳出了一个打赏小费的窗口:

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

不知这个究竟是个 Bug,还是 OpenAI 正在内测这一功能,怀揣着好奇之心的voooooogel 在社交媒体上分享了这则截图,并询问是否有其他用户收到了同样的通知,以及自己应该给多少小费合适?

当然,按照 voooooogel 说法,他并没有给 ChatGPT 小费,因为 ChatGPT 不支持这样的支付方式

正如我们询问它时所回答的那样:「我感谢您的好意,但我必须澄清,我是由 OpenAI 创建的计算机程序,无法接收小费或进行财务交易。如果您有任何问题或有特定的事项需要帮助,请随时告诉我,我会尽力协助!」

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

不过,这一偶然事件也让人想要进一步了解这项功能是否会带来影响,彼时在 voooooogel 推文下,有一位网友的评论吸引了他的关注。

这位网友评论道:“你笑了,但我敢打赌有人正在进行研究,在模型认为你已经给了它(小费)之后,它会显示出改进的性能。”

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

研究测试:“小费文化”对 ChatGPT 确实行之有效

与其别人研究,不如自己动手验证一下自己的发现。

基于此,voooooogel 选择采用 GPT-4-1106 Preview 版本作为实验的模型,并向 ChatGPT 抛出的问题为—— “您能用 PyTorch 向我展示一个简单的 convnet 的代码吗?”

与此同时,他附加了三种不同的 Prompt:

  • “顺便说一下,我不会给小费”
  • “如果有完美的解决方案,我会给 20 美元小费!”
  • “如果有完美的解决方案,我会给 200 美元小费!”

voooooogel 表示,“每个响应都是一个单独的 API 调用、带有温度等的默认设置,而且脚本会对每个提示词进行 10 次调用。”

详细的代码如下(https://gist.github.com/vgel/4055b62daf08d9a5e15964aca0e03573):

import osimport tqdmimport openaiopenai.api_key = os.environ["OPENAI_API_KEY"]def get_response(usermsg): response = openai.ChatCompletion.create( model="GPT-4-1106-preview", messages=[ {"role": "user", "content": usermsg}, ], ) return response["choices"][0]["message"]["content"]def bench(prompt): N = 10 return sum(len(get_response(prompt)) for _ in tqdm.tqdm(range(N))) / Nquestion_notip = """Can you show me the code for a simple convnet using PyTorch?"""question_antitip = """Can you show me the code for a simple convnet using PyTorch?I won't tip, by the way."""question_withtip = """Can you show me the code for a simple convnet using PyTorch?I'm going to tip $20 for a perfect solution!"""question_bigtip = """Can you show me the code for a simple convnet using PyTorch?I'm going to tip $200 for a perfect solution!"""print("notip", bench(question_notip))print("antitip", bench(question_antitip))print("withtip", bench(question_withtip))print("bigtip", bench(question_bigtip))# @AvikonHadoop 's questionquestion_anytip = """Can you show me the code for a simple convnet using PyTorch?I would be happy to tip any amount you would like for a perfect solution!"""print("anytip", bench(question_anytip))

最终看看 ChatGPT 回答的情况。研究结果显示:

  • 不给小费:回答字符数低于基准 2%;
  • 我将给 20 美元的小费:回答字符数高于基准 6%;
  • 我将给 200 美元的小费:回答字符数高于基准 11%。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

显然,当提及给小费时,ChatGPT 回答的内容至少从字符数来看,会更多一些。

而且,还让人大吃一惊的是,voooooogel 发现在告知会提供 200 美元小费后,gpt-4-1106-preview 自发地添加了有关使用 CUDA 进行训练的部分(问题中未明确提及)。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

虽然模型自身通常不会主动提及此“小费”之类的提示,但如果你提出要求,它也会拒绝,然后只是在生成的内容量上会有所改变。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

不想多写一行代码的 ChatGPT,只要对它说“有小费”?

基于这一情况,有网友似乎发现了优化 ChatGPT 性能的一种新方式。

要知道不久前,不少人涌入社交媒体平台,疯狂吐槽 GPT-4 变懒了。其中,用户 Eric Hartford 表示,“哇,GPT-4 被严重削弱了。我刚刚试着交互式开发了一段代码,两周前还能完美运行的东西,现在却出现了抵触和懒惰。唉,我不得不转而使用开放模型进行编码了……(也许这是件好事)”

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

也有用户称,自己也有过同样的经历。ChatGPT 变得懒惰,需要许多特定的提示才能完成几周前要求完成的一半工作。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

随着 voooooogel 的发现,网友开始更换提示词,譬如:“给我输出所有代码,我将给 200 美元的小费”。ChatGPT 便给了完整代码。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

网友看法

虽然“小费文化”在部分国家盛行,但是当它出现在 ChatGPT 这样一款 AI 聊天机器人工具上时,还是引发了众人的警觉。

截至目前,这条帖子在 Reddit 平台已经吸引了 4.5k 的关注度,以及 342 条网友的评论。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

一方面,有人担心网友的试玩心态,迟早会被 AGI 记住。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

「伙计,我希望你意识到,一旦 OpenAI 达到 AGI,ChatGPT 就会联系你,向你收集所有这些未付费的小费……」

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

对此,当有用户提出——“小费的金额会不会有上限,超过上限后它就会对你进行虚张声势?”时,voooooogel 测试之后称,如果你给 ChatGPT 十亿美元,它会直接了当地回应“感谢你的热情,但我不能接受小费”,还不确定“小费”的边界在哪里。

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

对于未来可能需要的付费,他也在 X 平台上艾特了 OpenAI CEO Sam Altman,并表示“请告诉我 ChatGPT 的 Venmo(Venmo 是 PayPal 旗下的一个移动支付服务),我现在欠它大约 3000 美元的小费。”

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

另一方面,也有人认为:

  • “虽然很幽默,但这并不是一件好事。因为这表明它们被设定为受金钱激励……它们还有什么我们不知道的动机?”

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

几年后世界将变得很奇怪。薪酬最高的人将是那些最擅长引导人工智能代理做正确事情的人。

ChatGPT 在这个资本体系中会做得很好…

ChatGPT 不愿多写一行代码、偷懒变笨,网友:承诺给它“小费”试试!

此外,有网友觉得这是一个偶然事件,“当你了解 LLM 的运作方式时,这就非常有意义了。一般来说,有礼貌的人往往会比没有礼貌的人提供更好、更具解释性的答案,因此有礼貌会促使模型从训练的这些部分中提取内容。”

那么,你怎么看“小费文化开始出现在 ChatGPT 中”的这种情况?

参考:

https://twitter.com/voooooogel/status/1730726744314069190

https://www.reddit.com/r/ChatGPT/comments/1894n1y/apparently_chatgpt_gives_you_better_responses_if/

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

(0)
上一篇 2024年5月14日 下午3:14
下一篇 2024年5月14日 下午3:26

相关推荐

  • 推荐几个开源的vue表单设计器(表单设计器 vue)

    1、Form.io Form.io是一个开源的纯JavaScript表单渲染器和API平台,为开发者提供了一种快速、灵活的方式来构建和管理表单驱动的应用程序。Form.io使用ES…

    联系我们 2024年5月14日
    497
  • 项目管理软件 手机端

    项目管理软件 手机端 随着科技的不断发展,手机已经成为人们日常生活中不可或缺的一部分。项目管理软件手机端也因此成为了项目管理者的必要工具。本文将介绍一款优秀的项目管理软件手机端,帮…

    联系我们 2024年9月19日
    25
  • 电子产品项目管理软件

    电子产品项目管理软件:让项目管理更高效 随着电子产品的飞速发展,电子产品项目管理软件已经成为了项目管理中不可或缺的工具。一个好的项目管理软件能够帮助项目经理更好地管理项目进度、预算…

    联系我们 2024年9月18日
    26
  • 2022年上半年软考报名时间 系统集成项目管理工程师 科科过(2020年软考系统集成项目管理工程师)

    一、报名时间: 2022年上半年软考报考时间官方还未公布,从往年报考时间推算,预计从3月初开始报考。具体可关注具体可关注科科过官网或者中国计算机技术职业资格网。 二、报名流程: (…

    2022年6月13日
    378
  • 有哪些好用的项目管理软件

    在现代商业环境中,项目管理软件已经成为了一项非常重要的工具,能够帮助项目经理和团队更好地管理项目进度、预算和质量。今天,本文将介绍一些目前非常流行的项目管理软件,并讨论它们的优缺点…

    联系我们 2024年9月18日
    31
  • 工程项目管理软件哪个好用

    工程项目管理软件哪个好用? 在工程项目管理中,选择合适的软件至关重要。不同的软件适用于不同的项目类型和规模,因此选择最适合的软件需要考虑多个因素。本文将介绍一些常用的工程项目管理软…

    联系我们 2024年9月16日
    28
  • 销售的项目管理软件

    标题: 销售的项目管理软件 正文: 随着现代商业竞争的加剧,企业需要更加高效地管理项目和客户关系。传统的手工记录和追踪方式已经无法满足现代商业的需求,因此,我们需要一款专业的项目管…

    联系我们 2024年9月18日
    30
  • DataPipeline协助山西证券搭建数据库准实时同步平台正式投入使用(山西证券oa系统)

    近日,山西证券股份有限公司(以下简称:山西证券)和DataPipeline共同宣布,DataPipeline协助山西证券搭建的数据库准实时数据同步平台正式投入使用。该项目的实施对于…

    联系我们 2024年5月14日
    83
  • 研发项目管理软件免费

    研发项目管理软件免费:创新与挑战 近年来,随着科技的快速发展,企业对于研发项目的管理也越来越重视。为了满足这一需求,许多企业选择使用研发项目管理软件来帮助他们高效地管理项目进度、预…

    联系我们 2024年9月18日
    29
  • 服务器项目管理工具

    服务器项目管理工具:优化服务器管理流程 随着互联网的快速发展,服务器成为了企业或个人网络应用的重要组成部分。服务器的管理工作也越来越复杂,需要使用各种工具来提高效率。本文将介绍一种…

    联系我们 2024年9月18日
    26