凹头man的GPT5咋样
-
我看到有些人说在专业水平上确实展现出了博士及以上水平,想看看例子,目前没看到例子
我又没有能问出博士问题并且评价博士水平回答的水平( -
目前我想到的一个有点测试它自指能力的问题是,让它生成一个「prompt 增强器」,可以用于优化已有的 prompt
感觉它给我的回复不是很让我满意。。。。 -
还没用过gpt5,不过曾经问过deepseek一些研究生级别的数理问题,答案正确率和幻觉率都相当堪忧,把互联网上的答案组织起来倒是有一手。我会多关注一下身边人对gpt5数理能力的评价。
-
@lemma_ ds倒不奇怪,本来也只是说明了「小算力通过优化有可能取得原本大家以为无法达到的水平」而已,但是在逻辑推导方面确实很糟糕(应该说很多方面都很糟糕?)
-
@wumingshi 不清楚原因,觉得有可能是目前高级课程的训练语料不够,导致不足以堆出高正确率(?)